当前位置 : X-MOL首页行业资讯 › Chematica:化学合成的“骇客帝国”?

Chematica:化学合成的“骇客帝国”?

IT技术的进步,或许真的能改变一切,包括化学合成。有一款神奇的软件系统Chematica,包含上百万种已知分子和化学反应,听起来像是词典?NO NO NO,它还包含了信息间的联系和比对功能,就像化学世界的互联网一种。虽然很多有机合成化学家质疑Chematica的能力,但来自韩国蔚山国立科学技术研究所(UNIST)Bartosz Grzybowski教授坚信这款软件在未来将是设计合成路线必不可少的工具,它将开启一个化学合成的新纪元。


建议WIFI环境下观看视频


图片来源:ChemistryWorld


英国布里斯托尔大学(University of Bristol)的有机合成资深学者Varinder Aggarwal说:“计算机真的能判断出哪条路线管用?哪条路线高效?如果是真的,那将是个了不起的突破。”


从简单的原料开始合成一个复杂化合物是非常困难的,例如某个重磅药或一段DNA序列。研究者(俗称搬砖工)必须拼命回忆脑子里的反应或机理,再查阅大量文献,动用逆合成分析,写出一个有可能管用的路线。至于产率、成本、原料易得性等都来不及考虑太多,路线打通了再说(这段写的我都是泪~~)。


在这种工作模式下,研究者的记忆力对设计合成路线显得尤为重要。不过知识一旦生疏就会遗忘,一两年不用某个反应可能就忘了。


化学定向越野


在路线打不通的沮丧中,Chematica横空出世。过去15年间,Grzybowski和同事手动录入了1000万个分子和反应,并将它们彼此链接,成就了一款非常复杂的软件。Chematica看起来很像航线图,有中转,有枢纽。


这种网状布局使Chematica能够快速找到合理的路径,比从数据库或列表中搜索要节省时间。这就好比坐地铁时,地铁线路图要比地铁站名A-Z列表更好用一样。

Chematica给出的成本最优化的伐地那非合成路线,用到的反应跨越半个世纪。图片来源:Wiley


化学家只需把目标分子输入Chematica就能得到基于成本、底物易得性、步骤数筛选出的反应路线,这一切仅仅需要数秒钟。每一步反应及产物都会基于两个方程进行评分:反应评分函数化合物评分函数。如果涉及的化学反应很难操作,反应评分就会变低;如果涉及的化合物结构比较简单或常见,化合物评分就会较高,反应路线也就显得更合理。这些评分函数使Chematica能够评估每条路线,将那些明显不可行的去掉。


步步为营


有人认为Chematica的算法和下棋程序类似,不过Grzybowski觉得这个类比不够准确。他认为下棋时,由于落子不悔的规则,你只需瞻前,无需顾后。合成路线设计则复杂得多。


领导“Dial-a-molecule”网站的Richard Whitby认为准确、高质量的数据是关键的基础。他举例说,逆合成分析工具ARChem和SynChem效果不是太好,因为它们的数据来源是Reaxys。Whitby称,“这些数据充满错误和缺陷,ARChem和SynChem以此为基础,给出的建议就会很愚蠢。”(小编:谨代表Whitby个人观点)


让软件接受并运用化学反应规则也非常重要。这里不得不提有机合成大师E J Corey在20世纪70年代开发的LHASA(Logic and Heuristics Applied to Synthetic Analysis),该软件中写入了很多化学规则。但很可惜Corey组只录入了300个规则,这显然不够。


继续前进


Grzybowski用自动化平台开发了另一款软件:Syntaurus。过去十年间,Grzybowski团队已经手动编码了20000条化学规则。这些规则涉及不能共存的基团、保护基策略、甚至键长键角的细微差别等。

如果不能依靠机器学习,这将是个大麻烦。化学规则的数据量可能比《大英百科全书》还多。

Syntaurus只用了几个小时就找出了epicolactone最佳合成路线

来源:ChemistryWorld


最近的研究中,Grzybowski证明了Syntaurus的潜力。该程序成功给出了epicolactone的全合成路线,该物质2012年提取自真菌中,是结构复杂的天然产物。合成化学家花了将近三年时间设计了一条生物合成路线(点击阅读相关),而Syntaurus只花了几个小时。


回应质疑


对Chematica和Syntaurus的质疑声音当然没有消失。Aggarwal说,“下一步的打算应该是让计算机合成相当复杂的分子,在实验室中验证。如果复杂分子也能成功,那我必须承认这些软件是有用的。”


Whitby则乐观得多,“只要你真的去用Chematica,就很可能收获有意义的结果,这一点我们非常确信。”


不过Grzybowski则宣布Syntaurus接受了Aggarwal的挑战(复杂分子),并且已经取得成功。尽管他本人对该项目守口如瓶,他的团队还是透露Syntaurus可以给出一种重磅药的最短、最便宜的合成路线,实验室已经验证过。


氘评:

Syntaurus的真正价值还有待进一步检验。但利用计算机服务化学研究、推动化学进展是大势所趋。化学知识进一步积累,计算机对化学知识检索、整理能力的进一步提升,未来真的有可能实现“天下无不可合成之分子”。



参考文献:

1. M. Kowalik et al., Angew. Chem. Int. Ed., 2012, 51, 7928 (DOI: 10.1002/anie.201202209)

2. E. J. Corey et al., JACS, 1972, 94, 421 (DOI: 10.1021/ja00757a020)

3. S. Szymkuć et al., Angew. Chem. Int. Ed., 2016, 55, 5904 (DOI: 10.1002/anie.201506101)


编译自:

http://www.rsc.org/chemistryworld/2016/08/chematica-syntaurus-revolutionary-computer-program-synthetic-pathway-software


(本文由氘氘斋供稿)


问题讨论

  • 目前来看计算机辅助合成路线设计仍然只是“辅助”,计算机和化学家的头脑相比,还缺乏什么呢?


下方留言评论,参加讨论



如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOLx-mol.com ), 未经许可,谢绝转载!

阿拉丁
经济学SSCI期刊
英语语言编辑翻译加编辑新
加速出版服务新
1212购书送好礼
Springer旗下全新催化方向高质新刊
动物学生物学
系统生物学合成生物学
专注于基础生命科学与临床研究的交叉领域
传播分子、细胞和发育生物学领域的重大发现
聚焦分子细胞和生物体生物学
图书出版流程
快速找到合适的投稿机会
热点论文一站获取
定位全球科研英才
中国图象图形学学会合作刊
上海交大
日本
北大
岭南大学
深圳湾
南开大学
清华大学
新加坡
加州大学
宁波
ACS材料视界
down
wechat
bug