IT技术的进步,或许真的能改变一切,包括化学合成。有一款神奇的软件系统Chematica,包含上百万种已知分子和化学反应,听起来像是词典?NO NO NO,它还包含了信息间的联系和比对功能,就像化学世界的互联网一种。虽然很多有机合成化学家质疑Chematica的能力,但来自韩国蔚山国立科学技术研究所(UNIST)的Bartosz Grzybowski教授坚信这款软件在未来将是设计合成路线必不可少的工具,它将开启一个化学合成的新纪元。
建议WIFI环境下观看视频
图片来源:ChemistryWorld
英国布里斯托尔大学(University of Bristol)的有机合成资深学者Varinder Aggarwal说:“计算机真的能判断出哪条路线管用?哪条路线高效?如果是真的,那将是个了不起的突破。”
从简单的原料开始合成一个复杂化合物是非常困难的,例如某个重磅药或一段DNA序列。研究者(俗称搬砖工)必须拼命回忆脑子里的反应或机理,再查阅大量文献,动用逆合成分析,写出一个有可能管用的路线。至于产率、成本、原料易得性等都来不及考虑太多,路线打通了再说(这段写的我都是泪~~)。
在这种工作模式下,研究者的记忆力对设计合成路线显得尤为重要。不过知识一旦生疏就会遗忘,一两年不用某个反应可能就忘了。
化学定向越野
在路线打不通的沮丧中,Chematica横空出世。过去15年间,Grzybowski和同事手动录入了1000万个分子和反应,并将它们彼此链接,成就了一款非常复杂的软件。Chematica看起来很像航线图,有中转,有枢纽。
这种网状布局使Chematica能够快速找到合理的路径,比从数据库或列表中搜索要节省时间。这就好比坐地铁时,地铁线路图要比地铁站名A-Z列表更好用一样。
Chematica给出的成本最优化的伐地那非合成路线,用到的反应跨越半个世纪。图片来源:Wiley
化学家只需把目标分子输入Chematica就能得到基于成本、底物易得性、步骤数筛选出的反应路线,这一切仅仅需要数秒钟。每一步反应及产物都会基于两个方程进行评分:反应评分函数和化合物评分函数。如果涉及的化学反应很难操作,反应评分就会变低;如果涉及的化合物结构比较简单或常见,化合物评分就会较高,反应路线也就显得更合理。这些评分函数使Chematica能够评估每条路线,将那些明显不可行的去掉。
步步为营
有人认为Chematica的算法和下棋程序类似,不过Grzybowski觉得这个类比不够准确。他认为下棋时,由于落子不悔的规则,你只需瞻前,无需顾后。合成路线设计则复杂得多。
领导“Dial-a-molecule”网站的Richard Whitby认为准确、高质量的数据是关键的基础。他举例说,逆合成分析工具ARChem和SynChem效果不是太好,因为它们的数据来源是Reaxys。Whitby称,“这些数据充满错误和缺陷,ARChem和SynChem以此为基础,给出的建议就会很愚蠢。”(小编:谨代表Whitby个人观点)
让软件接受并运用化学反应规则也非常重要。这里不得不提有机合成大师E J Corey在20世纪70年代开发的LHASA(Logic and Heuristics Applied to Synthetic Analysis),该软件中写入了很多化学规则。但很可惜Corey组只录入了300个规则,这显然不够。
继续前进
Grzybowski用自动化平台开发了另一款软件:Syntaurus。过去十年间,Grzybowski团队已经手动编码了20000条化学规则。这些规则涉及不能共存的基团、保护基策略、甚至键长键角的细微差别等。
如果不能依靠机器学习,这将是个大麻烦。化学规则的数据量可能比《大英百科全书》还多。
Syntaurus只用了几个小时就找出了epicolactone最佳合成路线
来源:ChemistryWorld
最近的研究中,Grzybowski证明了Syntaurus的潜力。该程序成功给出了epicolactone的全合成路线,该物质2012年提取自真菌中,是结构复杂的天然产物。合成化学家花了将近三年时间设计了一条生物合成路线(点击阅读相关),而Syntaurus只花了几个小时。
回应质疑
对Chematica和Syntaurus的质疑声音当然没有消失。Aggarwal说,“下一步的打算应该是让计算机合成相当复杂的分子,在实验室中验证。如果复杂分子也能成功,那我必须承认这些软件是有用的。”
Whitby则乐观得多,“只要你真的去用Chematica,就很可能收获有意义的结果,这一点我们非常确信。”
不过Grzybowski则宣布Syntaurus接受了Aggarwal的挑战(复杂分子),并且已经取得成功。尽管他本人对该项目守口如瓶,他的团队还是透露Syntaurus可以给出一种重磅药的最短、最便宜的合成路线,实验室已经验证过。
氘评:
Syntaurus的真正价值还有待进一步检验。但利用计算机服务化学研究、推动化学进展是大势所趋。化学知识进一步积累,计算机对化学知识检索、整理能力的进一步提升,未来真的有可能实现“天下无不可合成之分子”。
参考文献:
1. M. Kowalik et al., Angew. Chem. Int. Ed., 2012, 51, 7928 (DOI: 10.1002/anie.201202209)
2. E. J. Corey et al., JACS, 1972, 94, 421 (DOI: 10.1021/ja00757a020)
3. S. Szymkuć et al., Angew. Chem. Int. Ed., 2016, 55, 5904 (DOI: 10.1002/anie.201506101)
编译自:
(本文由氘氘斋供稿)
如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOL ( x-mol.com ), 未经许可,谢绝转载!