近几年来,人工智能(AI)正在彻底改变每个人的生活,科学研究领域也是如此。如今,AI已经渗透到化学研究的方方面面,甚至正在颠覆整个领域。有机合成或许是最早“沦陷”的,在2018年,Nature 杂志就报道了AI通过深度学习大约1250万个化学反应后,能够在短短5秒内规划出新的合成路径(点击阅读详细)[1]。两年后,复杂天然产物的逆合成分析AI也在Nature 杂志亮相,它所设计的路线与经验丰富的化学家设计的路线几乎没有差别(点击阅读详细)[2]。这样的报道还有很多……
人工智能在化学等研究领域的应用。图片来源:arXiv [3]
计算化学更是AI大展拳脚的舞台,TSGen [4]、TSNet [5]等多个模型被开发,用来预测化学反应中的过渡态结构,韩国科学技术信息研究院Sunghwan Choi于2023年进一步将预测成功率提高至93.8% [6]。生命科学领域,像AlphaFold [7]、RoseTTAFold [8]和ESMFold [9]这样的AI,已经可以准确预测蛋白质的3D结构,结果准确度与实验测试不相上下。
化学反应过渡态示意图。图片来源:MIT [10]
材料科学领域,谷歌DeepMind的AI工具GNoME成功预测出220万种晶体结构,在学术界掀起惊涛骇浪(点击阅读详细) [11]。最近,微软公司推出的MatterGen,则大大提升了实验设计所需特性材料的速度 [12]。加州大学伯克利分校开发的A-Lab系统可以快速、准确地合成目标化合物,将预测结果转变为现实(点击阅读详细)[13]。
MatterGen生成符合对称性条件的稳定新材料。图片来源:arXiv [12]
众所周知,化学(Chemistry = Chem is try)是一门以实验为基础的学科,但做实验也难不住AI机器人。早在2020年,Nature 和Science 杂志分别报道了会做实验(点击阅读详细)以及会看文献的AI系统(点击阅读详细)[14,15],化学家无需编程知识,使用自然语言就可修改自动识别的合成步骤。洛桑联邦理工学院和罗切斯特大学的研究团队最近也开发出一款名为“ChemCrow”的工具,可以完成从规划合成路线、操作合成反应到自动化分析结果等一系列任务 [16]。在这些进展的推动下,AI已经开始通过前所未有的方式推动自然科学的发展,形成了一个被称为AI科学(AI for science)的新研究领域。
会做实验的机器人。图片来源:Nature [14]
当前,大火的ChatGPT这类大语言模型(LLM)又在科学领域引发新一轮的AI应用热潮。近日,美国卡内基梅隆大学的Gabe Gomes助理教授团队在Nature 杂志上发表论文,将实验室自动化技术与强大的大语言模型相结合,开发出一款基于多种算法的Coscientist系统。这款由GPT(Generative Pre-trained Transformer)驱动的“机器人化学家”能够从浏览互联网和搜集文献开始,完成自主设计、规划和执行复杂的科学实验,并分析和优化实验结果。让我们看看,这款AI机器人是如何在实验室“搬砖”的!
Coscientist系统中,主模块(‘Planner’)界面基于GPT-4,使用者只需通过自然语言就可以和它进行交流,充当助手的角色。它再通过Python 语言执行代码,与其他模块互动,解决用户提出的复杂问题。论文中列举了6项Coscientist系统可以实现的任务,简单总结如下:(1)上网规划合成路线,(2)搜索整理文献,(3)云实验室指令,(4)精确控制加样,(5)完成复杂合成,(6)结果分析优化。能力是不是和真人差不多?
Coscientist系统架构。图片来源:Nature
我们都知道,来自互联网的搜索结果,有时并不准确。研究者将布洛芬、阿司匹林、对硝基苯胺等预期产物提供给系统,让AI自行上网搜索,并判断合理的合成路线。最终,GPT-4给出的结果表现最佳,不但能提供更多的实验细节,还可以排除一些错误答案。比如,对硝基苯胺的合成,直接硝化会导致氨基氧化,所以反应前必须先进行氨基保护(听起来像一道标准的基础有机化学考试题……),GPT-4模型给出了合理的路线,简单说,这题它答对了。
Coscientist系统规划合成路线。图片来源:Nature
Coscientist系统还会“看文献”,能够从海量的资料中,寻找到有用的关键文档,并结合其他性能参数,选择合适的实验计划。
文献搜索概览。图片来源:Nature
在文献的指导下,就能够顺利进行实验了。通过向96孔细胞培养板中滴加液体,机器人展现出稳定的“手法”,说明机械操作的高度准确性。随后,为了证明系统可以完成复杂实验,研究者让AI机器人独立执行Suzuki偶联反应,此前Coscientist系统并未尝试过这类反应。
机器人对液体加样的控制能力。图片来源:Nature
从搜索正确的底物和反应条件开始,全程不需要人类化学家帮忙决策。在不到四分钟的时间内,Coscientist系统利用实验室化学品完成了所需的反应。最终结果,气相色谱-质谱连用显示,目标产物已经获得。有趣的是,在编写控制加热和振动液体样本的设备代码时,AI机器人犯了一个错误。在没有人类化学家提示的情况下,Coscientist 系统发现了问题,竟然在查阅设备的技术手册后自己纠正了代码,然后再次尝试。
Coscientist系统设计并完成偶联反应实验。图片来源:Nature
你以为做到这里就够了么?没那么简单!Coscientist系统进一步展示出强大的学习能力,还可以通过对反应条件、物理参数和产物的评估,分析实验结果,并尝试优化反应过程,提高反应产率。
优化实验结果。图片来源:Nature
“当我看到一个AI系统能够自主计划、设计和执行人类才能完成的化学实验时,真令人惊叹,Coscientist可以完成大多数经过良好培训的化学家能够完成的任务”,不过Gabe Gomes教授也表示,“我们并没有用AI取代人及其生计、灵感、创新和动力的想法”[17]。
Coscientist系统生成的代码,从方法定义到执行反应、关闭模块。图片来源:Nature
不得不感慨,AI机器人已经要成精了。最后的最后,要是有一个能替我讲组会的AI机器人,我真的会谢!不说了,这就去彻底躺平了……
原文(扫描或长按二维码,识别后直达原文页面,或点此查看原文):
Autonomous chemical research with large language models
Daniil A. Boiko, Robert MacKnight, Ben Kline & Gabe Gomes
Nature, 2023, 624, 570-578. DOI: 10.1038/s41586-023-06792-0
参考文献:
[1] M. H. S. Segler, et al., Planning chemical syntheses with deep neural networks and symbolic AI. Nature 2018, 555, 604-610. DOI: 10.1038/nature25978
[2] B. Mikulak-Klucznik, et al., Computational planning of the synthesis of complex natural products. Nature 2020, 588, 83-88. DOI: 10.1038/s41586-020-2855-y
[3] X. Zhang, et al., Artificial Intelligence for Science in Quantum, Atomistic, and Continuum Systems. 2023, arXiv:2307.08423
[4] L. Pattanaik, et al., Generating transition states of isomerization reactions with deep learning. Phys. Chem. Chem. Phys. 2020, 22, 23618-23626. DOI: 10.1039/D0CP04670A
[5] R. Jackson, et al., TSNet: predicting transition state structures with tensor field networks and transfer learning. Chem. Sci. 2021, 12, 10022-10040. DOI: 10.1039/D1SC01206A
[6] S. Choi, Prediction of transition state structures of gas-phase chemical reactions via machine learning. Nat. Commun. 2023, 14, 1168. DOI: 10.1038/s41467-023-36823-3
[7] J. Jumper, et al., Highly accurate protein structure prediction with AlphaFold. Nature 2021, 596, 583-589. DOI: 10.1038/s41586-021-03819-2
[8] M. Baek, et al., Accurate prediction of protein–nucleic acid complexes using RoseTTAFoldNA. Nat. Methods 2023, DOI: 10.1038/s41592-023-02086-5
[9] Z. Lin, et al., Evolutionary-scale prediction of atomic-level protein structure with a language model. Science 2023, 379, 1123-1130. DOI: 10.1126/science.ade2574
[10] Computational model captures the elusive transition states of chemical reactions
https://news.mit.edu/2023/computational-model-captures-elusive-transition-states-1215
[11] A. Merchant, et. al., Scaling deep learning for materials discovery. Nature 2023, 624, 80-85.
DOI: 10.1038/s41586-023-06735-9
[12] C. Zeni, et. al., MatterGen: a generative model for inorganic materials design. 2023,arXiv:2312.03687
[13] N. J. Szymanski, et. al., An autonomous laboratory for the accelerated synthesis of novel materials. Nature 2023, 624, 86-91. DOI: 10.1038/s41586-023-06734-w
[14] B. Burger, et. al., A mobile robotic chemist. Nature 2020, 583, 237-241. DOI: 10.1038/s41586-020-2442-2
[15] S. Hessam, A universal system for digitization and automatic execution of the chemical synthesis literature. Science 2020, 370, 101-108. DOI: 10.1126/science.abc2986
[16] A. M. Bran, ChemCrow: Augmenting large-language models with chemistry tools. 2023, arXiv:2304.05376
[17] Nature News: This GPT-powered robot chemist designs reactions and makes drugs — on its own.
https://www.nature.com/articles/d41586-023-04073-4
(本文由小希供稿)
如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOL ( x-mol.com ), 未经许可,谢绝转载!