金属卤素钙钛矿是近年来被发现的一类新型半导体材料。因为光电性能出众,在光伏、激光、光传感器、热电等领域被广泛研究。以金属卤素钙钛矿为活性层的太阳能电池光电转化效率目前已突破25%。就如同其他材料一样,这种材料的晶体结构对其性质起到了决定性作用:比如,改变钙钛矿材料当中的金属-卤素之间的化学键键长、键角和连接形式会改变其载流子迁移率和禁带宽度。在目前的材料领域,最为准确且直接的晶体结构分析方法是“单晶X射线衍射分析”。因此,获得钙钛矿及其衍生物的单晶可以直接确定其材料的结构并且帮助理解其结构-性能关系而最终获得所需要的性能。而如何快速发现新的钙钛矿材料单晶并且加以表征成为钙钛矿领域除材料稳定性研究之外的另一大挑战。在自动化和人工智能快速发展的今天,我们可不可以利用让机器人来代替人工把博士生和博士后从繁琐的、重复的工作中解放出来?面对复杂的实验设计,我们可不可以让人工智能来代替我们思考而优化实验并且找寻规律?再进一步来说,在数据化的时代,我们如何使用数据来加速科研进步?
为了回答以上问题,美国劳伦斯国家实验室的李智博士做了初步的研究并且在钙钛矿单晶合成上做了概念性验证。这项公开研究工作在Emory Chan研究员的指导下完成,受美国国防先进研究计划署资助(DARPA),合作单位包括Fordham University 的Joshua Schrier 博士、Haverford College 的Alexander Norquist 博士和 Mansoor Ani Najeeb 博士、Purdue University的Matthias Zeller 博士。
下图描述了实验的框架,不同于一般科研流程,这项工作以数据为中心、实验可重复性为目标:每一项操作都有严格的标准,所有可被记录的实验数据(包括实验条件及其操作细节、单晶形成与否、反应环境温湿度等等)都被记录在了自主研发的软件ESCALATE上。钙钛矿合成主要由NIMBUS自动加液机器人完成。实验结果(结晶与否、材料是否为钙钛矿衍生物)被ESCALATE自动获取并加以整理和准备,最终进入机器学习模型,进行分析和研究。
图1. 实验流程与结构图
在这项工作中李智和他的合作者们研发了一种基于“反向温度结晶”的自动化高通量钙钛矿单晶合成方法RAPID。作为初期研究,他们筛选了不同实验条件的8172个反应,实验对象包括了45种钙钛矿有机铵盐阳离子。整个溶液调配过程和反应过程无需人为监护,总共耗时约400小时,相比之下,如果人工来完成这项实验(假设每天做10个反应)大致需要超过两年的时间(假设周末不工作)。由此看来机器人及其配套高通量反应流程大大提高了实验效率并且把科研人员从繁琐的操作中解放了出来。
图2. 被筛选作为金属卤素钙钛矿阳离子的有机铵盐
在高通量反应条件筛选过程中,他们发现在这45个有机铵盐里,有19个铵盐可以通过反向温度结晶法与碘化铅形成金属卤素钙钛矿衍生物单晶。在这项工作之前只有4个机铵盐被发现可以通过反向温度法合成钙钛矿材料。可合成集合被扩大了五倍。这也体现了高通量合成较人工反复试验-失败-试验方法的优势性。而且高通量数据更具有可重复性,能更加全面的得出反应条件和实验结果之间的关系。虽然在此阶段无刻意选取未被报道的有机铵盐,但是在筛选过程中作者还是以单晶的形式发现了两种新的钙钛矿材料:(C2H7N2Pb)I3 和(C7H16N)2PbI4 。其中前者为一维钙钛矿衍生物,后者为二维钙钛矿衍生物。而且这两种材料展示了良好的热/湿度稳定性和独特的荧光性质。
图3. a) (C2H7N2Pb)I3 与b) (C7H16N)2PbI4 的单晶结构
除了以上化学和材料发现外,作者通过统计分析高通量实验数据确定了实验可行性空间和结晶空间。并且计算出了不同有机铵盐合成钙钛矿衍生物单晶的成功概率。没有高通量实验,这样的统计数据是无法获得的。所以自动化高通量实验又一次体现了较传统手工实验的优势性。在已有实验数据的基础上,作者使用了支持向量机器、随机森林、神经网络等机器学习算法对实验条件和结晶结果进行了模拟。模拟结果显示采用自设内核的支持向量机器模型(PUFK-SVM)对实验结果预测准确度高达87%。此外他们还发现以单一变量优化为主的控制变量法所得到的预测准确度要远远低于基于多维度多变量的机器学习算法。由此看来面对复杂的实验设计,人工智能模型较传统设计方法有着一定的优势。
图4. a) PUFK-SVM模型对不同铵盐体系的学习曲线 b) 不同模型对乙基铵钙钛矿合成的学习曲线
图5. 数据可视化和交互分析界面
最后实验室团队提出了“论文3.0”的概念。此项工作大部分的相关数据和Python代码都被上传到了GitHub,以供读者下载调试。此外为了方便不熟悉编程的读者,团队还在Mybinder上创建了Python Jupyter notebook,读者可以通过简单的点击和下拉框操作对数据进行可视化分析。之所以称为学术论文3.0 的雏形是因为相较1.0(纸质)和2.0(电子版PDF),这篇工作提供了完全公开的数据并且提供了交互式分析方法。以开放数据为核心,通过数据加速科学发现正是这篇工作的目的。
这一工作发表在Chemistry of Materials 上。
原文(扫描或长按二维码,识别后直达原文页面,或点此查看原文):
Robot-Accelerated Perovskite Investigation and Discovery
Zhi Li, Mansoor Ani Najeeb, Liana Alves, Alyssa Z. Sherman, Venkateswaran Shekar, Peter Cruz Parrilla, Ian M. Pendleton, Wesley Wang, Philip W. Nega, Matthias Zeller, Joshua Schrier, Alexander J. Norquist, Emory M. Chan
Chem. Mater., 2020, 32, 13, 5650–5663, DOI: 10.1021/acs.chemmater.0c01153
数据和代码链接:
https://github.com/darkreactions/rapid
数据可视化和交互分析界面链接:
https://mybinder.org/v2/gh/darkreactions/rapid/master?filepath=RAPID.ipynb
如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOL ( x-mol.com ), 未经许可,谢绝转载!