英文原题:Leveraging Machine Learning Potentials for In-situ Searching of Active sites in Heterogeneous Catalysis
通讯作者:谢闻博,上海科技大学;胡培君,上海科技大学 作者:Xiran Cheng (程夕冉), Chenyu Wu (吴晨宇), Jiayan Xu (许嘉琰), Yulan Han (韩玉兰), Wenbo Xie (谢闻博), P. Hu (胡培君)
研究背景
图1. 机器学习势函数的构建及其在催化研究中的应用
多相催化在现代化学工业中扮演着重要角色,是生产燃料、塑料、药品和其他化学品的基础。越来越多的研究表明,催化过程中真正的活性位点往往是在原位条件下形成的,然而,由于当前实验表征技术难以在高温高压的反应条件下进行精确观测,催化过程中活性位点的识别仍然存在较大挑战。近年来,量化计算在理解催化剂活性位点方面取得了显著进展,但理论与实验之间的复杂性差异仍然存在。这种差异主要源于催化体系的动态特性以及催化剂表面在反应条件下可能发生的结构重构。密度泛函理论(DFT)是研究原子尺度催化机理的常用工具,尽管DFT在计算效率和准确性方面取得了良好的平衡,但在处理大体系或长时间动力学模拟时,仍然受制于计算资源。为应对这一挑战,机器学习在原子尺度模拟领域的最新进展提供了一种具有前景的解决方案。其中机器学习势函数(MLPs)在多相催化中展示出了巨大的潜力。MLPs的构建基于利用神经网络拟合原子的结构信息与高精度第一性原理计算数据(例如能量和力)之间的关系,为目标催化体系的能量和力提供高效且准确的预测方法。与DFT相比,势函数的计算速度大大提高。这种效率的提升可以实现对催化剂结构的全局优化和搜索,进而能够追踪催化剂稳定表面结构的演变。通过将找到的原位条件下的最优结构与DFT计算、AIMD和微观动力学方法相结合,可以更准确地定位其活性位点并评估催化剂性能。该方法为探索催化体系的结构与功能关系提供了强大的工具。
文章亮点
近日,上海科技大学胡培君教授和谢闻博助理研究员团队在 Precision Chemistry 上发表了关于利用机器学习势函数探究原位条件下多相催化体系的活性位点的综述文章(Review)。该综述系统性总结了近年来机器学习在多相催化领域的技术突破,从原子间势函数的基本原理、机器学习模型的发展历程到势函数的训练策略进行了深入阐述。同时,文章详细介绍了用于复杂催化剂结构搜索的全局优化方法,并通过多个典型的多相催化反应体系展示了机器学习势函数在定位反应活性位点方面的巨大潜力。最后,综述还分析了当前机器学习势函数方法所面临的挑战及未来值得关注的发展方向。 综述文章回顾了机器学习势函数的发展历程,系统地介绍了原子间势函数的基础原理和训练方法,并着重分析了BPNN、Deep Potential以及EANN等几种常用的机器学习势函数模型。此外,文章还介绍了基于主动学习的势函数训练策略,通过从现有数据和新生成的数据中不断学习,使机器学习势函数针对特定催化体系进行优化迭代,从而达到更高的预测精度。
图2. 势函数的神经网络架构
图3. SSW-NN方法和LASP软件架构
高精度机器学习势函数的出现,使全局优化算法能够更高效地应用于复杂势能面的全局最小值搜索,找到体系的最稳定结构。对于反应条件下发生的复杂催化反应,可以通过设定初始结构范围,采用并行全局优化计算方法,对不同原子数的稳定结构进行筛选,最终基于热力学稳定性判别最优结构。文章详细介绍了相关的全局优化算法及其在结构搜索中的应用,包括基于全局势能面探索的随机表面行走(SSW)方法、遗传算法(GAs)、巨正则遗传算法(GCGA)以及巨正则蒙特卡洛(GCMC)方法。在确定稳定结构后,还可以结合DFT、微观动力学模型等方法,对活性位点进行进一步甄别和优化。文章通过多个经典的多相催化反应体系作为例子,展示了整套方法论的实际应用,包括Pt表面的氧化反应、ZnCrO催化的合成气反应、FeC催化的费托合成反应等。这些案例验证了该方法在寻找原位条件下活性位点的有效性。
图4. (a) 基于势函数的GCMC方法生成的Pt催化剂表面结构;(b)和(c) Cr4.2%OV0.33 和 Cr4.2%OV0.67 的ZnO的吸附和解离能量变化
总结/展望
本文综述了机器学习势函数的基本原理,包括理论基础、训练策略、实施方法,以及它们在预测催化剂结构中的应用,特别聚焦在多相催化领域中寻找反应活性位点的最新研究进展。机器学习势函数的应用显著提升了我们对催化剂表面结构在反应条件下的变化、活性位点的理解,显示了该方法在解构复杂反应体系的巨大潜力。 然而该领域仍然存在着许多困难和挑战,克服这些问题将是机器学习势函数在多相催化未来的主要发展趋势。我们认为当前的主要一个重要挑战是数据集。首先是成本问题,对于多元素复杂催化体系,获取足够多具代表性的数据点的计算成本依然高昂,然后是数据利用问题,现在多相催化领域缺乏统一计算精度的公共数据库支持,数据集的可复用性较差,目前大多还停留在针对单个体系建立特定的MLP,缺乏通用性解决方案。 另外值得一提的是,虽然本文主要是介绍通过理论数据训练模型,但在在催化领域,机器学习还可以通过纯实验数据进行模型训练。每种方法都有其特有的挑战:实验数据更真实,但是数据点有限,且多集中于成功的实验案例;而计算数据虽然能够提供更广泛和丰富的化学空间信息,但存在过度简化的问题。随着新模型、数据库和训练策略的迅速发展,我们可以预见一个混合框架的出现,其中机器学习势函数首先作为预训练模型,然后通过实验数据进行微调,以加速发现具有高活性和选择性的新型催化剂。
通讯作者信息
谢闻博 助理研究员
谢闻博,上海科技大学物质学院助理研究员,本科毕业于美国佐治亚大学,于英国贝尔法斯特女王大学胡培君教授课题组获得博士学位,2023年加入上海科技大学。主要研究方向为微观动力学模拟和机器学习势函数在多相催化中的应用。第一作者及共同一作发表 SCI 论文 7 篇,包括:Acc. Chem. Res.、JACS Au、ACS Catal.、 Energy Environ. Sci.、J. Catal.等。
胡培君 教授
胡培君,上海科技大学物质学院教授,博士生导师,爱尔兰皇家院士, 国际知名理论催化专家。1982 年毕业于华东理工大学,1993 年获英国剑桥大学博士学位,1995 年加入英国贝尔法斯特女王大学,2004 年升任教授,2023 年 2 月全职加入上海科技大学物质学院。主要研究领域包括物理化学、理论与计算催化、人工智能在催化与材料中的运用等。为多相催化反应微观基础理论的发展做出了重大贡献,是国际理论催化领域具有重要影响的学术带头人之一。在国际重要学术刊物上发表研究文章 300 多 篇,其中包括 11 篇 Nature 及子刊,21 篇 J. Am. Chem. Soc.,11 篇 Angew. Chem. Int. Ed.,4 篇 Phys. Rev. Lett.,H 因子为 92。
扫描二维码阅读英文原文,或点此查看原文 Precis. Chem. 2024 Publication Date: September 11, 2024 https://doi.org/10.1021/prechem.4c00051 © 2024 The Authors. Co-published by University of Science and Technology of China and American Chemical Society 关于 Precision Chemistry 点击“阅读原文”
如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOL ( x-mol.com ), 未经许可,谢绝转载!