近日,汕头大学理学院化学系陈广慧教授(点击查看介绍)课题组通过机器学习的方法对金属-有机框架材料(Metal-Organic Frameworks, MOFs)的多尺度理论计算筛选,通过对比不同的机器学习模型发现,基于梯度提升树实现的集成算法XGBoost(eXtreme Gradient Boosting)模型在仅仅使用结构描述符的情况下,可以很好地预测MOFs对Xe/Kr的吸附分离效果。该工作近日发表于ACS Omega 杂志,并被推选为封面文章(图1)。
图1. ACS Omega 封面
氙气和氪气等稀有气体在商业照明、医用成像、麻醉、神经保护、电子工业、电光源工业、气体激光器、等离子流体等研究领域具有广泛应用。大气中Xe和Kr含量极少,传统的空分设备的副产品中提取Xe和Kr是一个高成本高耗能的工程。Xe、Kr主要存在于乏燃料(UNF)中,Xe:Kr为2:8。在温和条件下从UNF中分离Xe和Kr,开发高捕获能力和氙氪分离选择性的多孔材料成为研究热点与难点。
作者通过采用机器学习方法对天津工业大学仲崇立教授课题组采用材料基因组学 (MGI) 自组装软件纳米材料多孔高通量构筑软件 (MGPNM) 构建的G-MOFs数据库进行了高通量筛选,为实验工作者提供了一些潜在的高吸附选择性的MOF材料。
通过训练集:测试集=3:7划分数据,使用五折交叉验证调整超参,进行多种机器学习模型测试,其预测结果汇总于表1所示。分析发现XGBoost模型仅使用结构描述符就达到很好的预测MOFs对Xe/kr的吸附分离性能效果,其模型表现如图2所示。此外,还发现了top 10 MOFs 具有非常高的Xe/Kr吸附选择性, Sxe/kr范围为19~27。
表1. 不同机器学习模型对MOF预测Xe/Kr吸附分离的评估
图2 XGBR对Xe/Kr选择性的吸附表现
如图3所示,作者采用XGBoost特征工程发现密度(ρ)、孔体积(Vol)、孔隙率(ψ)和最小孔腔直径(PLD)是影响材料对Xe/Kr吸附分离的关键因素:
图3 XGBR模型特征的影响情况
为了验证该模型对其他气体吸附分离的预测效果,作者依旧采用XGBoost模型研究CO2和CH4体系的吸附分离,发现该模型具有很好的泛化能力,结果如图4所示。这是采用XGBoost机器学习模型发现MOF吸附剂的首次报道。
图4 XGBR对CO2/CH4选择性的吸附表现
该工作具体思路如图5所示。使用机器学习中的XGBoost模型和几何特征描述符预测材料对Xe/Kr的吸附分离性能,方法方便快捷、结果可靠,可以大大降低计算成本,提高实验成功率。
图5 XGBoost计算思路
该工作作为ACS Omega 封面论文发表,汕头大学化学系硕士研究生梁亨为论文的第一作者;汕头职业技术学院自然科学系运筹学与控制论专业讲师姜昆为第二作者;北京化工大学化学工程学院博士研究生闫同安为第三作者;汕头大学化学系陈广慧教授为通讯作者。
原文(扫描或长按二维码,识别后直达原文页面,或点此查看原文):
XGBoost: An Optimal Machine Learning Model with Just Structural Features to Discover MOF Adsorbents of Xe/Kr
Heng Liang, Kun Jiang, Tong-an Yan and Guang-hui Chen*
ACS Omega, 2021, 6, 9066–9076, DOI: 10.1021/acsomega.1c00100
通讯作者简介
陈广慧教授2004年在吉林大学理论化学研究所博士毕业后,先后赴美国、香港留学,2008年加入汕头大学理学院化学系教师团队,目前致力于MOF材料和抗癌靶向药高通量筛选和设计研究,在Angew.、ACS Appl. Mater. Interfaces.、J. Phys. Chem.、Phys. Chem. Chem. Phys.、J. Chem. Phys.等学术期刊发表SCI论文六十余篇。
https://www.x-mol.com/university/faculty/23846
https://sci.stu.edu.cn/info/1135/2401.htm
https://pubs.acs.org/action/showCitFormats?doi=10.1021/acsomega.1c00100&ref=pdf
如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOL ( x-mol.com ), 未经许可,谢绝转载!