当前位置:
X-MOL 学术
›
Anal. Chem.
›
论文详情
Our official English website, www.x-mol.net, welcomes your
feedback! (Note: you will need to create a separate account there.)
ChloroDBPFinder:机器学习引导下通过非靶向 LC-HRMS 分析识别氯化消毒副产物
Analytical Chemistry ( IF 6.7 ) Pub Date : 2024-01-31 , DOI: 10.1021/acs.analchem.3c05124 Tingting Zhao 1 , Nicholas J P Wawryk 2 , Shipei Xing 1 , Brian Low 1 , Gigi Li 1 , Huaxu Yu 1 , Yukai Wang 1 , Qiming Shen 2 , Xing-Fang Li 2 , Tao Huan 1
Affiliation
高分辨率质谱 (HRMS) 是一种重要的分析工具,能够以公正的方式表征氯化消毒副产物 (Cl-DBP)。由于化学物质的多样性、复杂的背景信号以及 HRMS 固有的分析波动,传统的同位素模式 ( 37 Cl/ 35 Cl)、质量缺陷和直接分子式 (MF) 预测不足以准确识别不同的 Cl -真实环境样品中的 DBP。这项工作提出了一种基于机器学习识别含氯化学品的新策略。我们的分层机器学习框架有两个基于随机森林的模型:第一层是用于识别含 Cl 化学品的二元分类器,第二层是用于注释存在的 Cl 数量的多类分类器。该模型使用来自 PubChem 的约 140 万个独特的 MF 进行训练。通过对来自 NIST20 的 14,000 多个独特 MF 进行评估,该机器学习模型在识别含 Cl MF (Cl-MF) 方面实现了 93.3% 的准确率,在注释 Cl-MF 的 Cl 数量方面实现了 92.9% 的准确率。此外,训练后的模型被集成到 ChloroDBPFinder(一个独立的 R 软件包)中,用于简化 LC-HRMS 数据的处理并注释已知和未知的含氯化合物。我们的 ChloroDBPFinder 对与自来水中阿斯巴甜氯化相关的现有 Cl-DBP 数据集进行了测试,有效提取了 159 个含 Cl-DBP 特征,并通过分子网络初步注释了 10 个 Cl-DBP 的结构。在氯化腐殖质的另一项应用中,ChloroDBPFinder 提取了 79 种高质量的 Cl-DBP,并初步注释了 6 种化合物。 总之,我们提出的机器学习策略和开发的 ChloroDBPFinder 提供了一种先进的解决方案,可以在水样的非靶向分析中识别含氯化合物。它可以在 GitHub (https://github.com/HuanLab/ChloroDBPFinder) 上免费获得。
"点击查看英文标题和摘要"