当前位置: X-MOL 学术J. Hazard. Mater. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
机器学习辅助数据过滤和 QSAR 模型预测大鼠和小鼠的化学急性毒性
Journal of Hazardous Materials ( IF 12.2 ) Pub Date : 2023-04-01 , DOI: 10.1016/j.jhazmat.2023.131344
Tao Bo 1 , Yaohui Lin 2 , Jinglong Han 3 , Zhineng Hao 4 , Jingfu Liu 1
Affiliation  

机器学习 (ML) 方法为基于大型毒性数据集构建用于预测化学品毒性的定量构效关系 (QSAR) 模型提供了新的机会,但由于化学品的数据集质量差,它们在模型鲁棒性方面受到限制某些结构。为了解决这个问题并提高模型的稳健性,我们建立了一个关于大鼠口服急性毒性的数千种化学品的大型数据集,然后使用 ML 过滤有利于回归模型 (CFRM) 的化学品。与不利于回归模型的化学品 (CNRM) 相比,CFRM 占原始数据集中化学品的 67%,并且在 2–4 log 10 中具有更高的结构相似性和更小的毒性分布(毫克/千克)。已建立的 CFRM 回归模型的性能得到极大改善,均方根偏差 (RMSE) 在 0.45–0.48 log 10 (mg/kg) 范围内。使用原始数据集中的所有化学物质为 CNRM 建立分类模型,受试者工作特征面积 (AUROC) 达到 0.75–0.76。所提出的策略成功应用于小鼠口服急性数据集,产生的 RMSE 和 AUROC 分别在 0.36–0.38 log 10 (mg/kg) 和 0.79 范围内。





"点击查看英文标题和摘要"

更新日期:2023-04-06
down
wechat
bug