当前位置: X-MOL 学术Comput. Intell. Neurosci. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
基于机器学习的乳腺癌分类预测
Computational Intelligence and Neuroscience Pub Date : 2023-1-11 , DOI: 10.1155/2023/6530719
Hua Chen 1 , Nan Wang 1 , Xueping Du 1 , Kehui Mei 1 , Yuan Zhou 1 , Guangxing Cai 1
Affiliation  

乳腺癌是世界上最常见和致命的癌症类型。本文基于XGBoost、随机森林、逻辑回归、K近邻等机器学习算法,建立不同的模型对乳腺癌进行分类和预测,为乳腺癌的早期诊断提供参考。Recall表示医学诊断中检出恶性癌细胞的概率,对乳腺癌的分类具有重要意义,因此本文以recall为首要评价指标,综合考虑precision、accuracy、F1-score评价指标,对各个模型的预测效果进行评价和比较。为了消除不同维度概念对模型效果的影响,对数据进行了标准化处理。为了找到最优子集,提高模型的准确率,通过皮尔逊相关检验筛选出15个特征作为模型的输入。K近邻模型采用交叉验证的方法选择最优的k以召回率作为评价指标的价值。针对正负样本不平衡的问题,采用分层抽样的方法,按照不同的类别按比例抽取训练集和测试集。实验结果表明,在不同的数据集划分(8:2和7:3)下,同一模型的预测效果会有不同的变化。对比分析表明,本文建立的XGBoost模型(将训练集和测试集按8:2划分)效果较好,其召回率、查准率、准确率、F 1-score分别为1.00、0.960、0.974、分别为 0.980。



"点击查看英文标题和摘要"

更新日期:2023-01-11
down
wechat
bug