新疆医科大学学报

2019, (04) 551-554

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于不平衡分类的乳腺肿瘤预后预测方法的研究

王哲;杨日东;周毅;张学良;王凯;

摘要(Abstract):

目的 探讨不平衡分类的乳腺癌数据集基于机器学习方法预测预后的生存状态。方法 乳腺肿瘤预后的生存状态数据为不平衡数据,针对不平衡数据这一问题,本文使用SMOTE、Borderline-SMOTE、ADASYN、One-Sided Select处理乳腺肿瘤生存状态的不平衡数据。然后通过经典决策树、条件决策树、随机森林、支持向量机预测的准确率、敏感度、特异性、正例命中率、负例命中率来评价分类器的效果。结果 4种机器学习方法进行乳腺癌预后预测时,未经采样技术处理的原始数据集在预测准确率上均表现良好,其中支持向量机准确率最高,达90.42%。使用欠采样方法One-Sided Select技术,结合条件决策树预测,在不平衡的乳腺肿瘤数据集中预后预测效果最好,将敏感度由2%提高到58%,提高了56%。支持向量机在预测未经处理的数据集时特异性最高,为100%。采用One-Sided Select结合支持向量机算法的正例命中率最高,为40%。采用One-Sided Select结合条件决策树的负例命中率最高,为95%。结论 对类不平衡数据预处理后可以较好的改善敏感度,通过对比发现采样技术中的One-Sided Select更适合于乳腺癌的预后模型。

关键词(KeyWords): 乳腺肿瘤;类不平衡;机器学习;敏感度;采样技术

Abstract:

Keywords:

基金项目(Foundation):

作者(Author): 王哲;杨日东;周毅;张学良;王凯;

Email:

DOI:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享