阿卜杜拉哈曼·穆萨、乌斯曼·马拉米·阿利尤
根据国际癌症研究机构的数据,2018 年,女性乳腺癌是全球新诊断病例数(约 210 万)最多的癌症类型。
预测疾病的结果是一项具有挑战性的任务。数据挖掘技术倾向于简化预测环节。自动化工具使得收集大量医疗数据成为可能,这些数据可供医学研究小组使用。本研究旨在应用机器学习算法,使用决策三分类器和描述性统计来评估该模型在预测晚期患者癌症转移概率方面的表现。
材料和方法:乳腺癌疾病数据集取自尼日利亚索科托州乌斯马努·丹福迪约大学教学医院放射治疗和肿瘤科。数据集有 259 个实例和 10 个属性。本研究的实验结果使用了 IMB SPSS(版本 23)软件环境中的决策三分类器。在实验中使用了两个类,因此应用了 2×2 混淆矩阵。类 0=未转移,类 1=转移。我们应用了监督机器学习方法,其中数据集分为两类,即使用 10 倍交叉验证进行训练和测试。
结果: 259 例乳腺癌中,218 例(84.2%)未发生转移,41 例(15.8%)发生转移。模型的总体准确率为 87%,敏感性为 88%,特异性为 75%,精确度为 98%
结论:基于这些发现,使用决策三分类器的机器学习算法预测 87% 的肿瘤出现在 IV 期,表明肿瘤可以扩散到身体的其他部位。