莎莉·耶佩斯和玛丽亚·梅塞德斯·托雷斯
鉴于具有相同组织病理学诊断的癌症患者的临床行为存在异质性,寻找未被识别的分子亚型、亚型特异性标记并评估其临床生物学相关性是必要的。这项任务如今受益于高通量基因组技术以及对国际基因组项目和信息库生成的数据集的免费访问。机器学习策略已被证明可用于识别大型数据集中的隐藏趋势,有助于了解癌症的分子机制和亚型。然而,将新的分子亚类和生物标记转化为临床环境需要对它们进行分析验证和临床试验以确定其临床效用。在这里,我们概述了识别和确认癌症亚型的工作流程,总结了各种方法原理,并重点介绍了代表性研究。最常见恶性肿瘤的公共大数据的生成正在将分子病理学转变为一门数据库驱动的学科。