普拉内蒂·帕蒂达尔和乔蒂·博瓦尼
结直肠癌(CRC) 是全球第二大癌症相关死亡原因,每个人一生中罹患该病的风险为 80-100%。一些关键信号通路(如 Wnt、TGF、p53、K-ras 等)的遗传学和相关机制在控制 CRC 易感性方面起着不利作用。很大比例的结直肠肿瘤(腺瘤和癌)显示 β-catenin 或 axin 的激活突变,而某些肿瘤抑制基因 (TSG)(如 APC)的缺失会导致结肠中出现随机息肉。所有这些分子恰好都是进化保守的 Wnt 信号通路的关键组成部分,该通路在该疾病发展的各个时间点都发挥着重要作用。通过智能高效地使用机器学习技术,可以识别基因组景观中样本组之间的 SNP 谱差异。有趣的是,这些 SNP 谱的统计和模式分析为我们提供了一个具体而合乎逻辑的平台,在此平台上,可以显著评估每个独特 SNP 的相对贡献,从“原因到结果”。然而,这些 SNP 变异与癌症预测和易感性的生物学相关性仍有待解决,有待更好地理解合理对照设计对 SNP 研究的影响。我们从本文报告的重要 SNP 分析中得出的结果证明了相关生物信息学工具和机器学习技术在基于实际 SNP 数据区分患病人群方面的实用性。在这项研究中,我们主要针对 Wnt 信号通路的关键成员,它们在结直肠癌的不同阶段发挥重要的发育作用,描绘了癌症的典型“多基因多步骤性质”。我们利用发育生物学工具的力量,确定并关联了该通路中“早期作用”和“晚期作用”成员的常见遗传变异,这些变异在 CRC 患者中最为普遍。此外,通过部署各种数据挖掘(生物信息学)技术,挖掘并分析了隐藏在大型数据集中的复杂关系和相关性。该报告通过确定一些潜在的候选治疗靶点,讨论了这种组合方法在转化研究和临床医学干预中的应用范围。