徐荣和王全球
个性化医疗就是以正确的剂量向正确的患者提供正确的药物。药物基因组学 (PGx) 是识别可能影响药物反应的基因变异的研究,对个性化医疗非常重要。研究基因与药物反应之间关系的计算方法正在成为个性化医疗的一个活跃研究领域。目前,药物-基因关系的系统研究有限,因为难以建立和保持大规模机器可理解的药物-基因关系知识库。科学文献包含丰富的药物-基因关系信息,因此是 PGx 研究和个性化医疗的最终知识来源。然而,这些信息大部分都隐藏在机器可理解性有限的自由文本中。需要开发自动方法从生物医学文献中提取结构化的药物-基因关系。在这项研究中,我们提出了一种从 MEDLINE 中提取药物-基因关系的半监督方法。该技术使用一种种子模式,并迭代学习在 2000 万个 MEDLINE 摘要中表达关系的各种方式。我们的方法在从 MEDLINE 中提取药物-基因关系方面实现了高精度(0.961-1.00),并且发现了许多在 PharmGKB(一个大规模手动管理的 PGx 知识库)中没有的药物-基因对。