巴里罗布森
本文回顾了药物监测和药物基因组学面临的数据分析挑战。概述了解决高维性和稀疏性普遍问题的四种相互关联的工具:流行病学早期建立的四大证据支柱中的负面或相反证据的贡献、信息和决策理论、zeta 函数和双曲复数代数。这四种工具的描述相当综合,这种顺序基本上反映了生物医学的新颖程度和接受程度,最新和有争议的排在最后。zeta 函数本质上是信息论中的估计值,是表达系统中预期信息(通过数据可供观察者使用的数量)的扩展,并且自 1970 年代初以来一直在生物信息学中使用。双曲复数代数涉及在两个条件性方向上编码信息,这对推断病因具有潜在重要性,这些考虑因素可以从 zeta 函数中数学推导出来。当在推理网络中使用许多 zeta 函数项作为信息项的估计时,它就变得非常重要。尽管它本质上代表了狄拉克的推理方法,并且已经在量子场和粒子理论中确立,但它的实用性仍然存在。然而,在使用基于多个因素的估计进行推理时,包括负面证据需要我们在解释时小心谨慎。