崔在镇、金秉柱、金成厚
背景:昆虫是所有现存动物中最大的、物种多样性最高的群体,其“生物树”可被视为一种隐喻和概念树,用于捕捉现存昆虫复杂且不可预测的进化过程的简化叙述。目前,最常见的方法是构建“基因树”,作为生物树的替代品,方法是选择一组高度可比对的区域来代表每个生物体,这些区域是每个选定基因/蛋白质的代表。然而,这些选定区域仅占所有基因/蛋白质的一小部分,甚至占生物体整个基因组的更小部分。在过去的几十年里,许多现存昆虫的全基因组序列已经可用,这为使用信息论构建昆虫“全基因组或全蛋白质组树”提供了机会,而无需序列比对(无比对方法)。
结果:昆虫的全蛋白质组树显示:(a)人口统计分组模式与基因树中的相似,但群体的分支顺序存在显著差异,因此群体之间的姐妹关系也存在显著差异;(b)所有主要群体的创始人都是在树的根部附近的“爆炸式爆发”中出现的。
结论:由于生物体的整个蛋白质组序列可视为一本氨基酸字母表的“书”,因此可以使用信息论的文本分析方法构建书的树,而无需序列对齐。这种树为构建现存昆虫的进化和亲缘关系的叙述提供了另一种视角。