让·阿芒戈、席琳·布兰德、约瑟夫·克里斯蒂-奥莱扎和盖兰·米奥泰洛
对于原核生物而言,尚未就定义生物多样性的基本单位——物种达成共识。尽管现在有高通量分子工具可用于评估微生物多样性,但由于环境样本中存在大量低丰度物种,因此估计地球上细菌和古细菌的物种总数仍然是一项挑战。自 1995 年首次测序流感嗜血杆菌的全细胞基因组以来,已报告了超过七千个完整基因组。基因组序列的激增导致了大量分类群代表的出色记录。虽然这些基因组的注释已通过新的基因预测工具提高了准确性,但蛋白质基因组学已被证明有助于发现新基因、识别编码域序列的真正翻译起始密码子以及在蛋白质水平上表征成熟事件,例如信号肽处理。除了这种结构注释之外,蛋白质基因组学还可以对蛋白质的功能产生重大见解。基本上,蛋白质组学包括通过大型散弹枪蛋白质组学策略和高通量串联质谱法获得大量蛋白质序列数据。然后使用此类实验数据来改进基因组注释。意外结果(例如不同细菌中基因序列的逆转或在 Deinococcus 物种中使用非规范起始密码子进行翻译)只是迄今为止记录的众多修正中的一部分。今天,对一组完全覆盖生命之树的代表进行蛋白质组学分析将为准确注释新菌株奠定更好的基础。这将改善比较基因组学研究,并有助于评估密切相关的物种在哪些方面存在差异。