克里斯蒂尔·雷恩斯、莱斯利·雷加德、罗伯特·萨巴蒂尔和安妮-克劳德·坎普鲁
与生物功能或结构相关的特定结构基序的预测至关重要。鉴于没有任何结构信息的一级序列的可用性不断增加,从氨基酸 (AA) 序列进行预测至关重要。所提出的结构基序预测方法是一种基于结构字母表的两步方法。该字母表允许将任何 3D 结构编码为 1D 结构字母 (SL) 序列。首先,通过遗传编程学习 AA 和 SL 之间的基本对应规则。然后,为每个预先确定的感兴趣的基序学习隐马尔可夫模型。最后,提供对应于任何给定氨基酸序列的给定 3D 基序的概率。该方法应用于 ATP 结合位点,以比较我们的方法与其他方法对经典功能的效率。然后,说明该方法学习与较少预测的功能或其他类型基序相对应的基序的能力。