苏尼尔·纳哈塔和阿什什·伦塔拉
多年来,通过基于模板的建模 (TBM) 进行近天然蛋白质结构预测一直是结构生物学的主要现实目标。TBM 算法需要一组针对目标蛋白质序列的最佳模板,以最大程度地覆盖该序列并构建其正确的拓扑结构。然而,这种预测算法的准确性受到我们模板搜索措施的算法和逻辑问题的影响,这些措施无法快速筛选出目标序列的可靠结构。在本研究中,我们使用精选的 41,967 个模板的 PDB95 数据集来预测 CASP10 目标 T0752 模型,以评估通常使用的搜索引擎 PSI-BLAST 和 HHPred 的效率。我们的分析提供了一项详细的研究,以开辟提高 TBM 预测方法准确性的新前景。它揭示了最流行的模板搜索措施的弱点,从而简要地提供了对预见的模板搜索算法的质量的重要见解,以说明需要更可靠的模板搜索算法。