Curtis Davis、Karthik Kota、Venkat Baldhandapani、Wei Kong、Sahar Abubucker、Eric Becker、John Martin、Kristine M. Wylie、Radhika Khetani、Matthew E. Hudson、George M. Weinstock Weinstock 和 Makedonka Mitreva
新一代测序技术的最新进展需要能够跟上数据生成速度的比对算法和软件。标准算法,尤其是蛋白质相似性搜索,是分析流程中的重要瓶颈。特别是对于宏基因组学方法,现在通常需要在大型数据库中搜索数亿个序列读取。这里我们描述了 mBLAST,这是一种基于基本局部比对搜索工具 (BLAST) 并保留 BLAST 高灵敏度的用于翻译和/或蛋白质比对大型数据集的加速搜索算法。mBLAST 算法比美国国家生物技术信息中心 (NCBI) 程序 BLASTX、TBLASTX 和 BLASTP 的大型数据集速度快得多,允许在标准计算机架构上在合理的时间范围内进行分析。在本文中,使用来自人类微生物组计划的健康人类微生物群的序列展示了 mBLAST 的影响。mBLAST 旨在作为 BLAST 的插件替代品,适用于任何涉及短读序列并包括高通量分析的研究。 mBLAST 软件可在 www.multicorewareinc.com 上免费供学术用户使用。