Shiva Kumar、Vijaykumar Ghadage、Indhupriya Subramanian、Aarti Desai、Vivek K Singh 和 Abhay Jere
背景:生命科学研究的主要目标是了解复杂的细胞机制以及各种基因/蛋白质在多种细胞过程中的相互作用。为此,尽管存在多个其他数据库,例如 UniProt、蛋白质数据库 (PDB) 和 Reactome,但 PubMed 仍然是生物医学信息的主要来源。
目标:随着高通量技术和多个数据库提供的大量数据,查找基因-过程-表型的相关信息现在变得极具挑战性和繁琐。目前没有可用的工具可以同时搜索 PubMed 和多个其他数据库以获取整体信息。此外,典型的 PubMed 搜索会返回大量文章,需要手动筛选才能找到相关文献。因此,我们开发了 BioGyan,这是一种文献挖掘工具,可简化在 PubMed 和其他相关数据库中对基因、细胞类型和细胞过程的组合搜索。
方法:BioGyan 使用强大的评分方法对与用户搜索词相关的文章进行排名。评分方法基于摘要中基因、过程和相互作用术语共现的加权和。
结果:BioGyan 检索支持查询基因与过程、通路数据库中相关通路和 PDB 三维结构之间关联的 PubMed 文章。为方便查看,用户可在单一窗口中查看所有信息。BioGyan 在预测文章与基因过程关联的相关性方面显示准确率为 85.46%,表现优于 PESCADOR。
结论:BioGyan 具有多项关键功能,例如批量查询基因和过程、离线阅读文章、将文章列表导出为参考书目以及用户灵活地修改文章相关性,使其成为文献搜索的重要工具。因此,BioGyan 是一种独特的工具,可在多个数据库中提供整体搜索,同时大大自动化整个过程。