Georges Natsoulis、Nancy Zhang、Katrina Welch、John Bell 和 Hanlee P Ji
利用下一代测序仪的深度靶向测序功能,我们开发了一种新颖的两步插入缺失 (indel) 检测算法 (IDA),当插入缺失与野生型参考序列相比略少时,该算法可以高计算效率和灵敏度从单个读取序列中确定插入缺失。首先,它利用快速比对程序生成的特定序列比对工件来识别候选插入缺失位置。其次,它使用 Smith-Waterman (SW) 算法在受限的序列读取子集上确认候选插入缺失的位置。我们证明 IDA 适用于深度靶向测序数据中不同大小的插入缺失,其中插入缺失被野生型序列稀释,比例较低。我们的算法可用于检测存在于不同等位基因频率的插入缺失变体,例如可能出现在杂合子和混合正常肿瘤组织中。