抽象的

自然语言处理准确分类多中心结肠镜检查的适应症、发现和病理报告

沙申克·雷迪·瓦迪亚拉

结肠镜检查用于结直肠癌 (CRC) 筛查。从电子健康记录 (EHR) 中的自由文本中提取结肠镜检查结果的详细信息可用于确定患者 CRC 风险和结直肠筛查策略。我们开发并评估了一个深度学习模型框架的准确性,该框架为临床决策支持系统提取信息来解释相关的自由文本报告,包括指征、病理和发现说明。Bio-Bi-LSTM-CRF 框架是使用双向长短期记忆 (Bi-LSTM) 和条件随机场 (CRF) 开发的,用于从这些自由文本报告中提取多种临床特征,包括结肠镜检查指征、结肠镜检查期间的发现和切除材料的病理。我们基于 3,867 名患者的 4,000 份手动注释笔记中的 80% 训练了 Bio-Bi-LSTM-CRF 和现有的 Bi-LSTM-CRF 模型。这些临床笔记来自四家退伍军人医疗中心的一组 40 岁以上的患者。剩余注释笔记中的 10% 用于训练超参数,其余 10% 用于评估我们的模型 Bio-Bi-LSTM-CRF 的准确性并与 Bi-LSTMCRF 进行比较。我们的实验表明,通过整合 Bio-Bi-LSTM-CRF 的字典函数向量和策略字符序列嵌入方法的双向编码器表示是从 EHR 提取的临床笔记中识别结肠镜检查特征的有效方法。Bio-Bi-LSTM-CRF 模型为识别有患结肠癌风险的患者并研究他们的健康结果创造了新的机会。

免责声明: 此摘要通过人工智能工具翻译,尚未经过审核或验证