Zhongshan Daxue xuebao. Yixue kexue ban (Jan 2018)

基于CRF与RUTA规则相结合的卒中入院记录医学实体识别及应用

  • 葛艳秋,
  • 易应萍

Journal volume & issue
Vol. 39

Abstract

Read online

: 【目的】研究针对非结构化临床电子病历的自然语言处理模型的构建和优化,并利用该模型对江西 省医疗大数据平台中卒中病人的病历进行结构化数据提取。【方法】从江西省医疗大数据平台中随机筛选500份 2011-2016年的卒中病人入院记录,根据临床科研的实际需求构建了脑卒中专科病人的命名实体标注体系和命 名实体标注语料库,利用该语料库构建基于CRF以及RUTA规则的命名实体抽取模型,并通过调整RUTA规则以 及参数提升识别准确率。【结果】经五折交叉验证,该模型的医学命名实体的抽取准确率0.960,召回率0.916,F- score 0.939,利用该抽取模型对大数据平台中10 295份脑卒中患者入院记录进行抽取,共抽取命名实体264 580 条,命名实体修饰1 161 077条。【结论】构建的自然语言抽取模型识别准确率较高,通过该模型能够准确地从大 量非结构化病历中获取病人的既往史、生活史、临床表现等有价值的科研数据,有效提升心脑血管疾病的临床科 研效率和科研水平

Keywords