Zhongshan Daxue xuebao. Yixue kexue ban (Jan 2025)

基于随机森林的冠状动脉狭窄风险识别模型

  • 吕勇峰,
  • 王钰婧,
  • 张乐怡,
  • 李一心,
  • 原娜,
  • 田晶

Journal volume & issue
Vol. 46
pp. 138 – 146

Abstract

Read online

目的采用机器学习方法构建冠状动脉狭窄风险识别模型,分析影响冠状动脉狭窄的主要因素。方法连续纳入2013年1月至2020年5月就诊于山西省两所医院,经冠状动脉造影确诊为冠心病的患者。以患者临床资料为自变量,Gensini积分为结局变量,采用Logistic回归、反向传播神经网络(BPNN)和随机森林(RF)算法构建冠状动脉狭窄风险识别模型。通过灵敏度(TPR)、特异度(TNR)、准确率(ACC)、阳性预测值(PV+)、阴性预测值(PV-)、受试者工作特征曲线下面积(AUC)和校准曲线进行模型评价。并对最佳模型进行特征重要性排序。结果Logistic回归、反向传播神经网络和随机森林模型的TPR分别为75.76%、74.30%和93.70%,ACC分别为74.05%、72.30%和79.49%,AUC分别为0.739 9、0.723 1、0.752 2,随机森林模型综合效能表现最佳。随机森林模型结果表明,胸痛症状、心电图提示ST段异常、室性早搏、合并高血压、房颤、心脏彩超提示节段性室壁运动异常、主动脉瓣关闭不全、肺动脉瓣关闭不全、心血管疾病家族史、体质量指数是冠脉狭窄的前10位重要变量。结论在识别冠状动脉狭窄方面,随机森林模型表现出最佳的综合性能,可较为准确地评估冠脉狭窄的程度,为临床干预提供科学依据。

Keywords