DOI:0.86/s---9
简介:
心脏外科手术相关的急性肾损伤(CSA-AKI)是导致术后发病率和死亡率增加的主要并发症。已有的预测模型多仅限于非线性关系分析,并且没有充分考虑代表对手术的急性反应的术中变量。本研究利用基于机器学习方法通过术间数据来预测CSA-AKI。
数据:
年8月至年8月的67例冠状动脉搭桥术(CABG),瓣膜置换手术以及两种疗法相结合的患者。分析的变量包括人口统计学特征,临床状况,术前生化数据,术前用药以及术中变量,例如时序血流动力学变化。名(37.3%)接受了CABG,名(5.7%)接受了瓣膜置换手术,而74名(%)接受了CABG和瓣膜联合手术。对于时间序列特征(SBP,DBP,MAP,HR),我们计算了时间序列特征的变异系数(ARV)。
模型方法:
逻辑回归,支持向量机(SVM),随机森林(RF),极端梯度增强(XGboost)和集成(RF+XGboost)。训练集和测试集7:3。将阳性案例复制了5次以防止过拟合。
评价方法:
AUCandROC,同时使用重要性变量图、决策树图以及SHAP解释变量。
结果:
RF表现出最大的AUC(0.,95%置信区间[CI]0.-0.)。集成模型的AUC(0.,95%CI0.-0.)大于单独的RF模型。简单决策树显示出最小的AUC(0.78,95%CI0.7-0.85)。(区间可通过0折交叉验证计算)
决策树模型,用于将患者分为有无AKI和无AKI。末叶的基尼系数在7个叶节点中的3个中超过0.45,这表明分类不正确。
RF方法的重要性矩阵图,揭示了对模型最重要的5个最重要的输入变量是术中尿量,术中pRBC输血,术前血红蛋白(HGB),术前血清肌酐和术前eGFR。在最重要的20个特征中,有4个是术中变量,而8个是时间序列变量。
SHAP概述RF模型的前20个功能。该图描述了训练数据集中高低特征值相对于SHAP值的关系。特征的SHAP值越高,AKI出现的可能性就越大。
单个特征如何影响RF预测模型的输出。y轴值表示特征的SHAP值,而x轴为特征值。我们可以直观地看到该功能的属性随绘图中值的变化而变化。SHAP值超过零表示AKI的风险增加。
总结:
证明术中时间序列对于AKI预测至关重要。
Shapley资料:
SHAP-Python的可解释机器学习库:知乎
GitHub: