【神麻人智】机器学习预测ICU患者转出后非计划再入ICU或死亡:一项回顾性队列研究

昨天 古麻今醉网 古麻今醉网 发表于上海

针对 ICU 患者转出后风险预测难问题开展单中心回顾性队列研究,用多种机器学习算法建模型,随机森林在内部数据集表现佳,分析特征影响,虽有成果但存在数据质量、模型解释性等局限,望改进。

图片

【研究背景】

重症监护室(ICU)为急需医疗监护的患者提供监护治疗。与普通病房相比,ICU具有更加精细的设备和技术支持,但床位资源十分紧张。研究表明,大约4-6%的ICU患者会因病情恶化而再次进入ICU,显著增加患者住院死亡率。传统临床方法,如基于病史和检查的评估,往往无法准确预测患者未来可能出现的器官功能障碍或生命体征波动。因此,采用机器学习方法来提升ICU患者转出后风险预测的准确性与可靠性,成为本研究的核心目标。研究提出通过构建有效的预测模型,来提前评估出院后患者的再入院或死亡风险,从而为临床决策提供支持。

【研究设计】

本研究旨在预测ICU患者转出后48h内发生意外再入院或死亡的风险,为单中心、回顾性队列研究。研究对象为2010年1月1日至2019年10月31日入住研究中心ICU的17604名18岁及以上的患者。在此时间段内,患者两天内意外再次入住ICU的住院构成阳性结果,所有其他住院均为阴性结果。为了分析该群体,数据集筛选了从ICU转至普通病房的患者,并排除出院后死亡或转院至其他ICU/医院的患者。收集ICU患者的临床数据,包括基本信息、疾病史、治疗过程、生命体征、实验室检查结果等。最终,共收集了328个临床特征,用于机器学习模型的输入。

【数据处理和模型开发】

数据集被划分为训练集(70%)、校准集(5%)和测试集(25%)。训练集用于模型训练和超参数优化,校准集用于选择最佳的决策阈值,测试集则用于验证模型的最终性能。研究使用了AutoML工具Auto-sklearn 0.14.6和CaTabRa来评估不同机器学习架构、超参数和特征配置。使用的机器学习算法,包括AdaBoost、K最近邻(kNN)、支持向量机(SVM)、多层感知器(MLP)、随机森林(RF)和极端梯度提升(XGBoost),均被纳入模型训练中。使用平均精度(AP)作为超参数优化目标。除AP外,还报告了AUC-ROC、平衡准确性(bACC)、敏感性、阳性预测值(PPV)、阴性预测值(NPV)和F1评分。

为了验证,还使用了MIMIC-IV数据库。MIMIC-IV也被分为训练集、校准集和测试集。在我们的内部数据集上训练的所有模型都在MIMIC-IV测试集上进行了测试。同时,模型也在MIMIC-IV上进行训练,然后在我们的内部测试集上进行评估。最后,将本结果与模型与转移的稳定性和工作负荷指数(SWIFT)评分进行比较。

图片

本研究使用了SHAP方法来评估各个特征对模型预测的影响。SHAP值表示每个特征对预测结果的贡献,颜色表示每个变量的值对风险预测的影响。

【结果】

本研究纳入了14236名独立患者,进行了16405次ICU住院分析。在这些患者中,有310例(1.89%)出现了转出ICU后48小时内的再转入或死亡。外部验证使用了MIMIC-IV数据集,共有42949名独立患者,进行了58434次ICU住院分析,其中2873例(4.92%)属于阳性结果。两组数据的阳性结果率差异较大,原因可能在于MIMIC-IV未能区分计划内和计划外的ICU再转入,所有再转入均被视为计划外。

在所有的机器学习模型中,随机森林在AP(0.087±0.027)和AUC-ROC(0.721±0.029)指标上表现最佳,其PPV和NPV分别为0.036±0.006和0.990±0.002。在MIMIC-IV数据集上,模型性能显著下降,特别是随机森林的AUC-ROC从内部数据集的0.721降至0.641。XGBoost模型在MIMIC-IV上表现较好,获得了0.648±0.011的AUC-ROC。

图片

SHAP分析表明,心率是随机森林模型中最重要的特征,其次是外周血氧饱和度(SpO2)、动脉血压和实验室指标。高收缩压通常与ICU外再次转入或死亡风险相关,而高舒张压和平均血压则倾向于降低这一风险。

图片

【讨论】

本研究表明,机器学习,特别是随机森林模型,能够有效预测ICU患者转出后的再转入或死亡风险。该预测工具不仅有助于提高临床医生的决策能力,并能优化医疗资源的配置,减少再转入率和死亡率。然而,尽管取得了积极的结果,本研究仍存在一些挑战和局限性,例如数据质量问题、模型可解释性较差等。未来的研究应扩展数据集,考虑更多的地区和人群,同时探索更加可解释的模型,以增强其临床应用的接受度。

参考文献:

Tschoellitsch T, Maletzky A, Moser P, et al. Machine learning prediction of unexpected readmission or death after discharge from intensive care: A retrospective cohort study. J Clin Anesth. 2024 Oct 14;99:111654.

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2237383, encodeId=33c8223e38394, content=<a href='/topic/show?id=7d806121594' target=_blank style='color:#2F92EE;'>#机器学习#</a> <a href='/topic/show?id=8f919596205' target=_blank style='color:#2F92EE;'>#重症监护室#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=1, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=61215, encryptionId=7d806121594, topicName=机器学习), TopicDto(id=95962, encryptionId=8f919596205, topicName=重症监护室)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Sun Nov 17 10:11:32 CST 2024, time=10小时前, status=1, ipAttribution=上海)]

相关资讯

Sci Rep:中国学者研究---比较评估基于机器学习的影像组学模型预测局部进展期胃癌网膜转移的能力

在使用不平衡的二分类样本构建局部进展期胃癌大网膜转移预测模型时,基于LR的模型存在PPV低、假阳性率高的缺点。

【论著】| 基于胸部增强CT影像组学模型用于胸腺瘤分类的研究

本研究旨在建立影像组学分类模型,利用CECT图像区分胸腺瘤的风险组,并验证模型在相对较大的回顾性队列中的可靠性和泛化能力。

Cell子刊:基于机器学习的分析识别和验证血清外泌体蛋白质组学特征,可用于结直肠癌的诊断!

该研究表明采用了深入的4D-DIA蛋白质组学和机器学习(ML)管道,从37例发现队列的血清EV样本中鉴定出了用于CRC诊断的关键蛋白PF4和AACT。

Schizophrenia:首次发作精神病患者功能预后多变量预测模型的交叉验证:基于EUFEST和PSYSCAN的研究

本研究在EUFEST和PSYSCAN两大数据集上开发了首次发作精神病患者的功能预后模型。尽管在单一数据集中模型表现良好,但外部验证中准确率显著下降,反映了外部验证对模型临床应用的重要性。

European Radiology:基于机器学习的临床决策算法诊断原发性甲状旁腺功能亢进

机器学习(ML)是人工智能(AI)的一个子集,是一种数据科学方法,其中计算机迭代学习而无需使用显式规则编程。由于PHPT是一种异质性疾病,具有不同范围的临床和影像学特征。

European Radiology:机器学习和深度学习对脑CT转诊的合理性分类

目前,解决CT过度使用的可用方法包括引入新的诊断成像途径,提供替代成像、专家参与、成像后复核以及将每个转诊者的预约频率与部门平均水平进行比较的反馈。

European Radiology:基于多参数MRI的机器学习模型预测脑膜瘤患者WHO分级

放射组学利用强大的计算机图像处理能力和多种大数据挖掘方法提取多维特征,尽管这些特征很难从视觉上获得,但保留了与研究相关的信息,如数字加密医学图像(CT、MRI和PET)中的一阶、形状、纹理特征。

Nat Commun:结合机器学习与血浆蛋白质组质谱分析可提前7年预测帕金森病,准确率达79%

该研究表明,血浆蛋白质组检测或有助于在运动症状出现前7年预测PD的发生。

【论肿道麻】Lancet子刊:一个针对老年重症监护室患者的机器学习病情严重程度评估模型: 一项有亚组偏移评估的多中心研究

作者主要研究了与老年相关的因素,包括营养状况、活动状态、合并症和抢救意愿等,检查了这些因素的特征重要性,并通过按年龄、性别和种族的亚群中的分辨力和校准性能来评估模型偏倚。

Nature:计算蛋白质设计:AI如何重塑生物学的未来

本文介绍计算蛋白质设计与机器学习进展,包括突破、挑战及在结合预测、催化剂设计、构象变化、复杂结构设计等方面的应用,强调合作推动发展及广阔前景。