最新消息:首页公告!

基于机器学习的HIV感染者重症监护病房入院风险预测模型构建与验证

浏览 共有条评论 关键词:智慧医疗,机器学习,HIV
新搜索营销

编辑推荐:

  本研究针对HIV感染者(PLWHs)因合并症导致ICU入院风险升高的问题,开发了6种机器学习模型(LOG/RF/KNN/SVM/ANN/XGB),通过1530例患者数据验证,发现人工神经网络(ANN)模型预测效能最优(ROC-AUC=0.961),并识别出呼吸衰竭等11个关键风险因子,为临床早期干预提供智能化决策支持。

随着抗逆转录病毒治疗(ART)的普及,HIV感染已从致死性疾病转变为慢性病,但患者仍面临因合并症导致的重症监护病房(ICU)高入院风险。当前临床依赖SOFA、APACHE-II等传统评分系统,存在忽略HIV特异性指标(如CD4+细胞计数、病毒载量)和地域数据偏差等问题。北京地坛医院的研究团队通过机器学习技术,首次构建了中国HIV人群的ICU风险预测模型,为精准医疗提供新范式。

研究团队采用回顾性队列设计,纳入2009-2020年间1530例HIV住院患者(含199例ICU病例),通过LASSO回归筛选出11个关键特征。采用多重插补法(MICE)处理缺失数据后,构建6种机器学习模型。结果显示,人工神经网络(ANN)在测试集中表现最优(Brier评分=0.034,ROC曲线下面积=0.961),显著优于传统逻辑回归模型。研究还创新性地应用SHAP可解释性分析,量化了各特征对预测结果的贡献度。

 

主要技术方法

  1. 数据采集:从电子病历提取人口统计学、基线CD4+细胞计数、病毒载量及合并症诊断数据

  2. 特征选择:采用LASSO回归从27个候选变量中筛选11个预测因子

  3. 模型构建:6种算法(LOG/RF/KNN/SVM/ANN/XGB)的10折交叉验证

  4. 性能评估:Brier评分、ROC-AUC和PR-AUC三重指标验证

  5. 可解释性分析:SHAP值量化特征重要性

研究结果

LASSO特征筛选

通过正则化路径分析确定最优λ值,筛选出呼吸衰竭、呼吸系统多发性机会性感染等11个核心预测因子(图2)。

 

模型性能比较

ANN模型展现出最佳判别力(ROC-AUC=0.961)和校准度(Brier=0.034),其预测效能较传统SOFA评分提升约40%。各模型PR曲线显示,ANN在正例稀缺场景下仍保持0.895的高精度(表1,图3)。

特征重要性解析

SHAP分析揭示呼吸衰竭对ICU入院的边际贡献最大(SHAP值=1.2),其次是呼吸系统多发性感染(0.8)和艾滋病相关肿瘤(0.7)。值得注意的是,基线CD4+细胞计数<50个/μL的负向影响显著高于病毒载量>105拷贝/mL(图4)。

结论与意义

该研究首次证实机器学习可有效预测中国HIV患者的ICU入院风险,ANN模型较传统方法具有三大优势:

  1. 整合HIV特异性指标(如CD4+细胞计数)与合并症数据,预测准确率提升至96.1%

  2. SHAP可解释性分析揭示呼吸衰竭为最关键预警信号,指导临床优先干预

  3. 为资源有限地区提供低成本筛查工具,预计可减少30%的ICU延迟入院

研究成果发表于《Virology Journal》,为HIV重症管理提供了从"经验医学"到"数据驱动"的范式转变。未来需通过多中心研究验证模型泛化能力,并开发嵌入式临床决策支持系统。

转载请注明:可思数据 » 基于机器学习的HIV感染者重症监护病房入院风险预测模型构建与验证

免责声明:本站来源的信息均由网友自主投稿和发布、编辑整理上传,或转载于第三方平台,对此类作品本站仅提供交流平台,不为其版权负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本站联系,我们将及时更正、删除,谢谢。联系邮箱:elon368@sina.com

人工智能数据标注服务
留言与评论(共有 条评论)
昵称:
匿名发表 登录账号
                 
   
验证码:
后台-系统设置-扩展变量-手机广告位-手机广告位-内容广告位三