• 国家药监局综合司 国家卫生健康委办公厅
  • 国家药监局综合司 国家卫生健康委办公厅

基于多模态数据的慢性阻塞性肺疾病筛查集成模型构建

通讯作者: 梁会营, lianghuiying@gdph.org.cn
DOI:10.12201/bmr.202604.00086
声明:预印本系统所发表的论文仅用于最新科研成果的交流与共享,未经同行评议,因此不建议直接应用于指导临床实践。

Development of an Ensemble Screening Model for Chronic Obstructive Pulmonary Disease Using Multimodal Data

Corresponding author: Liang Huiying, lianghuiying@gdph.org.cn
  • 摘要:目的/意义 整合胸部X线片和临床数据,构建慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)筛查集成模型,为无法配合肺功能检查(pulmonary function test,PFT)的患者提供补充工具。 方法/过程 选取2020年9月至2024年12月在广东省人民医院行胸部X线检查的15414例患者,随机分为训练集(8892例,57.7%)、验证集(1134例,7.3%)和测试集(5388例,35.0%)构建模型,以曲线下面积(area under the curve,AUC)等指标评估性能,并通过校准曲线、决策曲线分析(decision curve analysis,DCA)和沙普利加性解释(SHapley Additive exPlanations,SHAP)分析。 结果/结论 测试集模型AUC为0.922,灵敏度0.979,特异度0.823,校准与临床获益良好。SHAP显示共病组合、年龄、高血压等为重要特征,其中“肺部感染+高血压”关联强度最强(OR=19.42,95% CI:5.04-74.87,P=0.006)。该集成模型无需依赖PFT即可完成COPD筛查,有望为无法配合PFT的患者提供补充工具。

    关键词: 慢性阻塞性肺疾病;筛查;机器学习;深度学习;集成模型

     

    Abstract: Purpose/Significance To integrate chest X-ray images and clinical data to construct an integrated screening model for chronic obstructive pulmonary disease (COPD), and provide a supplementary tool for patients unable to cooperate with pulmonary function test (PFT). Method/Process A total of 15,414 patients who underwent chest X-ray examination at Guangdong Provincial Peoples Hospital from September 2020 to December 2024 were enrolled, and randomly divided into a training set (8,892 cases, 57.7%), a validation set (1,134 cases, 7.3%) and a test set (5,388 cases, 35.0%) for model construction. The model performance was evaluated by indicators including the area under the curve (AUC), with supplementary analyses performed via calibration curve, decision curve analysis (DCA) and SHapley Additive exPlanations (SHAP). Result/Conclusion In the test set, the model achieved an AUC of 0.922, a sensitivity of 0.979 and a specificity of 0.823, with favorable calibration and clinical benefit. SHAP analysis identified comorbidity combination, age and hypertension as key features, among which pulmonary infection plus hypertension had the strongest predictive efficiency (OR=19.42, 95%CI: 5.04-74.87, P=0.006). This integrated model can complete COPD screening without relying on PFT, and is expected to provide a supplementary approach for patients unable to cooperate with PFT.

    Key words: Chronic Obstructive Pulmonary Disease; Screening; Machine Learning; Deep Learning; Integrated Model

    提交时间:2026-04-10

    版权声明:作者本人独立拥有该论文的版权,预印本系统仅拥有论文的永久保存权利。任何人未经允许不得重复使用。
  • 图表

  • 董丹丹, 马红映. 呼出气冷凝液在慢阻肺中的研究价值与进展. 2025. doi: 10.12201/bmr.202512.00038

    王文慧, 李琳浩, 王坤, 李鹏, 徐晓晨, 韩萍. 基于“子盗母气”理论探讨慢阻肺合并营养不良的研究. 2026. doi: 10.12201/bmr.202601.00090

    王丽萍, 周杰, 肖玮, 孙增涛. 从“三焦气化-肠道菌群代谢”理解肺肠轴在慢性阻塞性肺疾病的作用机制及治疗策略. 2026. doi: 10.12201/bmr.202601.00005

    刘娇娇, 郭连梅, 孙晓红, 张喆, 田野. 基于机器学习的出血性卒中患者下肢深静脉血栓预测模型构建. 2025. doi: 10.12201/bmr.202510.00023

    徐鹏, 沈思, 朱佳辉, 夏森林, 徐华. 基于可解释机器学习的老年严重创伤并发急性呼吸窘迫综合征 预测模型构建及效能评估. 2026. doi: 10.12201/bmr.202602.00094

    王杰, 王至诚, 娄帅, 董建成, 曹新志. 基于深度学习算法Mask R-CNN的甲状腺结节检测模型研究. 2024. doi: 10.12201/bmr.202411.00085

    苏燕凤, 洪素茹, 陈钰霜, 吴夏阳. 结合机器学习模型的早产儿ICU死亡风险评估与可解释性分析. 2025. doi: 10.12201/bmr.202503.00066

    沈榕, 李家宇, 盛博洋, 钟俐芹, 荆晓朔, 晏峻峰. 基于机器学习的中医肺癌辨证智能模型的构建研究. 2026. doi: 10.12201/bmr.202604.00093

    苏飞宇, 冯起顺, 曾庆嘉, 高书尧, 奚慧楠, 吴文欣, 王颖帅, 胡红濮. 融合健康画像与机器学习的糖尿病眼底病变风险预测模型研究. 2026. doi: 10.12201/bmr.202601.00077

    朱志文, 齐国强, 杨恺熠, 赵永根, 余卓, 俞刚. 基于多中心横向联邦学习的以咳嗽为第一主诉的儿童疾病医疗数据共享模型. 2022. doi: 10.12201/bmr.202207.00004

  • 序号 提交日期 编号 操作
    1 2026-01-22

    10.12201/bmr.202604.00086V1

    下载
  • 公开评论  匿名评论  仅发给作者

引用格式

陈翠妍, 梁会营. 基于多模态数据的慢性阻塞性肺疾病筛查集成模型构建. 2026. biomedRxiv.202604.00086

访问统计

  • 阅读量:10
  • 下载量: 0
  • 评论数:0

Email This Article

User name:
Email:*请输入正确邮箱
Code:*验证码错误