沈榕, 李家宇, 盛博洋, 钟俐芹, 荆晓朔, 晏峻峰. 基于机器学习的中医肺癌辨证智能模型的构建研究. 2026. biomedRxiv.202604.00093
基于机器学习的中医肺癌辨证智能模型的构建研究
通讯作者: 晏峻峰, junfengyan@hnucm.edu.cn
DOI:10.12201/bmr.202604.00093
Research on the Construction of an Intelligent Syndrome Differentiation Model for Traditional Chinese Medicine in Lung Cancer Based on Ensemble Learning.
Corresponding author: YAN Junfeng, junfengyan@hnucm.edu.cn
-
摘要:摘要 目的/意义 构建基于机器学习的中医肺癌辨证智能模型,为中医医案数据的结构化利用及智能决策提供方法学参考。方法/过程 收集截至2025年9月30日公开发表的肺癌中医医案数据,建立中医肺癌信息数据库,并按7:3划分训练集与测试集。采用随机森林 (RF),、支持向量机(SVM)、多层感知器神经网络 (MLP)、CatBoost及构建的TCM-SAN(Traditional Chinese Medicine_Symptom Attention Network)模型进行辨证建模,使用五折交叉验证,从准确率、F1值、召回率、精确率及AUC等指标对模型性能进行综合评估。结果/结论 TCM-SAN模型在准确率86%、F1值及AUC等指标上均优于其他模型,在四诊特征建模与证型分类任务中表现出较高的预测性能和稳定性,为中医辨证智能决策模型构建提供了可行路径。
Abstract: Abstract Objective/Significance To develop an intelligent syndrome differentiation model for lung cancer in traditional Chinese medicine (TCM))based on machine learning, and to provide methodological support for the structured utilization of TCM medical records and intelligent decision-making. Methods/Process Published TCM medical records of lung cancer up to September 30, 2025 were collected to construct a TCM lung cancer information database. The dataset was divided into training and testing sets at a ratio of 7:3. Random Forest (RF), Support Vector Machine (SVM), Multilayer Perceptron (MLP), CatBoost, and the constructed TCM-SAN (Traditional Chinese Medicine Symptom Attention Network) model were applied for syndrome differentiation modeling. Five-fold cross-validation was used to evaluate model performance, including accuracy, F1-score, recall, precision, and area under the curve (AUC). Results/Conclusion The TCM-SAN model outperformed other models in accuracy (86%), F1-score, and AUC, demonstrating robust performance and stability in four-diagnostic feature modeling and syndrome classification, offering a practical approach for intelligent TCM syndrome differentiation.
Key words: Lung cancer; Traditional Chinese medicine syndrome differentiation; Machine learning; Structured four-diagnostic data; Explainable artificial intelligence.提交时间:2026-04-10
版权声明:作者本人独立拥有该论文的版权,预印本系统仅拥有论文的永久保存权利。任何人未经允许不得重复使用。 -
图表
-
徐鹏, 沈思, 朱佳辉, 夏森林, 徐华. 基于可解释机器学习的老年严重创伤并发急性呼吸窘迫综合征 预测模型构建及效能评估. 2026. doi: 10.12201/bmr.202602.00094
王奕程, 钟远鸣, 付小鹏. 基于“气逆挟脊”探讨脊髓型颈椎病的中医证治. 2025. doi: 10.12201/bmr.202512.00028
刘芷溢, 谢萍. 基于“邪伏膜原”探讨放射性阴道损伤的中医辨治. 2025. doi: 10.12201/bmr.202511.00016
邓丽华, 刘晓鹰, 徐克菲. 贝利尤单抗联合中药辨证方治疗狼疮性肾炎患儿1例. 2024. doi: 10.12201/bmr.202409.00041
梁乐然, 阎誉豪, 唐跃豪, 练洢彤, 徐倩, 杨猛, 伍家亨, 陈振虎, 刘秀峰. 基于知识图谱和大语言模型的中医药治疗帕金森病智能问答研究. 2026. doi: 10.12201/bmr.202604.00033
曾凡凡, 何雪威, 陈林丽. NLR预测青年肾穿刺活检术后出血的可解释机器学习研究. 2026. doi: 10.12201/bmr.202603.00060
刘娇娇, 郭连梅, 孙晓红, 张喆, 田野. 基于机器学习的出血性卒中患者下肢深静脉血栓预测模型构建. 2025. doi: 10.12201/bmr.202510.00023
胡铁骊, 周博翔, 于浩. 中医药数据资源目录体系的构建与研究. 2023. doi: 10.12201/bmr.202312.00025
咸宏欣, 生慧, 马素芬, 蔡肖红, 张丰聪, 陈一帆, 王苹苹. 基于深度学习的中医古籍命名实体识别研究综述. 2026. doi: 10.12201/bmr.202602.00050
张耀虹, 屠娜飞, 叶梦华, 姚宇芬, 胡祝红. 基于数据挖掘的耳穴贴压辨证治疗咳嗽选穴规律分析. 2026. doi: 10.12201/bmr.202603.00035
-
序号 提交日期 编号 操作 1 2026-01-11 10.12201/bmr.202604.00093V1
下载 -
-
公开评论 匿名评论 仅发给作者
引用格式
访问统计
- 阅读量:1
- 下载量: 0
- 评论数:0

登录
注册




京公网安备