• 国家药监局综合司 国家卫生健康委办公厅
  • 国家药监局综合司 国家卫生健康委办公厅

9种结合式机器学习算法在基于高维数据的肿瘤早期诊断准确性的比较研究

通讯作者: 冯利, fengli@ouchn.edu.cn
DOI:10.12201/bmr.202108.00016
声明:预印本系统所发表的论文仅用于最新科研成果的交流与共享,未经同行评议,因此不建议直接应用于指导临床实践。

A Comparative Study on the Accuracy of Nine Combined Machine Learning Algorithms in Early Diagnosis of Tumors Based on High-dimensional dataFeng Li 1,*, Yue Xiaofei 2

Corresponding author: fengli, fengli@ouchn.edu.cn
  • 摘要:将降维方法(偏最小二乘法,PLS)与线性判别分析(LDA)、k-最近邻法(KNN)、决策树(DT)、支持向量机(SVM)、人工神经网络(ANN)、装袋法(Bagging)、随机森林法(RF)、二次判别分析(QDA)及逻辑回归(LR)组成9种结合式分类器并分析幼年转基因肿瘤小鼠及正常对照组小鼠的血清蛋白质组数据集,以比较9种结合式机器学习算法在基于高维数据的肿瘤早期诊断中的准确性。结果发现,PLS-LR、PLS-LDA、PLS-ANN、PLS-SVM、PLS-QDA的对两类小鼠的分类准确性较高。

    关键词: 机器学习早期诊断肿瘤高维数据

     

    Abstract: Nine combined classifiers composed of linear discriminant analysis (LDA), k-nearest neighbor method (KNN), decision tree (DT), support vector machine (SVM), artificial neural network (ANN), bagging, random forest method (RF), quadratic discriminant analysis (QDA) and logistic regression (LR) combined with dimension reduction method (partial least squares, PLS) were used to analyze the serum proteome data sets of young transgenic tumor mice and normal control mice to compare the accuracy of nine combined machine learning algorithms in early diagnosis of tumor based on high-dimensional data. The results showed that the classification accuracy of PLS-LR, PLS-LDA, PLS-ANN, PLS-SVM and PLS-QDA was higher.

    Key words: Machine; Learning, Early; Diagnosis, Tumors, High-dimensional; data

    提交时间:2021-10-09

    版权声明:作者本人独立拥有该论文的版权,预印本系统仅拥有论文的永久保存权利。任何人未经允许不得重复使用。
  • 图表

  • 金丽珠, 葛辉, 郭青, 李少琼, 杜雪杰. 基于气象因素和机器学习的流感疫情预警研究. 2021. doi: 10.12201/bmr.202012.00008

    汤阳杰, 吴晓锋, 刘群, 欧阳林, 罗爱芳. 腰椎间盘早期退变的智能诊断方法研究*. 2022. doi: 10.12201/bmr.202112.00007

    刘庆金, 王锐, 苗元青. 基于深度学习的无症状心肌缺血动态心电图智能检测研究. 2021. doi: 10.12201/bmr.202111.00009

    顾耀文, 李姣. 基于无监督深度学习的电子健康档案数据挖掘技术研究进展. 2021. doi: 10.12201/bmr.202104.00013

    杨丽静, 陈育庆, 徐旭, 廖维维, 蒋奉锦. 基于全域医疗大数据的精准预警监管实践研究. 2021. doi: 10.12201/bmr.202109.00030

    闫慈, 王鹏, 杨越, 任劲, 吴睿豪, 管音, 张茜. 省级肿瘤大数据中心的规划与建设. 2020. doi: 10.12201/bmr.202009.00002

    黄昱诚, 杨旭明, 乔琼. 基于数据挖掘的乳腺癌复发因素预测模型构建. 2020. doi: 10.12201/bmr.202009.00011

    高瞻, 高艳, 韩玖阳, 赵亮. 以诊疗数据挖掘为指导的三甲医院发展策略研究. 2021. doi: 10.12201/bmr.202105.00006

    曾叙衡, 郑颐, 吕军, 宁玉玲, 励晓红. 实施高值医用耗材带量采购的SWOT分析——以上海市为例. 2020. doi: 10.12201/bmr.202010.00841

    徐晓巍, 郭海红, 李姣. 面向公众健康问句分类数据挖掘算法评测研究. 2021. doi: 10.12201/bmr.202101.00018

  • 序号 提交日期 编号 操作
    1 2021-08-25

    10.12201/bmr.202108.00016V1

    下载
  • 公开评论  匿名评论  仅发给作者

引用格式

冯利, 岳小飞. 9种结合式机器学习算法在基于高维数据的肿瘤早期诊断准确性的比较研究. 2021. biomedRxiv.202108.00016

访问统计

  • 阅读量:1632
  • 下载量:4
  • 评论数:0

Email This Article

User name:
Email:*请输入正确邮箱
Code:*验证码错误