• 国家药监局综合司 国家卫生健康委办公厅
  • 国家药监局综合司 国家卫生健康委办公厅

基于主题模型的科技文献主题演化分析方法优化研究综述

通讯作者: 唐小利, tang.xiaoli@imicams.ac.cn
DOI:10.12201/bmr.202305.00016
声明:预印本系统所发表的论文仅用于最新科研成果的交流与共享,未经同行评议,因此不建议直接应用于指导临床实践。

A review of research on the improvement of topic model based topic evolution analysis methods for scientific literature

Corresponding author: Tang Xiaoli, tang.xiaoli@imicams.ac.cn
  • 摘要:目的/意义:梳理主题演化分析方法研究进展,提升改善科技文献主题识别和趋势研判效果,支撑文献信息服务,为未来的深入研究和实践应用指明了方向。方法/过程:根据LDA主题模型的缺陷归纳其衍生模型,针对现有科技文献主题演化分析方法存在的不足对相应的改善方案进行总结,最后根据现有研究的局限性提出展望。结果/结论:目前学科领域内的主题演化分析研究已取得众多研究成果,并形成了较为成熟的体系,但仍存在一些问题。本文通过全面的调研和梳理,能够为主题演化研究提供启示和借鉴。

    关键词: 主题模型主题识别主题演化LDA文本挖掘

     

    Abstract: Objective/Significance : To sort out the research progress of topic evolution analysis method, improve the effect of topic identification and trend judgment of scientific and technological literature, support literature information service, and point out the direction for future in-depth research and practical application. Method/process : The derivative model of LDA is summarized according to the defects of the topic model, and the corresponding improvement plan is summarized according to the shortcomings of the analysis methods of the topic evolution of the existing scientific literature. Finally, the prospect is put forward according to the limitations of the existing research. Result/Conclusion : At present, many research achievements have been made in the analysis of topic evolution in the subject field, and a relatively mature system has been formed, but there are still some problems. Through comprehensive investigation and sorting out, this paper can provide inspiration and reference for the study of topic evolution.

    Key words: topic model; topic identification; topic evolution; LDA; text mining

    提交时间:2023-05-17

    版权声明:作者本人独立拥有该论文的版权,预印本系统仅拥有论文的永久保存权利。任何人未经允许不得重复使用。
  • 图表

  • 黄锦泉, 张楚, 刘灵涛, 潘玮, 翟菊叶, 刘玉文. 基于HSM_LDA模型的在线医院特色挖掘研究*. 2023. doi: 10.12201/bmr.202305.00012

    阮旭凌, 刘琦, 郭志恒, 晏峻峰. 基于LDA和XGBoost算法的乳腺癌预测模型构建研究. 2022. doi: 10.12201/bmr.202106.00007

    吕艳华, 王康龙, 钟小云, 陈俊冶. 基于文本挖掘的互联网医疗平台用户画像模型构建 ——以自闭症疾病问诊数据为例. 2023. doi: 10.12201/bmr.202312.00012

    林紫洛, 杨雪梅, 关陟昊, 于诗睿, 唐小利. 基于引用网络的医学主题领域跨学科知识交流研究. 2022. doi: 10.12201/bmr.202210.00009

    朱韶华, 李艳红, 张迅, 黄海量. 基于高质量文献的医学肿瘤学领域研究前沿识别研究. 2023. doi: 10.12201/bmr.202312.00010

    龚浩, 周罗晶. 基于数字挖掘的我国互联网医疗政策文本分析. 2022. doi: 10.12201/bmr.202208.00005

    白雪艳. 基于文本挖掘的丁香医生APP用户评论分析. 2021. doi: 10.12201/bmr.202109.00013

    边妗伟, 饶克勤. 中国养老资源配置与服务利用协调发展的时空演化———基于机构分层分析框架. 2022. doi: 10.12201/bmr.202209.00014

    贾明霞;, 徐跃权. 科学知识图谱视域下国内外用户网络健康信息行为研究动态. 2021. doi: 10.12201/bmr.202101.00014

    杨颖, 李子政, 曹姝, 崔雷. 双向聚类方法在医学文本挖掘中的实现过程及应用意义. 2020. doi: 10.12201/bmr.202012.00003

  • 序号 提交日期 编号 操作
    1 2023-01-20

    bmr.202305.00016V1

    下载
  • 公开评论  匿名评论  仅发给作者

引用格式

于诗睿, 李爱花, 林紫洛, 陈逸菲, 唐小利. 基于主题模型的科技文献主题演化分析方法优化研究综述. 2023. biomedRxiv.202305.00016

访问统计

  • 阅读量:641
  • 下载量:1
  • 评论数:0

Email This Article

User name:
Email:*请输入正确邮箱
Code:*验证码错误