于诗睿, 李爱花, 林紫洛, 陈逸菲, 唐小利. 基于主题模型的科技文献主题演化分析方法优化研究综述. 2023. biomedRxiv.202305.00016
基于主题模型的科技文献主题演化分析方法优化研究综述
通讯作者: 唐小利, tang.xiaoli@imicams.ac.cn
DOI:10.12201/bmr.202305.00016
A review of research on the improvement of topic model based topic evolution analysis methods for scientific literature
Corresponding author: Tang Xiaoli, tang.xiaoli@imicams.ac.cn
-
摘要:目的/意义:梳理主题演化分析方法研究进展,提升改善科技文献主题识别和趋势研判效果,支撑文献信息服务,为未来的深入研究和实践应用指明了方向。方法/过程:根据LDA主题模型的缺陷归纳其衍生模型,针对现有科技文献主题演化分析方法存在的不足对相应的改善方案进行总结,最后根据现有研究的局限性提出展望。结果/结论:目前学科领域内的主题演化分析研究已取得众多研究成果,并形成了较为成熟的体系,但仍存在一些问题。本文通过全面的调研和梳理,能够为主题演化研究提供启示和借鉴。
Abstract: Objective/Significance : To sort out the research progress of topic evolution analysis method, improve the effect of topic identification and trend judgment of scientific and technological literature, support literature information service, and point out the direction for future in-depth research and practical application. Method/process : The derivative model of LDA is summarized according to the defects of the topic model, and the corresponding improvement plan is summarized according to the shortcomings of the analysis methods of the topic evolution of the existing scientific literature. Finally, the prospect is put forward according to the limitations of the existing research. Result/Conclusion : At present, many research achievements have been made in the analysis of topic evolution in the subject field, and a relatively mature system has been formed, but there are still some problems. Through comprehensive investigation and sorting out, this paper can provide inspiration and reference for the study of topic evolution.
Key words: topic model; topic identification; topic evolution; LDA; text mining提交时间:2023-05-17
版权声明:作者本人独立拥有该论文的版权,预印本系统仅拥有论文的永久保存权利。任何人未经允许不得重复使用。 -
图表
-
黄锦泉, 张楚, 刘灵涛, 潘玮, 翟菊叶, 刘玉文. 基于HSM_LDA模型的在线医院特色挖掘研究*. 2023. doi: 10.12201/bmr.202305.00012
阮旭凌, 刘琦, 郭志恒, 晏峻峰. 基于LDA和XGBoost算法的乳腺癌预测模型构建研究. 2022. doi: 10.12201/bmr.202106.00007
吕艳华, 王康龙, 钟小云, 陈俊冶. 基于文本挖掘的互联网医疗平台用户画像模型构建 ——以自闭症疾病问诊数据为例. 2023. doi: 10.12201/bmr.202312.00012
林紫洛, 杨雪梅, 关陟昊, 于诗睿, 唐小利. 基于引用网络的医学主题领域跨学科知识交流研究. 2022. doi: 10.12201/bmr.202210.00009
朱韶华, 李艳红, 张迅, 黄海量. 基于高质量文献的医学肿瘤学领域研究前沿识别研究. 2023. doi: 10.12201/bmr.202312.00010
龚浩, 周罗晶. 基于数字挖掘的我国互联网医疗政策文本分析. 2022. doi: 10.12201/bmr.202208.00005
白雪艳. 基于文本挖掘的丁香医生APP用户评论分析. 2021. doi: 10.12201/bmr.202109.00013
边妗伟, 饶克勤. 中国养老资源配置与服务利用协调发展的时空演化———基于机构分层分析框架. 2022. doi: 10.12201/bmr.202209.00014
贾明霞;, 徐跃权. 科学知识图谱视域下国内外用户网络健康信息行为研究动态. 2021. doi: 10.12201/bmr.202101.00014
杨颖, 李子政, 曹姝, 崔雷. 双向聚类方法在医学文本挖掘中的实现过程及应用意义. 2020. doi: 10.12201/bmr.202012.00003
-
序号 提交日期 编号 操作 1 2023-01-20 bmr.202305.00016V1
下载 -
-
公开评论 匿名评论 仅发给作者
引用格式
访问统计
- 阅读量:641
- 下载量:1
- 评论数:0