李文峰, 朱威, 王晓玲, 吴苑斌, 纪文迪, 陈亮, 汤步洲. Text2DT: 面向临床诊疗文本的决策规则抽取技术. 2022. biomedRxiv.202211.00002
Text2DT: 面向临床诊疗文本的决策规则抽取技术
通讯作者: 王晓玲, xlwang@cs.ecnu.edu.cn
DOI:10.12201/bmr.202211.00002
Text2DT: Decision rule extraction technology for clinical medical texts
Corresponding author: 王晓玲, xlwang@cs.ecnu.edu.cn
-
摘要:诊疗决策规则通常被建模为诊疗决策树,是临床决策支持系统的核心。然而目前诊疗决策树的构建依赖于耗时费力的专家注释,这阻碍了大型临床决策支持系统的构建、维护和发展。本文提出了一个全新的信息抽取任务:从临床诊疗文本中自动抽取诊疗决策树。本文构建了学界第一个从临床诊疗文本到诊疗决策树的数据集,其中临床诊疗文本是指诊疗指南与教科书中蕴含诊疗决策规则的文本,诊疗决策树则建模了文本中的诊疗决策规则。基于此数据集,本文设计了决策树抽取方法并与传统方法进行了对比,为未来诊疗决策树的自动抽取奠定了基础。
Abstract: The medical decision rules are often modelled as medical decision trees (MDTs), which are the core of a clinical decision support system. However, the current construction of MDTs relies heavily on time-consuming and laborious expert annotations, which hinders the construction, maintenance, and development of clinical decision support systems. This paper proposes a novel information extraction task: automatic extraction of MDTs from clinical medical texts. This paper constructs the first Text-to-MDT dataset, in which text refers to the medical text of clinical practice guidelines and medical textbooks that contain medical decision rules, and the MDTs model the medical decision rules in the text. Based on this dataset, this paper designs a decision tree extraction method and compares it with traditional methods, laying the foundation for the automatic extraction of MDTs.
Key words: medical decision tree; natural language process; information extraction; deep learning提交时间:2022-11-09
版权声明:作者本人独立拥有该论文的版权,预印本系统仅拥有论文的永久保存权利。任何人未经允许不得重复使用。 -
图表
-
段永璇, 甄天民, 张睿, 席敏, 赵悟, 岳媛. 基于医学信息的智能化决策服务研究. 2021. doi: 10.12201/bmr.202110.00014
刘忠禹, 姚佳, 俞思伟, 郑子强, 兰蓝, 殷晋. 基于知识抽取的医疗纠纷事件分析及对策研究. 2021. doi: 10.12201/bmr.202110.00022
顾耀文, 李姣. 基于无监督深度学习的电子健康档案数据挖掘技术研究进展. 2021. doi: 10.12201/bmr.202104.00013
李子昊, 陈漠沙, 马镇新, 尹康平, 童毅轩, 谭传奇, 郎珍珍, 汤步洲. 中文医疗因果关系抽取数据集 CMedCausal. 2022. doi: 10.12201/bmr.202211.00004
陈剑秋, 黄晓芳, 周祖宏, 廖敏. 基于BERT的电子病历实体关系联合抽取研究. 2022. doi: 10.12201/bmr.202206.00003
刘庆金, 王锐, 苗元青. 基于深度学习的无症状心肌缺血动态心电图智能检测研究. 2021. doi: 10.12201/bmr.202111.00009
车贺宾, 徐洪丽. 构建医学大数据应用实践中临床数据处理流程规范. 2021. doi: 10.12201/bmr.202109.00002
由丽萍, 王世钰, 李朝翻. 基于框架语义分析的社交网络药品不良事件抽取*. 2022. doi: 10.12201/bmr.202211.00006
庞震, 顾继昱, 吴宇飞, 颜仕星, 李汪洋, 孙越. 一种基于三元组抽取策略解决中医诊治高血压医疗实体提取问题的研究. 2021. doi: 10.12201/bmr.202107.00015
-
序号 提交日期 编号 操作 1 2022-08-31 bmr.202211.00002V1
下载 -
-
公开评论 匿名评论 仅发给作者
引用格式
访问统计
- 阅读量:972
- 下载量:18
- 评论数:0