• 国家药监局综合司 国家卫生健康委办公厅
  • 国家药监局综合司 国家卫生健康委办公厅

融合词向量及词属性推理的中文电子病历实体识别方法

通讯作者: 武学鸿, csu.xhwu@mail.csu.edu.cn
DOI:10.12201/bmr.202109.00016
声明:预印本系统所发表的论文仅用于最新科研成果的交流与共享,未经同行评议,因此不建议直接应用于指导临床实践。

A method of recognizing entities from Chinese Electronic Medical Record based on domain word vector combined with word attributes reasoning

Corresponding author: wuxuehong, csu.xhwu@mail.csu.edu.cn
  • 摘要:介绍了基于BiLSTM-CRF基准模型上,融合词向量及词属性的推理机制,实现了中文电子病历命名实体识别模型。通过应用专业领域词向量并结合词属性推理机制的命名实体识别模型对比基准模型,其识别结果的F1值有明显提升。实验结果表明,医学专业领域词向量及词属性推理机制的引入提升了中文电子病历命名实体识别的效果。

    关键词: 专业领域词向量词属性推理机制中文电子病历命名实体识别自然语言处理

     

    Abstract: This paper introduces the reasoning mechanism of integrating word vector and word attribute based on BiLSTM-CRF benchmark model, and realizes the named entity recognition model of Chinese Electronic Medical Record. The overall F1 value of the named entity recognition model using professional domain word vector and word attribute reasoning mechanism is significantly higher than that of the benchmark model. The experimental results also show that the introduction of word attribute reasoning mechanism improves the effect of named entity recognition of Chinese Electronic Medical Records.

    Key words: professional domain word vector; word attribute reasoning; Chinese electronic medical record; named entity recognition; natural language processing

    提交时间:2021-10-12

    版权声明:作者本人独立拥有该论文的版权,预印本系统仅拥有论文的永久保存权利。任何人未经允许不得重复使用。
  • 图表

  • 胡海洋, 赵从朴, 马琏, 姜会珍, 张晶, 朱卫国. 基于注意力机制和DGCNN的中文医疗命名实体识别. 2021. doi: 10.12201/bmr.202102.00004

    孙成浩, 刘芬, 赵峰. 基于区块链技术的电子病历系统研究. 2020. doi: 10.12201/bmr.202007.00012

    赵佳奇, 王晓锋, 樊羽羽, 张 伟, 王慧璇, 李金山. 电子病历数据质量及对策研究. 2020. doi: 10.12201/bmr.202011.00008

    张丽鑫, 孙海霞, 唐明坤, 钱庆. 真实世界电子病历数据评价研究综述. 2021. doi: 10.12201/bmr.202106.00015

    邓兰, 杜同舟. 一种高效安全的密文电子病历多关键字检索方案. 2021. doi: 10.12201/bmr.202105.00008

    徐璐. 某大型三甲医院门急诊电子病历患者自助打印行为特征研究及思考. 2021. doi: 10.12201/bmr.202109.00008

    李健, 杨旭, 倪如暘, 陈莹. 门诊、住院、手术管理一体化设计的日间电子病历系统的建设. 2021. doi: 10.12201/bmr.202110.00023

    李晓瑛, 蔡妙芝, 李军莲, 任慧玲, 冀玉静, 邓盼盼, 夏光辉. 面向文献组织的新冠肺炎知识图谱构建研究. 2020. doi: 10.12201/bmr.202010.00840

    杨豪. 基于自然人群队列的电子数据采集系统建设. 2020. doi: 10.12201/bmr.202007.00011

    陈洞天, 王剑. 澳大利亚全民电子健康档案系统的建设与应用的经验与启示. 2021. doi: 10.12201/bmr.202109.00026

  • 序号 提交日期 编号 操作
    1 2021-09-03

    bmr.202109.00016V1

    下载
  • 公开评论  匿名评论  仅发给作者

引用格式

武学鸿, 杨峰, 李建华, 徐倩. 融合词向量及词属性推理的中文电子病历实体识别方法. 2021. biomedRxiv.202109.00016

推荐引用格式

武学鸿,杨峰,李建华,等.融合词向量及词属性推理的中文电子病历实体识别方法[J].医学信息学杂志,2022,43(7):39-42

访问统计

  • 阅读量:1241
  • 下载量:2
  • 评论数:0

Email This Article

User name:
Email:*请输入正确邮箱
Code:*验证码错误