• 国家药监局综合司 国家卫生健康委办公厅
  • 国家药监局综合司 国家卫生健康委办公厅

面向语义的电子病历智能文本检索技术的研究与设计

通讯作者: 申艳妮, 17791972986@163.com
DOI:10.12201/bmr.202512.00082
声明:预印本系统所发表的论文仅用于最新科研成果的交流与共享,未经同行评议,因此不建议直接应用于指导临床实践。

Research and Design of Intelligent Text Retrieval Technology for Semantic Electronic Medical Records

Corresponding author: SHEN Yanni, 17791972986@163.com
  • 摘要:目的/意义 传统检索方式面对医学领域特有的语义复杂性、上下文依赖性和非结构化数据时表现不佳,无法满足精准医疗和智慧医学研究对高效、智能信息检索的迫切需求。为此,研究拟建立面向语义的智能化检索方法,在电子病历文本数据中实现语义互操作,提升检索效能。方法/过程 研究将增强传统关键词检索与基于深度学习的高阶语义匹配检索相结合。首先通过在传统关键词检索功能的基础上引入医学专业术语库,建立词语层次检索扩展机制提高检索性能;其次,基于语义相似性策略建立语义向量表征模型,抽取电子病历语义向量并形成语义检索库,通过语义对照获取推荐检索结果;最后,结合关键词扩展检索与语义对照结果生成最终检索结论。结果/结论 通过测试,面向语义的智能病历检索方法可实现多层次、多角度电子病历文本检索功能,与传统关键词、知识图谱检索方式比较,可显著提高文本语义检索准确率(p<0.05)及查全率(p<0.05),为实现高效、精准的电子病历智能检索提供了可行性方案。

    关键词: 电子病历;智能检索;深度学习;语义分析;语义检索

     

    Abstract: Objective/Significance Traditional retrieval methods perform poorly when faced with the semantic complexity, context dependency, and unstructured data unique to the medical field, failing to meet the urgent demand for efficient and intelligent information retrieval in precision medicine and smart medical research. To address this, the study aims to establish a semantic-oriented intelligent retrieval method to achieve semantic interoperability in electronic medical record (EMR) text data and enhance retrieval efficiency. Method/Process The study combines enhanced traditional keyword retrieval with deep learning-based high-order semantic matching retrieval. First, by introducing a medical terminology database into the traditional keyword retrieval function, a hierarchical retrieval extension mechanism is established to improve retrieval performance. Second, a semantic vector representation model is developed based on semantic similarity strategies, extracting EMR semantic vectors to form a semantic retrieval database, which generates recommended retrieval results through semantic comparison. Finally, the keyword expansion retrieval and semantic comparison results are combined to produce the final retrieval conclusions. Result/Conclusion Testing demonstrates that the semantic-oriented intelligent EMR retrieval method enables multi-level, multi-angle text retrieval functionality. Compared to traditional keyword and knowledge graph retrieval methods, it significantly improves text semantic retrieval accuracy (p<0.05) and recall rate (p<0.05), providing a feasible solution for efficient and precise EMR intelligent retrieval.

    Key words: Electronic medical records; Intelligent retrieval; Deep learning; Semantic analysis; Semantic retrieval

    提交时间:2025-12-31

    版权声明:作者本人独立拥有该论文的版权,预印本系统仅拥有论文的永久保存权利。任何人未经允许不得重复使用。
  • 图表

  • 邓兰, 杜同舟. 一种高效安全的密文电子病历多关键字检索方案. 2021. doi: 10.12201/bmr.202105.00008

    龚宇新, 李俊豪, 向菲, 张兰. “AIGC+医学文献检索”课程优化设计与实践路径研究. 2025. doi: 10.12201/bmr.202504.00037

    顾耀文, 李姣. 基于无监督深度学习的电子健康档案数据挖掘技术研究进展. 2021. doi: 10.12201/bmr.202104.00013

    盖彦蓉, 张云秋, 张慧, 李晨程, 卢浚睿. 面向知识抽取的真实世界中文电子病历数据质量分析与治理对策研究. 2025. doi: 10.12201/bmr.202511.00077

    陈婕卿, 竹志超, 张锋, 曾可, 姜会珍, 程振宁. 面向知识图谱构建的中文电子病历命名实体识别方法研究. 2023. doi: 10.12201/bmr.202312.00011

    牛宇翔, 葛珊衫, 王力华. 从传统NLP到大语言模型电子病历生成技术的探索与研究. 2024. doi: 10.12201/bmr.202412.00080

    宫小翠, 安新颖. 面向医学科技文献分类的语义特征增强研究*. 2024. doi: 10.12201/bmr.202411.00088

    邓嘉乐, 胡振生, 连万民, 华赟鹏, 周毅. 基于RoBERTa-CRF的肝癌电子病历实体识别研究. 2023. doi: 10.12201/bmr.202303.00027

    郭维嘉. 中文电子病历数据元抽取方法. 2024. doi: 10.12201/bmr.202404.00038

    由丽萍, 王世钰, 李朝翻. 基于框架语义分析的社交网络药品不良事件抽取*. 2022. doi: 10.12201/bmr.202211.00006

  • 序号 提交日期 编号 操作
    1 2025-10-09

    10.12201/bmr.202512.00082V1

    下载
  • 公开评论  匿名评论  仅发给作者

引用格式

惠婷, 申艳妮. 面向语义的电子病历智能文本检索技术的研究与设计. 2025. biomedRxiv.202512.00082

访问统计

  • 阅读量:18
  • 下载量: 0
  • 评论数:0

Email This Article

User name:
Email:*请输入正确邮箱
Code:*验证码错误