惠婷, 申艳妮. 面向语义的电子病历智能文本检索技术的研究与设计. 2025. biomedRxiv.202512.00082
面向语义的电子病历智能文本检索技术的研究与设计
通讯作者: 申艳妮, 17791972986@163.com
DOI:10.12201/bmr.202512.00082
Research and Design of Intelligent Text Retrieval Technology for Semantic Electronic Medical Records
Corresponding author: SHEN Yanni, 17791972986@163.com
-
摘要:目的/意义 传统检索方式面对医学领域特有的语义复杂性、上下文依赖性和非结构化数据时表现不佳,无法满足精准医疗和智慧医学研究对高效、智能信息检索的迫切需求。为此,研究拟建立面向语义的智能化检索方法,在电子病历文本数据中实现语义互操作,提升检索效能。方法/过程 研究将增强传统关键词检索与基于深度学习的高阶语义匹配检索相结合。首先通过在传统关键词检索功能的基础上引入医学专业术语库,建立词语层次检索扩展机制提高检索性能;其次,基于语义相似性策略建立语义向量表征模型,抽取电子病历语义向量并形成语义检索库,通过语义对照获取推荐检索结果;最后,结合关键词扩展检索与语义对照结果生成最终检索结论。结果/结论 通过测试,面向语义的智能病历检索方法可实现多层次、多角度电子病历文本检索功能,与传统关键词、知识图谱检索方式比较,可显著提高文本语义检索准确率(p<0.05)及查全率(p<0.05),为实现高效、精准的电子病历智能检索提供了可行性方案。
Abstract: Objective/Significance Traditional retrieval methods perform poorly when faced with the semantic complexity, context dependency, and unstructured data unique to the medical field, failing to meet the urgent demand for efficient and intelligent information retrieval in precision medicine and smart medical research. To address this, the study aims to establish a semantic-oriented intelligent retrieval method to achieve semantic interoperability in electronic medical record (EMR) text data and enhance retrieval efficiency. Method/Process The study combines enhanced traditional keyword retrieval with deep learning-based high-order semantic matching retrieval. First, by introducing a medical terminology database into the traditional keyword retrieval function, a hierarchical retrieval extension mechanism is established to improve retrieval performance. Second, a semantic vector representation model is developed based on semantic similarity strategies, extracting EMR semantic vectors to form a semantic retrieval database, which generates recommended retrieval results through semantic comparison. Finally, the keyword expansion retrieval and semantic comparison results are combined to produce the final retrieval conclusions. Result/Conclusion Testing demonstrates that the semantic-oriented intelligent EMR retrieval method enables multi-level, multi-angle text retrieval functionality. Compared to traditional keyword and knowledge graph retrieval methods, it significantly improves text semantic retrieval accuracy (p<0.05) and recall rate (p<0.05), providing a feasible solution for efficient and precise EMR intelligent retrieval.
Key words: Electronic medical records; Intelligent retrieval; Deep learning; Semantic analysis; Semantic retrieval提交时间:2025-12-31
版权声明:作者本人独立拥有该论文的版权,预印本系统仅拥有论文的永久保存权利。任何人未经允许不得重复使用。 -
图表
-
邓兰, 杜同舟. 一种高效安全的密文电子病历多关键字检索方案. 2021. doi: 10.12201/bmr.202105.00008
龚宇新, 李俊豪, 向菲, 张兰. “AIGC+医学文献检索”课程优化设计与实践路径研究. 2025. doi: 10.12201/bmr.202504.00037
顾耀文, 李姣. 基于无监督深度学习的电子健康档案数据挖掘技术研究进展. 2021. doi: 10.12201/bmr.202104.00013
盖彦蓉, 张云秋, 张慧, 李晨程, 卢浚睿. 面向知识抽取的真实世界中文电子病历数据质量分析与治理对策研究. 2025. doi: 10.12201/bmr.202511.00077
陈婕卿, 竹志超, 张锋, 曾可, 姜会珍, 程振宁. 面向知识图谱构建的中文电子病历命名实体识别方法研究. 2023. doi: 10.12201/bmr.202312.00011
牛宇翔, 葛珊衫, 王力华. 从传统NLP到大语言模型电子病历生成技术的探索与研究. 2024. doi: 10.12201/bmr.202412.00080
宫小翠, 安新颖. 面向医学科技文献分类的语义特征增强研究*. 2024. doi: 10.12201/bmr.202411.00088
邓嘉乐, 胡振生, 连万民, 华赟鹏, 周毅. 基于RoBERTa-CRF的肝癌电子病历实体识别研究. 2023. doi: 10.12201/bmr.202303.00027
郭维嘉. 中文电子病历数据元抽取方法. 2024. doi: 10.12201/bmr.202404.00038
由丽萍, 王世钰, 李朝翻. 基于框架语义分析的社交网络药品不良事件抽取*. 2022. doi: 10.12201/bmr.202211.00006
-
序号 提交日期 编号 操作 1 2025-10-09 10.12201/bmr.202512.00082V1
下载 -
-
公开评论 匿名评论 仅发给作者
引用格式
访问统计
- 阅读量:18
- 下载量: 0
- 评论数:0

登录
注册




京公网安备