车纯凯, 李亚子. 基于混合检索增强生成Hybrid RAG的卫生统计年鉴问答系统的研究与构建. 2026. biomedRxiv.202604.00082
基于混合检索增强生成Hybrid RAG的卫生统计年鉴问答系统的研究与构建
通讯作者: 李亚子, li.yazi@imicams.ac.cn
DOI:10.12201/bmr.202604.00082
Research and Development of a Hybrid Retrieval-Augmented Generation (RAG) Question-Answering System for the Health Statistical Yearbook
Corresponding author: liyazi, li.yazi@imicams.ac.cn
-
摘要:目的:利用LangChain框架与大语言模型相结合并搭建本地知识库创建一个问答系统,旨在帮助用户以自然语言方式查询卫生统计年鉴,简化查询流程,降低查询难度。方法:基于2018年至2023年中国卫生健康统计年鉴数据,构建卫生统计年鉴知识图谱与本地知识库,通过混合检索增强生成Hybrid RAG提升大语言模型在卫生统计年鉴知识问答方面的能力。结果:构建卫生统计年鉴知识图谱并搭建结合知识图谱和向量检索的卫生统计年鉴问答系统(HSY-QA),设计了一套单事实抽取、描述总结、多事实比较、多指标计算、融合回答五个维度的问答对基准测试集。经评估,卫生统计年鉴问答系统(HSY-QA)问答准确率达92.4%,相较于Light RAG问答准确率提升了12.8%,尤其在多指标计算与融合问答等复杂场景中表现突出,验证了本系统在专业领域问答中的有效性。
Abstract: Objective: To simplify and democratize queries against the Health Statistical Yearbook, we integrate the LangChain framework with a large language model and a local knowledge base, allowing users to interrogate the yearbook in plain language and markedly lowering the threshold for effective use.
Key words: large; language model, knowledge; graph, retrieval-augmented; generation, question-answering; system, China; Health Statistical; Yearbook提交时间:2026-04-10
版权声明:作者本人独立拥有该论文的版权,预印本系统仅拥有论文的永久保存权利。任何人未经允许不得重复使用。 -
图表
-
杨亚洲, 郑石林, 周小毅, 章施静, 赵坚. 基于知识图谱的HIV防治大模型RAG问答系统构建研究. 2025. doi: 10.12201/bmr.202511.00061
梁乐然, 阎誉豪, 唐跃豪, 练洢彤, 徐倩, 杨猛, 伍家亨, 陈振虎, 刘秀峰. 基于知识图谱和大语言模型的中医药治疗帕金森病智能问答研究. 2026. doi: 10.12201/bmr.202604.00033
牛宇翔, 葛珊衫, 王力华. 从传统NLP到大语言模型电子病历生成技术的探索与研究. 2024. doi: 10.12201/bmr.202412.00080
吕婷钰, 李晓瑛, 刘宇炀, 杜晋华, 李心怡, 罗妍, 唐小利, 任慧玲, 刘辉, 尹浩. 中文医学知识大模型问答语料数据集构建研究. 2024. doi: 10.12201/bmr.202404.00002
吴宏, 胡军, 陈尔真, 董晨杰, 李建华, 叶琪. 基于大模型的医疗质控应用系统构建. 2025. doi: 10.12201/bmr.202503.00004
李日丽, 潘嘉明, 容世强, 孙晓翠, 易法令. 知识图谱与大语言模型融合在糖尿病健康管理中的应用进展. 2025. doi: 10.12201/bmr.202508.00035
赵昀彤, 毛阿燕. 基于EOC模型的公共卫生事件知识图谱本体构建研究. 2026. doi: 10.12201/bmr.202602.00051
杨丽, 马乐尧, 汪伦, 李露琪, 侯丽. 面向合理用药的药物知识图谱构建及应用研究. 2025. doi: 10.12201/bmr.202511.00051
方攀, 曹宇汀, 丁子啸, 张顺, 李兆融, 曾震宇, 朱睿. 老年主动健康知识图谱构建和应用探索. 2023. doi: 10.12201/bmr.202303.00038
申艳妮, 惠婷. 基于大语言模型的医疗机构图像智能化归档系统设计. 2026. doi: 10.12201/bmr.202602.00047
-
序号 提交日期 编号 操作 1 2026-01-12 10.12201/bmr.202604.00082V1
下载 -
-
公开评论 匿名评论 仅发给作者
引用格式
访问统计
- 阅读量:8
- 下载量: 0
- 评论数:0

登录
注册




京公网安备