王耀国, 唐诗诗, 刘泓泽, 安雨婷, 周毅. 基于本地大模型的骨质疏松专病数据库构建流程优化研究. 2024. biomedRxiv.202410.00002
基于本地大模型的骨质疏松专病数据库构建流程优化研究
通讯作者: 周毅, zhouyi@mail.sysu.edu.cn
DOI:10.12201/bmr.202410.00002
Research on optimization of osteoporosis disease database construction process based on local large model
Corresponding author: zhouyi, zhouyi@mail.sysu.edu.cn
-
摘要:目的 利用本地大模型结合本地知识库优化骨质疏松专病数据库构建流程,减小医疗数据泄露风险。方法 首先收集相关临床研究文献和业务数据信息并构建本地知识库,然后基于本地化大模型应用架构,使用本地知识库和指标平台对本地大模型进行提示工程,最后,基于本地化大模型应用架构图形问答界面和编程接口,通过自然语言问询和编程方式,引导本地大模型生成骨质疏松专病数据库字段集和数据生产。结果 本地化大模型结合本地知识库,可以总结骨质疏松既往研究中涉及的字段,有效提高骨质疏松专病数据库构建效率和质量,但处理结果需要人工核查。同时基于本地大模型可以实现多模态数据的本地化处理,减小医疗数据泄露风险。
Abstract: Objective Utilize local large models combined with local knowledge base to optimize the osteoporosis disease database construction process and reduce the risk of medical data leakage. Methods First, relevant clinical research literature and business data information are collected and a local knowledge base is built. Then, based on the localized big model application architecture, the local knowledge base and indicator platform are used to perform prompt engineering on the local big model. Finally, based on the graphical question-and-answer interface and programming interface of the localized big model application architecture, natural language queries and programming methods are used to guide the local big model to generate osteoporosis disease database field sets and data production. Results The localized large model combined with the local knowledge base can summarize the fields involved in previous osteoporosis research and effectively improve the efficiency and quality of building a database for osteoporosis, but the processing results need to be manually verified. At the same time, based on the local large model, the local processing of multimodal data can be achieved, reducing the risk of medical data leakage.
Key words: Disease-specific database; large model; local deployment; natural language understanding; unstructured data processing提交时间:2024-10-03
版权声明:作者本人独立拥有该论文的版权,预印本系统仅拥有论文的永久保存权利。任何人未经允许不得重复使用。 -
图表
-
张亚男. 基于NLP构建病历后结构化专病数据库的探索和实践. 2024. doi: 10.12201/bmr.202406.00007
连万民. 基于数据治理的脑血管专病数据库建设实践. 2022. doi: 10.12201/bmr.202210.00011
龙思哲, 张敦明, 吴震天, 黎鹏安, 王毅, 周毅, 张武军. 基于数据治理的专病数据库建设实践. 2022. doi: 10.12201/bmr.202207.00012
刘迷迷, 杜国霞, 周毅, 吴斌, 吴晓瑛. 肝硬化专病数据库建设与应用研究. 2021. doi: 10.12201/bmr.202104.00014
车贺宾, 徐洪丽. 构建医学大数据应用实践中临床数据处理流程规范. 2021. doi: 10.12201/bmr.202109.00002
车贺宾, 何昆仑, 吴欢, 陈媛媛, 王万玲, 王飞, 刘立永. 面向科研的临床结构化数据预处理方法研究. 2024. doi: 10.12201/bmr.202411.00076
牛宇翔, 葛珊衫, 王力华. 从传统NLP到大语言模型电子病历生成技术的探索与研究. 2024. doi: 10.12201/bmr.202412.00080
吕婷钰, 李晓瑛, 刘宇炀, 杜晋华, 李心怡, 罗妍, 唐小利, 任慧玲, 刘辉, 尹浩. 中文医学知识大模型问答语料数据集构建研究. 2024. doi: 10.12201/bmr.202404.00002
张百平. 从EMR系统关系数据库构建患者诊疗图谱. 2021. doi: 10.12201/bmr.202110.00031
余莎莎, 李汉民, 肖辉. 医院信息系统数据库云平台及零数据丢失建设实践. 2021. doi: 10.12201/bmr.202110.00028
-
-
公开评论 匿名评论 仅发给作者
引用格式
推荐引用格式
访问统计
- 阅读量:230
- 下载量: 0
- 评论数:0