医学大语言模型（BentSao——本草）

原创

于 2024-11-10 07:45:00 发布 · 1.1k 阅读

·

21

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#语言模型 #人工智能 #自然语言处理

在这里插入图片描述

BentSao开源了经过中文医学指令微调的大语言模型集，包括 Llama、AlpacaChinese、Bloom、活字模型等。基于医学知识图谱以及医学文献，结合 ChatGPT API 构建了中文医学指令微调数据集，并以此对各种基模型进行了指令微调，提高了基模型在医疗领域的问答效果。

一、模型特点

基础模型：
本草建立在开源的llama7b模型基础上。llama模型是一种较为知名的语言模型基础架构，具有一定的语言理解和生成能力，而llama7b则表示该模型具有 70 亿参数，这为本草模型提供了基础的语言处理能力和架构支持。
神经网络架构：类似于大多数大语言模型，“本草”采用神经网络架构，这种架构能够对大量的文本数据进行学习和分析，捕捉语言的语法、语义等信息。神经网络中的神经元通过复杂的连接和计算，对输入的文本进行编码和解码，从而实现对问题的理解和回答的生成。
知识整合：
整合了来自中国医学知识图谱（CMKG）的结构化和非结构化医学知识。中国医学知识图谱包含了丰富的医学信息，如疾病、药物、症状等方面的知识，这些知识的引入使得本草模型能够更好地理解和处理医学相关的问题。
通过利用 ChatGPT 构造了 8000 多个指令数据形成指令数据集，用于监督微调。这种基于指令数据的微调方式可以让模型更好地适应医学领域的问答任务，提高回答的准确性和专业性。
除了医学知识图谱，“本草”还利用医学指南等非结构化的医学知识。这些非结构化的知识来源可以提供更丰富的医学背景信息和临床经验，帮助模型更好地理解医学领域的复杂性和多样性。对于非结构化的文本数据，需要使用自然语言处理技术进行处理，例如文本分词、词性标注、命名实体识别等，以便模型能够有效地理解和利用这些知识。
指令数据集构建与微调：
构建指令数

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。