XTuner 微调个人小助手认知任务

原创于 2024-10-30 10:22:44 发布 · 322 阅读

·

6

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#1024程序员节

一、基础任务

步骤 0. 使用 conda 先构建一个 Python-3.10 的虚拟环境
在这里插入图片描述
步骤 1. 安装 XTuner
时间需要很久，在等待过程中，可以先进行后面的修改数据工作

在这里插入图片描述

修改提供的数据
这是原始的微调数据，是llm的对话语料，定义这个机器人来写代码，讲冷笑话
在这里插入图片描述
步骤 1. 创建修改脚本
代码的主要功能是对关键词进行替换，把尖米助手换成waiting助手

步骤 2. 执行脚本

步骤 3. 查看数据

训练启动

步骤 0. 复制模型
在InternStudio开发机中的已经提供了微调模型，可以直接软链接即可。

步骤 1. 修改 Config
在这里插入图片描述
步骤 2. 启动微调

在这里插入图片描述

步骤 3. 权重转换
1536 epoch的权重文件有问题，这里就换成保存1500epoch的
在这里插入图片描述
文件夹结构

步骤 4. 模型合并
在这里插入图片描述

模型 WebUI 对话
可以看到，自我认知修改成功，也能说冷笑话

在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。