XTuner 微调个人小助手认知任务

一、基础任务

步骤 0. 使用 conda 先构建一个 Python-3.10 的虚拟环境
在这里插入图片描述
步骤 1. 安装 XTuner
时间需要很久,在等待过程中,可以先进行后面的修改数据工作

在这里插入图片描述

修改提供的数据
这是原始的微调数据,是llm的对话语料,定义这个机器人来写代码,讲冷笑话
在这里插入图片描述
步骤 1. 创建修改脚本
代码的主要功能是对关键词进行替换,把尖米助手换成waiting助手
在这里插入图片描述
步骤 2. 执行脚本
在这里插入图片描述
步骤 3. 查看数据
在这里插入图片描述
训练启动

步骤 0. 复制模型
在InternStudio开发机中的已经提供了微调模型,可以直接软链接即可。

步骤 1. 修改 Config
在这里插入图片描述
步骤 2. 启动微调
在这里插入图片描述

在这里插入图片描述

步骤 3. 权重转换
1536 epoch的权重文件有问题,这里就换成保存1500epoch的
在这里插入图片描述
文件夹结构
在这里插入图片描述

步骤 4. 模型合并
在这里插入图片描述
在这里插入图片描述
模型 WebUI 对话
可以看到,自我认知修改成功,也能说冷笑话

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值