File tree Expand file tree Collapse file tree 1 file changed +4
-4
lines changed Expand file tree Collapse file tree 1 file changed +4
-4
lines changed Original file line number Diff line number Diff line change @@ -82,7 +82,7 @@ python -c "import torch; print('CUDA是否可用:', torch.cuda.is_available());"
82
82
83
83
- 项目默认去除了数据中的手机号、身份证号、邮箱、网址。还在` settings.jsonc ` 中提供了一个禁用词词库` blocked_words ` ,可以自行添加需要过滤的词句(会默认去掉包括禁用词的整句)。
84
84
> [ !IMPORTANT]
85
- > 请一定注意保护个人隐私,不要泄露个人信息!
85
+ > 🚨 请一定注意保护个人隐私,不要泄露个人信息!
86
86
87
87
- 执行以下命令对数据进行处理,可以根据自己的聊天风格修改settings.jsonc的` make_dataset_args ` 。
88
88
``` bash
@@ -135,7 +135,7 @@ weclone-cli server
135
135
weclone-cli server
136
136
weclone-cli test-model
137
137
```
138
- ## 微调效果
138
+ ## 🖼️ 微调效果
139
139
使用Qwen2.5-14B-Instruct模型,大概3万条处理后的有效数据,loss降到了3.5左右的效果。
140
140
<details >
141
141
<summary >截图</summary >
@@ -148,7 +148,7 @@ weclone-cli test-model
148
148
</details >
149
149
150
150
151
- ## 部署到聊天机器人
151
+ ## 🤖 部署到聊天机器人
152
152
153
153
[ AstrBot] ( https://github.com/AstrBotDevs/AstrBot ) 是易上手的多平台 LLM 聊天机器人及开发框架 ✨ 平台支持 QQ、QQ频道、Telegram、微信、企微、飞书。
154
154
@@ -184,7 +184,7 @@ weclone-cli test-model
184
184
项目使用` pytest ` 测试,` pyright ` 检查类型,` ruff ` 检查代码格式。
185
185
186
186
187
- ## 免责声明
187
+ ## ⚠️ 免责声明
188
188
> [ !CAUTION]
189
189
> 请勿用于非法用途,否则后果自负。
190
190
<details>
You can’t perform that action at this time.
0 commit comments