使用Shell脚本微调大型模型**

最新推荐文章于 2025-08-20 14:01:41 发布

原创

最新推荐文章于 2025-08-20 14:01:41 发布 · 616 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#微调脚本 #大模型微调 #人工智能

示例：使用Shell脚本微调大型模型

假设我们有一个数据集，要在ResNet50模型基础上微调以进行分类任务。

1. 准备数据和环境

在准备数据时，通常需要将数据集组织成训练集和验证集，并确保数据路径和格式符合模型的输入要求。

# 创建训练数据和验证数据的目录
mkdir data
mkdir data/train
mkdir data/val

# 将数据集拷贝到相应目录（示例中假设数据集已经准备好）
cp path_to_train_data/* data/train/
cp path_to_val_data/* data/val/

2. 编写Shell脚本

创建一个Shell脚本（例如train.sh），用于设置训练参数、启动训练过程和保存模型。

#!/bin/bash

# 设置训练参数
epochs=10
batch_size=32
learning_rate=0.001
model_dir="saved_models/resnet50_finetuned"

# 训练命令
python train.py \
    --epochs $epochs \
    --batch_size $batch_size \
    --learning_rate $learning_rate \
    --model_dir $model_dir \
    --train_data_dir "data/train" \
    --val_data_dir "data/val"

3. 编写训练脚本（train.py）

在Shell脚本中调用Python脚本（例如train.py），用于定义模型、训练循环、评估和保存模型。

import tensorflow as tf
from tensorflow.keras.applications import ResNet50
from tensorflow.keras.layers

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Ai玩家hly

关注关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

人工智能_大模型009_CPU微调ChatGLM大模型_有监督学习_使用P-Tuning v2_CPU不支持半精度计算_GPU才支持_无法在CPU下微调_微调_003---人工智能工作笔记0144

添柴程序猿的专栏

02-26

304

这里该一下模型的位置:--model_name_or_path 然后PRE_SEQ_LEN从128改成了8,然后最后那个--quantization_bit是用int4加载量化模型,下载以后放到这里就行,数据格式在002中也有说明了,这次我们微调,chatglm-6b模型,不弄量化后的int4了。然后准备数据,因为原来的训练数据太多了,如果是从官网下载的话,可以参考002,现在我们自己做一些数据。002节微调的时候,没有成功,继续,不知道是不是因为CPU的原因,没有微调成功.

使用shell命令awk处理大模型日志，进行loss曲线画图

记录个人日常所学所思

07-09

427

使用awk命令进行大模型日志处理，提取loss值进行loss曲线画图

参与评论您还未登录，请先登录后发表或查看评论

推荐一个好用的命令行工具ShellGPT

xindoo

04-30

3272

由于文章篇幅的原因，我挑选了大部内容做了介绍，当然ShellGPT还有一些其他的细节需要大家自行去探索。其所有的参数都可以通过分类参数类型描述默认值基本选项prompt[PROMPT]用于生成完成的提示。--modelTEXT使用的大型语言模型。生成输出的随机性。0.0--top-p限制最高可能的token。1.0--md美化markdown输出。md--editor打开$EDITOR来提供提示。no-editor--cache缓存完成结果。cache--version显示版本。

llama-factory 系列教程 (六)，linux shell 脚本自动实现批量大模型的训练、部署与评估

jieshenai的博客

07-31

2127

使用linux shell 脚本，自动化批量处理大模型的微调、部署与评估。无需人工逐个交互处理，减少人工的精力和时间。

shell模型训练脚本

qq_46074778的博客

06-20

409

远程服务器A的IP地址和目标路径。# 将训练好的模型发送回远程服务器A。# 远程机器A的IP地址和文件路径。# 从远程机器A下载数据文件到本地。# 本地机器的训练模型路径。# 将模型设置为评估模式。# 加载数据到训练模型。# 保存训练好的模型。

Shell 在训练模型的时候自动保存训练文件和模型到指定文件夹

Golden-sun的博客

03-16

593

在进行深度学习训练的过程中，往往会跑很多实验，这就导致有的实验设置会忘记或者记混淆，我们最好把train test model 的代码都copy一遍到指定文件夹中，这样后面检查也方便。用shell指令保存文件 #!/bin/sh GRUB_CMDLINE_LINUX="iommu=soft" export CUDA_VISIBLE_DEVICES=1,2,3,4 save_dir=./saved_distill_128_fea_ctx if [ ! -d $save_dir ];then #判断文

模型训练之后台训练方法，python、shell，nohup、tmux；

weixin_43488255的博客

03-18

294

在日常模型训练时都习惯在终端直接bash run.sh训练模型，这是最直接也最简单的方法；但有时候各种原因需要关机操作机，又或者无法避免 ssh工具吊针(xshell),所以训练到一半的模型不得不重新开始训练，相当浪费时间；使用方法，与shell脚本结合，将日志输出到test.log中，可以使用tail -fn 10 test.log 动态查看日志(打印最后10行日志)；就会进入mysession的后台，从而可以进行正常训练 ./run.sh，无需再用nohup；

ShellGPT 项目使用教程

gitblog_00112的博客

08-09

606

ShellGPT 项目使用教程 1. 项目的目录结构及介绍 ShellGPT 项目的目录结构如下： shell_gpt/ ├── README.md ├── setup.py ├── shell_gpt/ │ ├── __init__.py │ ├── main.py │ ├── config.py │ ├── utils.py │ └── ... └── tests/ ...

基于Python和Shell的byzer-llm简单高效预训练微调服务设计源码

09-30

sh文件则是Shell脚本，用于完成自动化的部署与执行任务；gitignore文件则用于指定在使用Git版本控制系统时忽略的文件模式。整个项目总共包含540个文件，这些文件共同构成了一个完整的生态系统，涵盖了从项目搭建、...

基于Python和Shell的yolov10目标检测模型设计源码

10-01

该项目是一个基于Python和Shell脚本开发的yolov10目标检测模型源码集，旨在为用户提供高效的目标检测解决方案。整个项目包含318个文件，涵盖了广泛的技术领域，包括编程、配置、脚本编写等。项目中的Python脚本是...

fine-tuning-on-stanford-cars-dataset:使用 Caffe，微调斯坦福汽车数据集上的各种预训练模型

07-22

5. **训练模型**：使用Caffe的`train_val.prototxt`和`solver.prototxt`文件开始训练过程。训练过程中，监控损失函数和准确率，以便调整超参数并避免过拟合。 6. **验证与测试**：在验证集上定期评估模型性能，以...

ShellGPT实战指南：用AI命令行神器提升开发效率

运维&陈同学的博客

02-28

792

现在，当我们运行 Ollama 后端时，我们需要配置 ShellGPT 以使用它。为了与本地 LLM 后端通信，ShellGPT 利用。现在您可以将 ShellGPT 与 Ollama 后端一起使用。初始API Key的時候隨便填個字串。根据电脑配置安装对应的模型。

最近，大模型岗位爆了。。。

2301_82275412的博客

04-29

1355

重磅消息，国资委打响了国内AI第一枪！这意味着传统行业又迎来了一次大洗牌，现在国内头部人工智能公司已经开始用AI数字人助力各行各业，。除此之外，知名大厂也都在布局AI市场。懂的程序员年薪已经翻到风口之下，与其焦虑被行业淘汰，不如先人一步掌握 AI 大模型技术。为帮助大家提升竞争力，为了帮助普通程序员享受时代红利，掌控AI大模型技术，成为超级个体，给大家带来了AI大模型全套资料。

Xshell使用及训练深度学习模型；PyCharm连接服务器

qq_36226586的博客

09-06

4226

Xshell

模型训练中的常用脚本

说文科技，做有态度的研究。

01-10

913

删除模型的脚本

用自己的语料库基于aishell脚本训练chain模型。

qq_35088451的博客

11-05

934

详细步骤如下： 1，音频准备，请不同的人录制相同的音频数据。这里是8人各自录制50句常用语，每句常用语录制成一个.wav音频文件。 2，相关软件对音频进行格式转换，需转换成单通道，采样率16kHz，.wav格式。转换工具：格式工厂。 3，在s5目录同级创建目录c1，将s5目录下 conf local steps utils cmd.sh path.sh run.sh 复制到c1目录下。结果如下： 4，在c1目录下创建 sourse_data目录，sourse_data目录下创建data_aishell和r

Bot 流量“假阳性”调优笔记

@云安全小杜

08-19

642

这次实验最大的收获是：与其在规则里“猜”爬虫长什么样，不如把判断逻辑外置到一个能持续学习的边缘节点。群联的清洗中心提供了实时封禁 API，让我们可以把模型结果直接落地，而不用改一行业务代码——这比传统“先打日志、再人工加黑名单”的节奏快了整整一个量级。

XR（AR/VR/MR）芯片方案，Soc VS “MCU+协处理器”？

houdou112358的博客

08-20

597

本文分析了当前VR/AR/MR设备的主流芯片方案，主要分为SoC（系统级芯片）和MCU+协处理器两种架构。高端VR/MR设备普遍采用高通XR系列或苹果M系列等高性能SoC，而轻量级AR/AI眼镜则多使用低功耗SoC或MCU+AI协处理器方案。文章详细比较了不同设备类型的芯片需求，并介绍了高通、苹果、联发科等主要芯片厂商的XR产品线及其特点，最后总结了不同应用场景下的最佳芯片选择方案。

门控循环单元（GRU, Gated Recurrent Unit）