
Llava学习相关
文章平均质量分 72
溯源006
以出世之心,行入世之事。躬耕于人工智能领域,特别是热衷于通用人工智能。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
vscode调试deepspeed的方法之一(无需调整脚本)
摘要:本文介绍在VSCode中调试DeepSpeed训练脚本的方法。首先需设置NCCL环境变量解决RTX 4000显卡兼容性问题,配置HF镜像源。调试步骤包括:1)创建launch.json调试配置文件;2)添加DeepSpeed调试配置,指定单GPU运行、程序路径和训练参数;3)设置关键环境变量如CUDA_VISIBLE_DEVICES=0强制单卡调试;4)启动调试会话。该方法通过VSCode集成终端实现DeepSpeed训练过程的断点调试,特别适合LLaVA等大模型训练场景。(149字)原创 2025-06-07 10:38:46 · 268 阅读 · 0 评论 -
LLaVa官网文档翻译
LLaVa是一个开源的多模态聊天机器人,基于LlamA/Vicuna模型,通过GPT生成的多模态指令数据进行微调训练。该模型利用Transformer架构,在视觉指令调优方面取得突破性进展,仅使用120万公开数据就在11个基准测试中达到最优表现。LLaVa采用全连接的视觉-语言跨模态连接器,通过简单修改(如使用CLIP-ViT-L-336px和添加学术VQA数据)显著提升性能。模型支持批量生成计算(建议设置padding_side="left"),但处理多图像提示时可能不够准确。使用前需原创 2025-05-28 16:42:47 · 1013 阅读 · 0 评论