
大模型
文章平均质量分 70
trycache
缩短“说了”与“做了”的距离是一种不折不扣的执行力,避免“三天打鱼,两天晒网”。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Datawhale X 魔搭 】AI夏令营第四期大模型方向,Task4:源大模型微调实战(持续更新)
LoRA 是通过低秩矩阵分解,在原始矩阵的基础上增加一个旁路矩阵,然后只更新旁路矩阵的参数。参考资料LoRA paper大模型轻量级微调(LoRA):训练速度、显存占用分析【深度学习】混合精度训练与显存分析全网最全-混合精度训练原理1.4 源2.0-2B 微调实战。原创 2024-08-21 10:58:07 · 960 阅读 · 0 评论 -
【Datawhale X 魔搭 】AI夏令营第四期大模型方向,Task3:源大模型RAG实战(持续更新)
检索增强生成(Retrieval Augmented Generation)。定义向量模型类""""""""""""class LLM:""""""prompt = f'背景:{context}\n问题:{question}\n请基于背景,回答问题。else:LLM类的入口是生成函数generate()question: 用户提问,是一个str字符串context: 检索到的上下文信息,是一个List,默认是[],代表没有使用RAG。原创 2024-08-16 23:49:48 · 965 阅读 · 0 评论 -
【Datawhale X 魔搭 】AI夏令营第四期大模型方向,Task2:头脑风暴会,巧灵脑筋急转弯(持续更新)
大模型入门,脑筋急转弯是一种特殊类型的智力游戏,它通常由一系列具有固定答案的有趣问题组成,要求解答者进行非常规的思考。原创 2024-08-13 22:52:08 · 465 阅读 · 0 评论 -
【Datawhale X 魔搭 】AI夏令营第四期AIGC方向,Task1:可图Kolors-LoRA风格AI图片生成入门(持续更新)
在AI模型和数据集中,通常包含一些较大的文件,例如图像或模型参数。Lora权重:上传刚下载的ckpt文件,epoch=0-step=500.ckpt。尤其注意点,完成任务后,记得关闭实例!第五步:进入魔搭社区,创建自己的模型,记得一定要选择公开模型。可以帮助你管理和下载这些大文件,确保你的项目能够顺利运行。最后的脚本,是用来可视化展示生成的8张二次元图片的。模型效果示例:上传刚下载的jpg图片,1.jpg。第四步:魔搭社区上传模型,以下是我上传的模型。分别右键下载这两个文件,后续上传模型要用。原创 2024-08-10 21:56:52 · 635 阅读 · 0 评论 -
【Datawhale X 魔搭 】AI夏令营第四期大模型方向,Task1:智能编程助手(持续更新)
在一个数据驱动的世界里,人工智能的未来应由每一个愿意学习和探索的人共同塑造和掌握。希望这里是你实现AI梦想的起点。第一步:安装git工具,下载Task1任务源代码。第二步:安装Conda(Windows环境)(持续更新...敬请期待)原创 2024-08-10 11:49:55 · 367 阅读 · 0 评论