accelerate==0.25.0
colorlog==6.8.0
datasets==2.15.0
datasketch==1.6.4
fastapi==0.105.0
fastparquet==2023.10.1
fire==0.5.0
jieba==0.42.1
matplotlib==3.8.2
nltk==3.8.1
numpy==1.26.2
opencc_python_reimplemented==0.1.7
pandas==2.1.4
peft==0.6.2
psutil==5.9.6
pyarrow==14.0.1
pydantic==2.5.2
rich==13.7.0
safetensors==0.4.1
sentencepiece==0.1.99
tokenizers==0.15.0
torch==2.1.1
torch_optimizer==0.3.0
tqdm==4.66.1
transformers==4.36.0
trl==0.7.4
ujson==5.8.0
uvicorn==0.24.0.post1
没有合适的资源?快使用搜索试试~ 我知道了~
开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码

共42个文件
py:19个
png:7个
ipynb:4个

1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉

温馨提示
中文对话0.2B小模型(ChatLM-Chinese-0.2B),本项目的目标是整理生成式语言模型的训练流程。开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。
资源推荐
资源详情
资源评论








格式:ipynb 资源大小:36.3KB





格式:pptx 资源大小:8.2MB 页数:120




格式:zip 资源大小:28.3MB

格式:zip 资源大小:276.9MB











格式:pdf 资源大小:4.8MB 页数:103


收起资源包目录




















































共 42 条
- 1
资源评论

- 杨鑫浩2024-03-23资源不错,内容挺好的,有一定的使用价值,值得借鉴,感谢分享。

Java程序员-张凯
- 粉丝: 1w+
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 面对科技平台发展的三大痛点,如何借助AI+数智应用手段实现突破与升级?.docx
- 企业科技创新服务平台如何通过AI+数智应用实现可持续发展?.docx
- 企业科技创新平台如何通过AI+数智应用确保资源的丰富性和有效性?.docx
- 企业科技创新平台在AI+时代面临哪些挑战,如何解决?.docx
- 企业如何借助AI+数智应用科技创新管理平台实现低成本、高效的创新管理?.docx
- 企业如何通过AI+数智应用构建可持续运营的科技创新服务体系?.docx
- 企业如何利用AI+数智应用工具建设高效的科技创新平台?.docx
- 如何借助AI+数智应用构建区域科技创新服务体系以促进产业升级?.docx
- 如何借助AI+数智应用构建高效的科技创新管理服务体系,解决资源整合与服务可持续性难题?.docx
- 企业如何通过AI+数智应用科技创新管理提升核心竞争力?.docx
- 如何借助AI+数智应用解决科技平台面临的可持续性挑战?.docx
- 如何借助AI+数智应用解决科技平台面临的资源、服务和可持续性问题?.docx
- 如何借助AI+数智应用技术转移服务效率提升工具应对海量技术信息筛选难题?.docx
- 如何借助AI+数智应用解决科技创新平台服务效率低、资源分散的问题?.docx
- 如何借助AI+数智应用科技平台优化企业创新管理与决策?.docx
- 如何借助AI+数智应用科研创新管理平台解决科技平台资源分散、服务低效的难题?.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
