大模型 - Python - 热门项目

Ascend/MindSpeed-LLM

昇腾LLM分布式训练框架

5小时前

讯飞星火开源/iFlytekSpark-13B

讯飞星火开源-13B（iFlytekSpark-13B）拥有130亿参数，新一代认知大模型，一经发布，众多科研院所和高校便期待科大讯飞能够开源。为了让大家使用的更加方便，科大讯飞增加了更多的数据，并针对工具链进行了优化。此次正式开源拥有130亿参数的iFlytekSpark-13B模型（讯飞星火开源-13B），也是首个基于全国产化算力平台“飞星一号”的大模型，正式开源！

Python

大模型

1年前

Charent/ChatLM-mini-Chinese

中文对话0.2B小模型（ChatLM-Chinese-0.2B），开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。

Python

大模型

1年前

Gitee 极速下载/deepseek-v3

DeepSeek-V3 是一个强大的 Mixture-of-Experts (MoE) 语言模型，它拥有671B个总参数，每个 token 有37B个激活参数

Python

大模型

1天前

ChairC/Integrated-Design-Diffusion-Model

IDDM(工业，景观，动画…)，diffusion model，支持DDPM, DDIM, PLMS, web和多gpu分布式训练。Pytorch实现、生成模型、扩散模型、分布式训练

Python

6天前

Gitee 极速下载/chatglm3

ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型

Python

大模型

1天前

讯飞星火开源/iFlytekSpark-13B-model-GPU

星火开源大模型13BGPU的模型权重

Python

大模型

1年多前

Gitee 极速下载/skywork

Skywork是由昆仑万维集团·天工团队开发的一系列大型模型，本次开源的模型有Skywork-13B-Base模型、Skywork-13B-Chat模型、Skywork-13B-M

Python

大模型

1天前

Gitee 极速下载/Qwen3

Qwen3 是 Qwen 系列大型语言模型的最新成员，包含多种模型版本

Python

大模型

1天前

刘凯/InternLM

上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式推出书生·浦语200亿参数模型版本 InternLM-20B ，InternLM-20B 在超过 2.3T Tokens 包含高质量英文、中文和代码的数据上进行预训练，其中 Chat 版本还经过了 SFT 和 RLHF 训练，使其能够更好、更安全地满足用户的需求

Python

大模型

1年多前

智能硬件	IOT/物联网/边缘计算
车载系统/应用	智能家居
自动驾驶/无人机	机器人
5G/通讯	低代码
科研论文	量子计算
芯片开发	Web 3.0
隐私计算	云原生

按钮(Button)	文本框(EditText)	布局(Layout)	图形图像(Image)
进度条(Progress)	菜单(Menu)	弹窗(Popup)	选择器(Selector)
文本组件(TextView)	列表组件(ListView)	加载器(Loading)	提醒(Notification)
视图切换(View Transition)	滑杆(Slider)	图表(Chart)	绘图组件(Draw)
计数器(Counter)	动画(Animate)	验证码(Captcha)	多媒体(Multimedia)
条形码(Barcode)	高级UI组件	地图(Map)	OpenHarmony 游戏(Gaming)
网络(Networking)	通讯(Communication)	支付(Payment)	数据库(Database)
硬件驱动(Drivers)	OpenHarmony 教程指南	OpenHarmony工具集	OpenHarmony 应用
华为移动服务(HMS)	权限(Permissions)	工具包(Toolkit)	底层组件
手势控制(Gesture)

中英文分词	支付开发包	安全开发相关	常用工具包
Excel工具包	条形码/二维码	模板引擎	图形UI组件/框架
网络开发包	语音处理	网络工具	网络服务
数据挖掘	作业/任务调度	编程语言/脚本语言	缓存组件
Markdown工具包	搜索引擎	微服务	工作流
图表组件	权限管理	报表工具	代码生成器
IoC/AOP框架	图像处理	规则引擎	JSON工具
日志工具包	Spring Boot 扩展	验证码	算法/数学计算
Node 扩展	流程引擎/工具	动画开发	移动通信

AI-人工智能	VR/AR
机器学习/深度学习	计算机视觉/人脸识别
自然语言处理	大模型
推理框架	MCP

微信开发包	微信小程序/小游戏
微信应用	微信小游戏

搜索帮助