【开发者导航】专为智能体应用打造的开源基础模型系列：GLM-4.5

原创已于 2025-09-01 18:27:12 修改 · 941 阅读

15 ·

CC 4.0 BY-SA版权

本文为博主原创文章，未经博主允许不得转载。

文章标签：

#开源 #语言模型

于 2025-08-21 18:47:57 首次发布

开源项目专栏收录该内容

83 篇文章

订阅专栏

在人工智能快速发展的当下，智能体应用对基础模型的要求日益提高，不仅需要强大的推理能力，还需具备高效的编码能力和工具使用能力。许多开发者和企业在寻找既能满足复杂需求，又可灵活商用的模型时常常面临选择难题。而 GLM-4.5 系列模型的出现，为解决这些问题提供了新的可能。它由智谱开源，在多个领域进行了优化，适合各类智能体应用开发。想要了解更多可访问GLM-4.5。

GLM-4.5 是什么？

GLM-4.5 是智谱开源的旗舰模型系列，定位为专为智能体应用打造的基础模型。其中 GLM-4.5 总参数为 3550 亿，激活参数为 320 亿；GLM-4.5-Air 则采用更紧凑设计，总参数 1060 亿，激活参数 120 亿。该系列模型整合了推理、编码和智能体能力，具体细节以官网更新为准。

核心功能

GLM-4.5 系列模型的核心价值在于为智能体应用提供强大且灵活的基础支撑，尤其适合 AI 开发者、研究人员和企业技术团队使用。其核心功能如下：

混合推理模式 —— 提供思考模式（用于复杂推理和工具使用）与非思考模式（用于即时响应），满足不同场景需求

开源可商用 —— 基于 MIT 开源协议，支持商业应用和二次开发，降低企业使用门槛

多版本选择 —— 包含 GLM-4.5、GLM-4.5-Air 及 FP8 版本等，可根据需求选择不同参数规模的模型

出色性能表现 —— 在 12 项行业标准基准测试中表现优异，GLM-4.5 得分 63.2，GLM-4.5-Air 达 59.8

工具调用支持 —— 可接入 Claude Code 等代码智能体，优化工具调用、网页浏览等功能

多框架兼容 —— 支持 transformers、vLLM、SGLang 等主流框架，便于开发者集成使用

使用场景

GLM-4.5 系列模型适用于多种智能体相关场景，不同用户群体可根据需求灵活运用：

人群 / 角色	场景描述	关键步骤要点	推荐指数
AI 开发者	开发智能体应用，实现复杂任务处理	选择合适版本模型，通过支持的框架集成，配置推理模式	★★★★★
研究人员	进行大语言模型性能测试与研究	利用提供的基准测试数据，对比分析模型在各维度表现	★★★★☆
企业技术团队	构建企业级智能工具，如代码辅助系统	基于开源特性进行二次开发，结合业务需求优化功能	★★★★★
学习者	研究大语言模型架构与应用	参考开源代码，搭建测试环境，实践模型调用与微调	★★★☆☆

操作指南

GLM-4.5 系列模型的使用需要一定的技术基础，新手可按以下步骤上手：

访问官网获取模型相关资源，确保运行环境满足硬件要求（如合适的 GPU 配置）

安装所需依赖，执行pip install -r requirements.txt命令安装必要包

选择合适的框架，如 transformers 可参考inference文件夹中的trans_infer_cli.py代码

若使用 vLLM 框架，通过指定模型路径、张量并行大小等参数启动服务，例如启动 GLM-4.5-Air：vllm serve zai-org/GLM-4.5-Air --tensor-parallel-size 8 --tool-call-parser glm45 --reasoning-parser glm45 --enable-auto-tool-choice --served-model-name glm-4.5-air