为什么大模型正在成为「新操作系统」？-CSDN博客

大模型不只是一个智能组件，它正在重写我们对“操作系统”的理解。

在过去几十年中，操作系统的演进围绕着硬件调度、资源管理与图形界面展开。而当 GPT-4、Claude 3、Gemini 1.5 这类大模型登上舞台，我们发现：许多曾经由操作系统负责的“抽象层”，如今正被大模型“吞噬”。

大模型不仅能理解自然语言、调用函数、规划流程，它还具备强大的“意图解析”和“能力路由”能力。这意味着，在很多场景中，模型本身就可以成为一个“软态操作系统”，主导用户意图与应用能力之间的调度。

这不再是夸张的类比，而是一场正在发生的底层范式重构。

传统意义上的操作系统，承担三大职责：

但在 AI 时代，这三者正被逐步重构：

换句话说，大模型已经不再是跑在 OS 上的一个进程，它正在成为新的“人机交互内核”。

过去，用户需要记住一系列命令、按钮、操作路径来完成任务。

今天，我们只需一句：

“帮我整理下本周的会议纪要，按时间顺序分段列出。”

这句话背后包含了过去多个应用才能完成的工作：调用日程应用、读取邮件、整理笔记、生成文档。而模型通过 ToolUse（函数调用）、RAG（知识注入）、Memory（记忆）等机制，将所有操作“内聚”为一次自然语言请求。

Prompt 正成为操作指令的主语义接口。

我们可以说，GPT 的聊天窗口就是新一代的命令行（Chat CLI），而带插件/技能/Agent 管理界面的 Copilot、Gemini、Claude UI，就是新一代的“AI 桌面”。

传统 API 是“死的”，需要明确路径、参数、权限。

而大模型支持的 function calling 能力，正在将这些“硬连接”变成“软意图”。

例如：

{
  "function": "getWeather",
  "parameters": {
    "city": "杭州",
    "time": "明天"
  }
}

这一行为，本质上就是一次“软系统调用（Soft Syscall）”：你不再手动拼接 API，而是通过自然语言由模型生成，甚至可以动态注册、热插拔、权限管控。

这意味着：

Function Calling = 大模型世界的 syscall，技能模块 = 应用程序。

大模型通过多步推理与调用链，能完成任务分解、能力组合，这正是传统操作系统调度器的职责。

以 Multi-agent Workflow 为例：

这种 Agent 调度系统 = 智能化用户态调度器。

它不再只是帮你“运行应用”，而是直接帮你完成“任务”。

传统的应用之间彼此割裂，用户要在多个 UI 中切换、复制粘贴、导入导出。

但当大模型成为“主交互引擎”后，UI 的意义正在发生变化：

这也是为什么越来越多企业在构建「AI Agent 中台」而不是「AI 应用平台」：入口可以变，但内核必须统一。

正如从桌面软件到 Web App，再到小程序，我们现在正经历从“APP”到“AGENT”的新一轮范式演化：