随着大模型、Agent等AI技术的爆发式演进,云计算正迈入以“AI深度重塑基础设施”为核心的第三次浪潮,驱动算力范式发生结构性变革, 智能算力的战略地位正在超越通用算力,成为核心基础设施资源,其全球占比预计在2025年攀升至58%。其中AI推理需求因Agent应用的广泛普及而呈现指数级增长,大模型推理场景的“高并发、碎片化、响应快”特性,对AI算力基础设施的供给能力提出了更高要求。
为应对这一挑战,业界提出Serverless AI作为面向大模型场景的新型算力调度范式。它依托事件触发、拓扑感知调度、算力资源自动弹性伸缩等Serverless机制,实现智算资源供给模式从“长期绑定”向“按需使用”转型,进而满足智能算力如水电般“随取随用”的终极形态,加速驱动人工智能与云计算走向深度融合(如图1所示)。
图1 Serverless AI
一、云数智融合,构建弹性供给、智能调度的智算底座
中国工商银行软件开发中心(以下简称“工行软件开发中心”)积极把握“云计算第三次浪潮”的技术趋势,深度融合云计算、大数据与人工智能三大核心技术,构建“一云多算”的云数智融合技术底座。在云数融合方面,一是依托常态化在离线混部技术框架,构建基于