工行软件开发中心Serverless AI探索实践

随着大模型、Agent等AI技术的爆发式演进,云计算正迈入以“AI深度重塑基础设施”为核心的第三次浪潮,驱动算力范式发生结构性变革, 智能算力的战略地位正在超越通用算力,成为核心基础设施资源,其全球占比预计在2025年攀升至58%。其中AI推理需求因Agent应用的广泛普及而呈现指数级增长,大模型推理场景的“高并发、碎片化、响应快”特性,对AI算力基础设施的供给能力提出了更高要求。

为应对这一挑战,业界提出Serverless AI作为面向大模型场景的新型算力调度范式。它依托事件触发、拓扑感知调度、算力资源自动弹性伸缩等Serverless机制,实现智算资源供给模式从“长期绑定”向“按需使用”转型,进而满足智能算力如水电般“随取随用”的终极形态,加速驱动人工智能与云计算走向深度融合(如图1所示)。

图1 Serverless AI

一、云数智融合,构建弹性供给、智能调度的智算底座

中国工商银行软件开发中心(以下简称“工行软件开发中心”)积极把握“云计算第三次浪潮”的技术趋势,深度融合云计算、大数据与人工智能三大核心技术,构建“一云多算”的云数智融合技术底座。在云数融合方面,一是依托常态化在离线混部技术框架,构建基于

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

银行金融科技

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值