嘉银科技基于阿里云 Kafka Serverless 提升业务弹性能力,节省成本超过 20%

本文涉及的产品
任务调度 XXL-JOB 版免费试用,400 元额度,开发版规格
注册配置 MSE Nacos/ZooKeeper,182元/月
云原生网关 MSE Higress,422元/月
简介: 云消息队列 Kafka 版 Serverless 系列凭借其秒级弹性扩展、按需付费、轻运维的优势,助力嘉银科技业务系统实现灵活扩缩容,在业务效率和成本优化上持续取得突破,保证服务的敏捷性和稳定性,并节省超过 20% 的成本。

作者:四牛


前言


云消息队列 Kafka Serverless 系列凭借其秒级弹性扩展、按需付费、轻运维的优势,助力嘉银科技业务系统实现灵活扩缩容,在业务效率和成本优化上持续取得突破,保证服务的敏捷性和稳定性,并节省超过 20% 的成本。


客户介绍

1758088241660_2B1D63BA-66F4-4eda-BC13-820A12D9C1FE.png

嘉银科技是一家专注于科技驱动普惠金融的上市企业,在多年的发展过程中,始终坚持以技术为核心推动业务迭代,公司致力于以大数据、云计算、人工智能等技术在消费场景内连接消费者与金融机构,让每位用户都能享受到高效便捷的科技服务,同时助力金融机构业务高速增长。


应用上云


随着业务规模的不断扩大,嘉银科技对底层技术平台的可扩展性、稳定性和运维便捷性提出了更高要求,2024 年初启动了整体应用迁移上云的进程,嘉银科技技术团队经过多方技术论证及产品选型,最终选择阿里云作为云服务提供商。阿里云和嘉银科技的技术团队共同组建上云项目组,制定上云技术方案和实施步骤。


自建 Kafka迁移上云


伴随着应用从 IDC 迁移上云,应用所依赖的中间件服务也逐步迁移到云上更加稳定成熟的 PaaS 产品,其中 Kafka 就是在此次迁云过程中完成了技术升级,由开源自建 Kafka 集群迁移到阿里云消息队列 Kafka V3 集群,大大提升了应用系统的稳定可靠及弹性能力。

1758088338854_2A268398-C89C-4caa-8676-5C85F728ACB3.png

下图展示了嘉银科技的 Kafka 架构迁移至云端前后的对比。左侧为迁移前的开源自建 Kafka 架构,右侧为迁移至阿里云消息队列 Kafka v3 后的架构。

1758088356326_F5B7721F-8B8A-4941-B9A4-CC507F856CB5.png


云上 Kafka 技术优势


阿里云消息团队在技术上持续投入,迭代升级云消息队列 Kafka 版产品的核心技术架构,其 Serverless 系列实现了真正意义上的存算分离,存储层基于云重新设计,这也是绝大部分商业化消息产品的重点投入方向,难点在于实现彻底分离,解决成本和性能的矛盾,同时保证计算弹性的轻量和扩容的可靠。

1758088376563_A584A26B-4C3A-4828-BEFC-99B5EAE0546A.png

阿里云消息队列 Kafka 版 Serverless 系列以其卓越的弹性能力,为嘉银科技提供了高效的资源管理和业务连续性保障。


  • 自适应弹性云消息队列 Kafka 版 Serverless 系列在 20 MB/秒 ~ 1 GB/秒支持无感弹性;1 GB/秒 ~ 3 GB/秒支持秒级弹性;3 GB/秒以上支持分钟级弹性。客户可以依据业务流量的趋势,通过弹性能力实现成本与性能的平衡,从容且高效地应对突发流量高峰。
  • 秒级定时弹性对于超大规模集群,云消息队列 Kafka Serverless 系列支持脉冲的定时弹性,允许预设弹性策略,在流量高峰期预留足够资源确保关键业务的持续性和稳定性,在低峰期则减少资源使用以节约成本,不仅提升了资源利用率,还降低了运维复杂度。
  • 高可用、高可靠开源 Kafka 通过 ISR 机制实现服务高可用和数据高可靠,但计算和存储混杂,副本机制复杂度高,问题排查难度大。阿里云消息队列 Kafka V3 基于存算分离架构,实现各计算节点无状态且共享存储,不仅降低了复杂度,还提高了可运维性。计算节点高可用基于自研轻量 Leader 切换机制实现,在稳定提供读写服务的同时又能优雅轻便地 Leader 转移,是云消息队列 Kafka 版高效弹缩的核心底座。云消息队列 Kafka 版在存储层面基于阿里云飞天盘古 DFS,支持跨数据中心容灾,提供百微秒级平均延迟、毫秒级长尾延迟,数据可靠性 12 9,可用性 5 9。因此,迁移后的架构可靠性和可用性都得到了显著的提升。
  • 高性能采用 OpenMessaging Benchmark Framework 对云消息队列 Kafka 版 V3 和 Apache Kafka 3.3 进行攒批发送与碎片化发送场景下的吞吐延迟对比测试,测试结果显示,在攒批发送与碎片化发送场景下,云消息队列 Kafka 版 V3 在 TP999 的延迟表现整体均优于 Apache Kafka,并且随着吞吐的增加,这种性能优势更加明显,碎片化发送场景快 10 倍。
  • 成本优化云消息队列 Kafka 团队有长时间研发和运维经历,积累了大量的实战经验。结合嘉银科技的业务模型,提供 Kafka 最佳实践,客户端和服务端都有 20% 的成本优化,避免不必要的开支。同时,制定容灾方案防止数据丢失或服务中断。


业务价值


高稳定架构,为业务保驾护航云消息队列 Kafka 版凭借高吞吐与分布式架构,满足了嘉银科技的实时数据收集、传输和高并发消息传递的需求。通过持久化能力与副本机制,进一步确保了数据可靠性和业务连续性。即使在高负载情况下也能稳定传递消息,防止数据丢失,维护数据完整性,从而保障了嘉银科技大数据平台的高效运行。


灵活资源管理,优化成本效益云消息队列 Kafka Serverless 系列采用存算分离架构,并结合动态资源调整策略,能够根据实时业务负载自动进行弹性伸缩,实现按量计费,无需预先估算和配置实例规格。不仅降低了嘉银科技运维人员工作的复杂度,还显著降低了资源使用成本。

相关文章
|
19天前
|
人工智能 运维 监控
让天下没有难查的故障:2025 阿里云 AI 原生编程挑战赛正式启动
本次大赛由阿里云主办,云原生应用平台承办,聚焦 Operation Intelligence 的智能运维(AIOps)赛道,为热爱 AI 技术的开发者提供发挥创意和想象力的舞台,借助 LLM 强大的推理能力与标准化整合的多源可观测数据,找到 AI 应用在智能运维(AIOps)场景上的新方式。
203 31
|
12天前
|
人工智能 监控 Kubernetes
稳定支撑大规模模型调用,携程旅游的 AI 网关实践
为了进一步提升服务水平和服务质量,携程很早就开始在人工智能大模型领域进行探索。而随着工作的深入,大模型服务的应用领域不断扩大,公司内部需要访问大模型服务的应用也越来越多,不可避免的就遇到了几个问题,我们自然就会想到使用网关来对这些服务接入进行统一管理,并增加各种切面上的流量治理功能。
|
16天前
|
数据采集 人工智能 监控
零代码改造!LoongSuite AI 采集套件观测实战
在 AI 时代,随着模型和应用侧的快速演化,对于推理过程,成本和性能显得尤为重要,而端到端的 AI 可观测是其中至关重要的一环。本文将介绍端到端 AI 可观测的基本概念与痛点,并通过阿里云可观测团队最新开源的 AI 采集套件 LoongSuite Agent 来对大模型应用进行全链路可观测以解决这些痛点。帮助客户无侵入,低成本地进行全链路的大模型可观测。
126 32
零代码改造!LoongSuite AI 采集套件观测实战
|
12天前
|
人工智能 自然语言处理 开发者
|
10天前
|
人工智能 算法 小程序
再见 Cursor,Qoder 真香!这波要改写 AI 编程格局
真心建议大家去使用一下这段时间最新推出的一款 AI 编程工具:Qoder 。真的是太好用了,一点也不比 Cursor 差。
362 10
|
25天前
|
人工智能 弹性计算 自然语言处理
云速搭 AI 助理发布:对话式生成可部署的阿里云架构图
阿里云云速搭 CADT(Cloud Architect Design Tools)推出智能化升级——云小搭,一款基于大模型的 AI 云架构助手,致力于让每一位用户都能“动动嘴”就完成专业级云架构设计。
354 31
|
2天前
|
人工智能 算法 小程序
再见 Cursor,Qoder 真香!这波要改写 AI 编程格局
只需要把项目导入 Qoder,Repo Wiki 就可以详细地帮你梳理整个代码工程,甚至可以将项目的隐性知识显性化。这简直就是程序员的福音。
|
1月前
|
数据采集 存储 人工智能
基于 EventBridge 构筑 AI 领域高效数据集成方案
本文深入探讨了AI时代数据处理的变革与挑战,分析了事件驱动架构(EventBridge)在AI数据处理中的技术优势,并结合实践案例,展示了其在多源数据接入、向量数据库优化、智能数据转换等方面的应用价值。
326 30
存储 人工智能 Serverless
245 35