自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

阿里巴巴中间件

Aliware阿里巴巴中间件官方账号

  • 博客(1288)
  • 收藏
  • 关注

原创 云栖发布|阿里云消息队列 RocketMQ 5.0:消息、事件、流融合处理平台

引言:从“消息”到“消息、事件、流”的大融合消息队列作为当代应用的通信基础设施,微服务架构应用的核心依赖,通过异步解耦能力让用户更高效地构建分布式、高性能、弹性健壮的应用程序。从数据价值和业务价值角度来看,消息队列的价值不断深化。消息队列中流动的业务核心数据涉及集成传输、分析计算和处理等不同环节与场景。伴随着不断演进,我们可以预见消息队列势必在数据通道、事件集成驱动、分析计算等场景不断产生新价值,创造新的“化学反应”。RocketMQ 诞生于阿里巴巴内部电商系统,发展至今日,其核心架构经历了多次关键

2021-10-23 16:47:17 698

原创 打破 Serverless 落地边界,阿里云 SAE 发布 5 大新特性

微服务场景,开源自建真的最快最省最稳的?复杂性真的会成为 Kubernetes 的“致命伤”吗?企业应用容器化,一定得过 K8s 这座“独木桥”吗?Serverless 应用场景单一,多用在逻辑简单的非核心场景:小程序、ETL、定时备份等。Java 微服务真的遥遥无期了?2021云栖大会现场,阿里巴巴研究员、阿里云智能云原生应用平台总经理丁宇(叔同)重磅发布了 Serverless 应用引擎 SAE 的产品全新定位和 5大产品新特性,给出了以上问题的答案。从专用到通用,SAE 天然适合企业核心业

2021-10-21 17:21:38 276

原创 跨越行业绊脚石,阿里云函数计算发布7大技术突破

Serverless 的本质是通过屏蔽底层的计算资源,来实现业务层开发的专注度和自由度。但越是往上抽象,云厂商在底层的实现就越是复杂。函数计算将服务进一步拆分到函数的颗粒度,这势必会给开发、运维、交付等带来新的挑战,例如如何对函数进行端云联调、如何对函数进行可观测和调试、如何优化 GB 级别的镜像冷启动?这些以往在服务的颗粒度时,都不是问题的事情,成了 Serverless 大规模落地企业核心生产业务的绊脚石。2021云栖大会现场,阿里巴巴研究员、阿里云智能云原生应用平台总经理丁宇(叔同)重磅发布了函数计

2021-10-21 17:09:23 233

转载 Serverless Devs 2.0 全新发布,让 Serverless 应用开发更简单

2020 年 10 月 23日,阿里巴巴正式宣布开源其首个 Serverless 开发者平台 Serverless Devs。历经近一年精心打磨,今天 Serverless Devs 2....

2021-09-10 08:00:00 220

转载 Dubbo 和 HSF 在阿里巴巴的实践:携手走向下一代云原生微服务

Dubbo 和 HSF 都是阿里巴巴目前在使用的微服务 RPC 框架。HSF 在阿里巴巴使用更多,承接了内部从单体应用到微服务的架构演进,支撑了阿里历年双十一的平稳运行;Dubbo 则在 ...

2021-09-10 08:00:00 487

原创 Nacos 开源、自研、商业化三位一体战略背后的思考

阿里云原生三位一体战略解读Aliware阿里巴巴开源、自研、商业化技术三位一体,用公有云支持阿里集团上云,以开源为内核做内部扩展,以商业化为基础做内部定制;后端 BaaS 化,客户端轻量化...

2021-09-10 08:00:00 397

原创 在 Dubbo3.0 上服务治理的实践

​作者 | 十眠Dubbo3.0 介绍​自从 Apache Dubbo 在 2011 年开源以来,经过多年一众大规模互联网、IT 公司的实践积累了大量经验,Dubbo 凭着对 Java 用户友好、功能丰富、治理能力强等优点在过去取得了很大的认可,成为国内外流行主流的 RPC 框架之一。​但随着云原生时代的到来,对以 Apache Dubbo、Spring Cloud 等为代表的 Java 微服务治理体系提出了新的要求,包括期望应用可以更快的启动、应用通信的协议穿透性可以更高、能够对多语言的支持.

2021-08-05 11:10:22 543

原创 如何利用云原生技术构建现代化应用

作者 | 愚奇今天,云和云计算技术已经被企业广泛所接受,关于云、云计算、云原生都有非常多的话题,但是我比较想讨论的是在所有云当中真正的主角,就是我们的应用。因为当企业应用上云后,这些应用的高可用能力有可能提升了一部分,但仍存有许多问题;而当我们探讨上云后这些应用的运维效率,却未必有很大的提升,因为所有的运维都是基于基础设施进行的,而云计算是一个比较大的基础设施的改变;如果我们再问,上云后整个应用的开发速度是不是得到了极大的提升,这个时候很多人都要说,并不。因此,今天主要探讨的就是如何

2021-07-09 13:16:27 357 2

原创 Apache Dubbo 3.0.0 正式发布 - 全面拥抱云原生

一、背景自从 Apache Dubbo 在 2011 年开源以来,在一众大规模互联网、IT公司的实践中积累了大量经验后,Dubbo 凭借对 Java 用户友好、功能丰富、治理能力强等优点在过去取得了很大的成功,成为国内外热门主流的 RPC 框架之一。但随着云原生时代的到来,以 Apache Dubbo、Spring Cloud 等为代表的 Java 微服务治理体系面临了许多新的需求,包括期望应用可以更快的启动、应用通信的协议穿透性可以更高、能够对多语言的支持更加友好等。例如Spring 也在

2021-06-29 11:26:22 2001 2

转载 阿里 Qoder 体验超预期,Repo Wiki 功能迎来全新升级

再比如说,针对文档上传到解析这个流程,Qoder 还会给我们一个完整的架构图,告诉我们这块是通过 Kafka 进行解耦的,然后通过 Apache Tika 进行解析,再调用 Embedding API 进行向量后存储到 ElasticSearch。Quest Mode 主打一个 AI 自主研发,我们只需要把工程任务扔给他,Quest Mode 就会把模糊的需求翻译为详细的需求和设计说明书,再去自动拆解任务、执行、联调,然后给我们汇报结果。这跟读书不一样,书有目录,源码有时候更像是迷宫。

2025-09-11 20:01:31 19

原创 合理选择任务调度的路由策略,可以帮助降本 50%

如果集群中的任务配置了多种路由策略,不同执行器调度次数不一样,出现了负载不均衡的情况,给新任务配置LFU算法,一定能调度到调度次数最少的执行器上,才能真正发挥它的作用。在真实生产环境下,不同的任务处理不同的业务逻辑,如果选错路由策略,可能会导致集群中大部分执行节点负载不到10%,但是个别节点负载会冲高到100%,虽然平均负载不高,但是也无法减少规格,可能还需要增大规格防止出稳定性问题。在任务调度系统中,可以统计执行器的调度时间,优先选择最久未调度的执行器进行任务调度,从而达到负载均衡的目的。

2025-08-25 20:02:51 1049

原创 AI Agent 发展趋势与架构演进

TPOT就是从第一个首包出来以后,再到它把所有的包都出完,再除以它的耗时,得到的指标数据叫做 TPOT,就是说首包延迟以后,后续平均的每包的传输时间,这反映了模型在 decode 阶段的关键性能。在一些模型推理的关键阶段,KV Cache 的缓存命中率以及 GPU 的一些利用率等等,包括一些吞吐的能力也是需要关注的。中间的这块东西就是我们的 AI 应用和模型之间有一个核心的 AI 网关的代理能力,它可以做到一些核心的 AI 能力,比如 LLM 缓存,向量的一些检索,还有像 token 的一些限流。

2025-08-21 20:03:54 1072

转载 Dubbo 云原生重构出击:更快部署、更强控制台、更智能运维

Dubbo Operator 的设计理念和架构与业界主流的服务网格 Operator 保持高度一致,均旨在实现微服务全生命周期的智能管理,深度融合 Kubernetes 生态体系,极大简化了微服务集群的部署与运维流程,显著提升自动化运维效率和集群稳定性。此次 Dubbo 云原生升级,不仅实现了微服务集群的一键部署和全新可视化控制台的上线,更通过 Dubbo Operator 布局自动化运维和服务网格化治理,标志着 Dubbo 在云原生道路上的又一次重要跃迁。的双重能力,极大提升微服务全生命周期管理体验。

2025-08-08 16:01:35 49

转载 送票!2025云栖大会9月24-26日杭州见

立即注册领取 2025 云栖大会门票。9月24日至26日,杭州·云栖小镇。即日起,免费注册领取云栖大会门票。2025杭州·云栖大会,来了!40000平方米智能科技展区。超110场聚合话题专场。

2025-08-08 16:01:35 65

原创 如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

此外,MCP Server 的安全性问题也日益凸显。为此,Router 提供了关键的代理与协议转换能力:支持将基于 stdio 的 MCP Server 一键转换为更安全、更可控的 SSE 或 streamable HTTP 协议,并结合 Docker 容器化部署,实现服务的隔离运行。Router 是一个遵循 MCP 协议的标准 MCP Server,其核心能力是根据用户任务的语义描述和关键词,智能地从 MCP 注册中心中筛选出最匹配的 MCP Server,并将这些候选工具提供给大模型进行决策。

2025-07-31 20:01:31 993

原创 APIG x OKG:游戏连接治理的「最后一公里」

这不仅涉及连接状态的实时感知与迁移,更需要构建从基础设施到业务层的全栈治理能力,这正是实现云原生游戏连接治理的"最后一公里"。这一方案不仅继承了 Higress 的优势,更突破性地解决了传统方案在高阶能力变更时面临的连接中断问题,完美契合游戏长连接场景的严苛需求。通过这套解决方案,我们不仅缩短了云原生游戏连接治理的"最后一公里",更为游戏服务提供商开辟了一条全新的发展道路。通过这样的部署结构,我们可以模拟复杂的游戏服务环境,为优雅下线的实验提供真实可靠的测试平台。上的优雅下线全流程。

2025-07-24 18:15:16 939

原创 API 网关 x OKG:游戏连接治理的「最后一公里」

这不仅涉及连接状态的实时感知与迁移,更需要构建从基础设施到业务层的全栈治理能力,这正是实现云原生游戏连接治理的"最后一公里"。这一方案不仅继承了 Higress 的优势,更突破性地解决了传统方案在高阶能力变更时面临的连接中断问题,完美契合游戏长连接场景的严苛需求。通过这套解决方案,我们不仅缩短了云原生游戏连接治理的"最后一公里",更为游戏服务提供商开辟了一条全新的发展道路。通过这样的部署结构,我们可以模拟复杂的游戏服务环境,为优雅下线的实验提供真实可靠的测试平台。上的优雅下线全流程。

2025-07-24 18:15:16 644

转载 Nacos 3.0 架构全景解读,AI 时代服务注册中心的演进

Nacos 3.0 还有很多待完成的功能及大量待探索和开发的领域,欢迎大家扫码加入 Nacos 社区群及 Nacos MCP 社区讨论群,参与 Nacos 社区的贡献和讨论,在 Nacos 社区一起搭把手,让你的代码和能力有机会能在各行各业领域内进行释放能量,期待认识你和你一起共建 Nacos 社区;,因此 Nacos3.0 的 RoadMap 将会逐步实现 AI Registry 的能力,从当前的 MCP 管理,拓展到 Prompt 管理,Agent 的自动注册发现,再到 LLM 模型的参数管理和托管;

2025-07-10 20:04:34 63

转载 Spring AI Alibaba 游乐场开放!一站式体验AI 应用开发全流程

Playground 是社区以 Spring AI Alibaba 框架为基础搭建的 AI 应用体验平台,应用包含完善的前端 UI + 后端实现,具备对话、图片生成、工具调用、RAG、MCP 等众多 AI 相关功能。打开 Playground 首页,您可以体验聊天助手(支持多轮对话、深度思考、联网搜索、多模型切换)、图像生成、文档总结、RAG、MCP、Function Call 等 AI 应用核心功能,所有功能都是基于 Spring AI Alibaba 框架实现。您可以在部署时替换为想使用的向量数据库。

2025-07-10 20:04:34 56

转载 Dify 开发者必看:如何破解 MCP 集成与 Prompt 迭代难题?

但是,截至目前,Dify 平台仍然缺乏原生对于 MCP 协议的支持,虽然有社区的插件将 MCP Server 转化为 Dify 应用的工具调用,但这些插件也存在配置麻烦,使用场景受限,难以快速变更等问题。未来,随着 AI 应用场景的不断扩展,Nacos 将进一步的拥抱 AI 生态,从基础的配置管理和服务发现,到 MCP 生态的持续拓展和集成,再到多 Agent 的协同,Nacos 将持续演进,帮助开发者提升效率,降低复杂环境下的开发与运维成本,让 AI 应用的构建更加高效、稳定。

2025-07-10 20:04:34 58

转载 垂直和领域 Agent 的护城河:上下文工程

这和我们维护我们手机上内存很像,一开始所有应用和历史信息都保留,但当手机出现运行缓慢的时候,就会开始清理手机内存,例如把下载到本地的大文件删除,删除微信聊天中的不重要的历史信息。例如在文章开头,我们举的产品经理和工程师之间的那一段对话,一个高质量智能体,不再只是让大模型回答用户的问题,而是通过上下文工程,帮助大模型在回答前获得更加结构化的输入,包括项目状态、需求文档、任务历史、甚至团队氛围,实现大模型更好的理解当前的任务规划、团队过往的沟通隐患、对方的工作状态与担忧、文档/知识库的实时状态等等。

2025-07-10 20:04:34 44

转载 通义灵码 AI IDE 正式上线,智能体自动写代码,首创自动记忆,工程感知全面升级

5 月 30 日,阿里云发布通义灵码 AI IDE,深度适配了最新的千问3大模型,全面集成智能编码助手的能力,如编程智能体、工具使用、工程感知、行间建议预测(NES)、长期记忆等能力,不仅可以辅助代码编写、缺陷修复,还可帮助开发者完成复杂编程任务,懂工程,更懂开发者。在通义灵码智能体模式下,开发者只需描述清楚编码任务,通义灵码便可以自主地进行工程感知、代码检索、执行终端、调用 MCP 工具等,端到端地帮助开发者完成编码任务。立即下载:https://lingma.aliyun.com/lingma/

2025-05-30 15:48:01 104

转载 通义灵码编程智能体,上线!

通义灵码编程智能体支持 MCP 工具使用,根据用户需求描述,通过模型自主规划,实现 MCP 工具调用,并深度集成国内最大的 MCP 中文社区——魔搭 MCP 广场,涵盖开发者工具、文件系统、搜索、地图等十大热门领域 2400+ MCP 服务,全面拓宽 AI 编码助手能力边界,更加贴合开发者工作流程。现在,借助通义灵码编程智能体,只需要输入几句话,通义灵码就能根据你的需求描述,结合技术栈,自动创建工程文件、定义开发规范、实时反馈生成效果,甚至生成研发文档,10 分钟就能完成开发,大幅提升研发效率。

2025-05-06 11:21:48 512

转载 Nacos 3.0 正式发布:MCP Registry、安全零信任、链接更多生态

Nacos MCP Router 的 MCP 信息搜索能力,是基于向量数据库进行语义匹配,在海量 MCP Server 配置以及搜索的实时性上取得平衡,并且过程中,还尽可能利用 AI Agent 智能性,帮助进行筛选确定 MCP Server 的选择,在确保减少 AI Agent 的总 Tokens 消耗的同时,又大大的扩展了 AI Agent 能使用 MCP Server 的上限;在之前的 Nacos 版本中,为了方便用户的部署和使用,控制台与引擎程序一直合并部署,且共用同一个端口。

2025-04-28 16:57:52 341

转载 Java 开发玩转 MCP:从 Claude 自动化到 Spring AI Alibaba 生态整合

从图上可以看到,通过创建仓库 test-mcp 这样的提示词,Claude 的大模型自行判断需要使用 mcp 中提供的 create_repository 能力,从而完成了仓库的创建,接下来我们打开 Github 也确实发现了这个已经创建的仓库。整体的工作流程是这样的:AI 应用中集成 MCP 客户端,通过 MCP 协议向 MCP 服务端发起请求,MCP 服务端可以连接本地/远程的数据源,或者通过 API 访问其他服务,从而完成数据的获取,返回给 AI 应用去使用。

2025-04-07 20:01:54 701 1

转载 一键部署 Dify + MCP Server,高效开发 AI 智能体应用

将上述 MCP Server 打包为镜像,部署到 SAE 上,可以直接用 saectl 一键部署,支持按照暴露 CLB 类型的 MCP Service 地址,SAE 平台内置了应用的监控、日志等,围绕应用提供了的全套运维体系,在 SAE 界面可以看到应用已经创建出来,并且处于 Running 状态,日志标准输出显示服务器运行中。SAE 应用中心为用户提供了 Dify 应用模板,您只需要在控制台填写表单,我们会为您自动创建并运行部署流水线,将 Dify 一键部署至 SAE。

2025-04-03 16:02:30 1927

转载 Nacos 发布 MCP Registry,实现存量应用接口“0改动”升级到 MCP 协议

现实中,我们有大量的存量服务和接口,按照接口到 Tool 的映射,我们将会有非常多的 Tool,当 Agent 拉取 Tool 列表并传递给模型的时候,将会有非常多的 token 消耗,并且模型的性能也可能会下降。Nacos 中会注册多个服务,每个服务会有多个接口,每一个接口映射为一个 Tool,Tool 的描述信息就是接口的描述信息,之后根据接口名,将所有服务中的所有 Tool 的服务名等生成全局唯一的 Tool 名称,然后将这些 Tool 聚合为当前的 Tool 列表,返回给 MCP Client。

2025-03-31 22:01:02 275

转载 通义灵码 Rules 来了:个性化代码生成,对抗模型幻觉

1.在每个新增的函数上都附加详细的注释,这些注释除了说明做什么以外,还要说怎么做的,为什么这么做,需要写的很详细,同时在方法的注释上加上 author。增加了Rules之后,新增的两个方法拥有良好的编码风格,以及完整的注释描述(包括作者、方法的输入输出和方法的功能描述及具体实现)。通过设定项目专属规则,可以帮助模型更精准地理解并适应您的编码偏好,例如理解项目框架和代码风格等。当模型生成代码不精准,试下通义灵码 Rules,对抗模型幻觉,硬控 AI 根据你的代码风格和偏好生成代码和回复。

2025-03-31 22:01:02 361

转载 Higress 开源 Remote MCP Server 托管方案,并将上线 MCP 市场

近期,两大关键事件标志着MCP已从事实标准迈向行业标准:一方面,OpenAI 正式宣布跟进 Anthropic 的 MCP 协议,另一方面,Anthropic 发布了新版本 MCP 协议,在 Remote MCP Server 场景下实现了显著改进。导读:MCP Server 的实施存在着诸多挑战,特别是在认证授权、服务可靠性和可观测性方面,Higress 作为 AI 原生的 API 网关,提供了完整的开源 MCP Server 托管解决方案,实现存量 API 到 MCP 的协议转换。

2025-03-31 20:01:26 507

转载 首发,Higress AI 网关率先支持 QwQ-32B,推理成本可再降 90%

今天凌晨,通义千文发布最新推理模型 QwQ-32B。在各类基准测试中,拥有 320 亿参数的 QwQ 模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。这意味着:个人用户可以在更小的移动设备上、本地就能运行。企业用户推理大模型 API 的调用成本,可再降 90%。???? 价格对比:如果是通过调用官方 API 的方式:???? DeepSeek R1:$0.14...

2025-03-06 18:51:34 189

原创 通义灵码上新推理模型,快来体验数学编程双冠王 Qwen2.5-Max

在基座模型的对比中,由于无法访问 GPT-4o 和 Claude-3.5-Sonnet 等闭源模型的基座模型,通义千问将 Qwen2.5-Max 与目前领先的开源 MoE 模型 DeepSeek V3、最大的开源稠密模型 Llama-3.1-405B,以及同样位列开源稠密模型前列的 Qwen2.5-72B 进行了对比。将 Qwen2.5-Max 与业界领先的模型(无论是闭源还是开源)在一系列广受关注的基准测试上进行了对比评估,评估结果涵盖了基座模型和指令模型的性能得分。

2025-03-03 17:44:35 371

转载 半小时开发小程序!我和 AI 程序员结对编程初体验

有时候我突发奇想要做个小工具,但是碍于不会编程,没办法进行下去。但是学习编程要花很长时间,而且以我的水平,还不一定学得懂。我就在想,能不能通过 AI 生成一个网页、小程序或者 App 呢?经过实战手搓,发现真的可以!01DeepSeek 满血版“AI 程序员”正好我看见了通义灵码的“AI 程序员”接入了 DeepSeek V3 和 R1 满血版,最重要的是免费不限量使用!就在昨晚,通义灵码支持...

2025-03-02 14:28:54 946

原创 AI程序员入场!揭秘直播吧研发效能大提升的秘密武器

直播吧自2007年成立以来,一直走在体育赛事直播与资讯服务领域的前沿。作为国内知名的体育赛事直播与资讯平台,直播吧始终以“让体育爱好者更便捷地获取赛事信息和观看直播”为使命,致力于通过其APP、网站等渠道,为用户提供全面的体育赛事直播、新闻资讯、数据分析等服务。服务范围涵盖足球、篮球、网球、电竞等各类体育项目,助力用户加速迈入数字化体育时代。通过社区互动的形式,直播吧吸引大批体育爱好者在此交流探讨,形成了良好的用户粘性。

2025-02-28 17:25:57 588

转载 DeepSeek 满血版在 IDEA 中怎么用?手把手教程来了

近期有几个热点事件,不知道大家关注到没有?第一个标志事件,一向挑剔的苹果宣布和阿里合作,一起为国行版 iPhone 提供 AI 技术服务。第二个标志事件,DeepSeek R1 蒸馏了 6 个模型开源给社区,其中有 4 个来自阿里的 Qwen。第三个标志事件,阿里云为开发者量身定制的通义灵码插件,也在第一时间集成了 DeepSeek-R1 满血版。坐我旁边的同事体验了一早上,直言这是他用过最聪明的...

2025-02-20 20:06:42 332

原创 基于阿里云可观测产品构建企业级告警体系的通用路径与最佳实践

作者:阳其凯(逸陵)、张江宇(九辩)01前言Aliware1.1 日常生活中的告警任何连续稳定运行的生产系统都离不开有效的监控与报警机制。通过监控,我们可以实时掌握系统和业务的运行状态;而报警则帮助我们及时发现并响应监控指标及业务中的异常情况。在日常生活中,我们也经常遇到各种各样的告警。例如,在驾驶传统机动车时,仪表盘就如同一个高效的监控面板,清晰地显示了行驶速度、发动机转速、燃油量等关键指标。此...

2025-02-13 20:01:31 1030

转载 如何在 IDE 里使用 DeepSeek?

近期,阿里云百炼平台重磅推出 DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B 等 6 款模型,进一步丰富其 AI 模型矩阵。与此同时,通义灵码也紧跟步伐,全新上线模型选择功能,支持基于百炼的 DeepSeek-V3 和 DeepSeek-R1 满血版671B模型,为 AI 编程领域注入新活力。通义灵码能力再升级,支持推理模型选择今年1月,通...

2025-02-12 20:12:23 92

转载 从大规模恶意攻击 DeepSeek 事件看 AI 创新隐忧:安全可观测体系建设刻不容缓...

01全球出圈的中国大模型AliwareDeepSeek作为一款革命性的大型语言模型,以其卓越的自然语言处理能力和创新性成本控制引领行业前沿。该模型不仅在性能上媲美 OpenAI-o1,而且在推理模型的成本优化上实现了突破性的低成本运营,被誉为“小力出奇迹”的典范。随着新一代模型 DeepSeek-R1 的发布,1 月 27 日,DeepSeek 应用迅速登顶苹果应用商店中国和美国地区的免费 Ap...

2025-02-07 18:11:46 202

转载 本地玩转 DeepSeek 和 Qwen 最新开源版本(入门+进阶)

今年的春节注定不寻常,开源大模型领域的“国货之光”们接连发布新版本,多项指标对标 OpenAI 的正式版(收费服务)。1月20日,DeepSeek R1 发布,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。1月27日,Qwen2.5-1M:支持 100万 Token 上下文,其中 14B 的杯型在短文本任务上实现了和 GPT-4o-mini 相近的性能,同时上下文长度是...

2025-01-29 14:09:36 1923

转载 OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

12 月 11 日,OpenAI 旗下 AI 聊天机器人平台 ChatGPT、视频生成工具 Sora 及其面向开发人员的 API 自太平洋时间下午 3 点左右起发生严重中断,耗费约三个小时才顺利恢复所有服务。OpenAI 在事后报告中写道,“该问题源自新部署的遥测服务,此项服务无意间压垮了 Kubernetes 控制平面,导致关键系统发生连锁故障。引发事故的根本原因就是新的遥测服务配置意外在大规模...

2024-12-21 09:01:25 124

原创 Nacos 3.0 Alpha 发布,在安全、泛用、云原生更进一步

自 2021 年发布以来,Nacos 2.0 在社区的支持下已走过近三年,期间取得了诸多成就。在高性能与易扩展性方面,Nacos 2.0 取得了显著进展,同时在易用性和安全性上也不断提升。想了解更多详细信息,欢迎阅读我们之前发布的回顾文章:《Star 3w+,向更安全、更泛化、更云原生的 Nacos3.0 演进》。近期,我们欣喜地宣布 Nacos 3.0 的第一个版本 Nacos 3.0-ALPH...

2024-12-12 17:09:40 1721

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除