生成式人工智能/大语言模型

2025年 7月 27日

NVIDIA TensorRT-LLM 支持腾讯混元最新大语言模型 Hunyuan-A13B 推理加速

腾讯混元 (Hunyuan) 最新大语言模型 Hunyuan-A13B 今日发布，NVIDIA TensorRT-LLM 作为全球领先的…

1 MIN READ

2025年 7月 23日

在 Azure 上使用 Apache Spark 和 NVIDIA AI 进行无服务器分布式数据处理

将大量文本库转换为数字表示 (称为嵌入) 的过程对于生成式 AI 至关重要。从语义搜索和推荐引擎到检索增强生成 (RAG) ，

2 MIN READ

2025年 7月 23日

PDF 数据提取方法及其在信息检索中的应用

PDF 是共享财务报告、研究论文、技术文档和营销材料等信息的常用文件格式之一。然而，在构建有效的检索增强生成 (RAG) 系统时，

4 MIN READ

2025年 7月 22日

使用 NVIDIA NeMo 在一个周末内训练一个具备推理能力的 LLM

您是否曾想构建自己的推理模型，但认为它过于复杂或需要大量资源？再想想。借助 NVIDIA 强大的工具和数据集，

4 MIN READ

2025年 7月 21日

传统 RAG 与代理 RAG——AI 智能体如何通过动态知识实现更高智能

是否曾依赖不知道新高速公路旁路或道路突然关闭的旧 GPS？它可能会让您到达目的地，但不是最有效或最准确的方式。

1 MIN READ

2025年 7月 21日

使用 NVIDIA Nsight Systems 分析 Ray 负载（verl）的性能

在大语言模型的强化学习训练过程中，GPU 性能优化至关重要。随着模型规模不断扩大，

2 MIN READ

2025年 7月 17日

使用 NVIDIA 安全配方保护代理式 AI 系统

随着大语言模型 (LLM) 驱动更多能够执行自主操作、工具使用和推理的代理式系统，企业被其灵活性和低推理成本所吸引。

2 MIN READ

2025年 7月 17日

黑客松获奖者借助 NVIDIA NeMo Agent Toolkit 让代理式 AI 如生

学习新工具包的最佳方式是构建一些真实的东西，这正是开发者在最近的 NVIDIA NeMo Agent 工具包黑客松上所做的。在两周的时间里，

1 MIN READ

2025年 7月 16日

CUTLASS：基于张量和空间微核处理多维数据的原理抽象

在生成式 AI 时代，充分发挥 GPU 的潜力对于训练更好的模型和大规模服务用户至关重要。通常，

4 MIN READ

2025年 7月 15日

借助 AWS 上的 NVIDIA Run:ai 加速 AI 模型编排

在开发和部署高级 AI 模型时，访问可扩展的高效 GPU 基础设施至关重要。但是，在云原生、容器化环境中管理此基础设施可能既复杂又昂贵。

2 MIN READ

2025年 7月 11日

使用 SynthDa 提升合成数据增强和人体动作识别

人类动作识别是 AI 系统中的一项功能，专为监控、老年人护理和工业监控等安全关键型应用而设计。但是，许多现实世界的数据集受到数据不平衡、

2 MIN READ

2025年 7月 11日

突破延迟极限：在 NVIDIA Blackwell GPU 上优化 DeepSeek-R1 的性能

近年来，大语言逻辑推理模型取得了显著进步，但也带来了新的部署挑战。其中，因复杂的“思考与逻辑推理”过程而引起的输出序列长度 (OSL)…

3 MIN READ

2025年 7月 10日

借助 GliaCloud 和 NVIDIA Omniverse 库加速视频制作和定制

生成式 AI 视频模型的激增以及这些模型引入的新工作流程，显著提高了创意和营销技术行业的生产效率，并提高了输出质量。

1 MIN READ

2025年 7月 10日

从 TB 级到一站式解决方案：AI 驱动的气候模型走向主流

在了解地球不断变化的气候的竞赛中，速度和准确性至关重要。但当今使用最广泛的气候模拟器往往难以满足需求：由于计算能力的限制，

2 MIN READ

2025年 7月 9日

使用 NVIDIA NeMo-RL 进行强化学习：通过 GRPO 复制 DeepScaleR 配方

强化学习 (RL) 是交互式 AI 的支柱。它对于教导智能体推理和从人类偏好中学习、实现多轮工具使用等至关重要。

2 MIN READ

2025年 7月 7日

LLM 推理基准测试：使用 TensorRT-LLM 进行性能调优

这是大语言模型延迟 – 吞吐量基准测试系列的第三篇博文，旨在指导开发者如何使用 TensorRT-LLM 对 LLM 推理进行基准测试。

3 MIN READ