NVIDIA GH200 Grace Hopper 超級晶片

支援大規模人工智慧與高效能運算應用程式的開創性設計。

效能更高、記憶體更快速:具備超大頻寬,可提升運算效率

NVIDIA GH200 Grace Hopper™ 超級晶片是一款突破性處理器,人工智慧, 高效能運算智慧與高效能運算應用程式。這款超級晶片為執行 TB 級資料的應用程式提供 10 倍效能,堪稱無可比擬的解決方案,幫助科學家與研究人員解決世上最複雜的問題。

深入瞭解超級晶片

NVIDIA GH200 Grace Hopper 超級晶片

GH200 Grace Hopper Superchip 運用 NVIDIA NVLink™-C2C 整合 NVIDIA Grace™ 與 Hopper™ 架構,提供適合加速人工智慧與高效能運算應用情境的 CPU+GPU 一致性記憶體模型。這款超級晶片搭載每秒 900 GB 的一致性介面,速度是 PCIe Gen5 的 7 倍。此外,這款晶片搭載 HBM3 與 HBM3e GPU 記憶體,大幅提升加速運算和生成式人工智慧的效能。GH200 可執行所有 NVIDIA 軟體堆疊和平台,包括 NVIDIA AI Enterprise、HPC SDK 和 Omniverse™

GH200 目前已上市。

NVIDIA GH200 NVL2

NVIDIA GH200 NVL2 透過 NVLink 完全連接兩個 GH200 超級晶片,提供 288GB 的高頻寬記憶體、每秒 10 TB 的記憶體頻寬,以及 1.2TB 的快速記憶體。GH200 NVL2 現已上市,提供高達 3.5 倍的 GPU 內存容量和 3 倍的帶寬,相較於 NVIDIA H100 Tensor Core GPU,適用於需要大量運算和內存的工作負載。

效能

GH200 與雙插槽高階 CPU 的比較 | 物理:MILC Apex Medium

科學運算

NVIDIA GH200 Superchip 透過 NVLink-C2C 整合 Arm® 技術 Grace CPU 與 Hopper GPU 架構,加快全球超級電腦科學研究與發現的速度。超級電腦整合上述技術後,利用 NVIDIA Grace Hopper Superchip 提供每秒 200 艾次浮點運算或 2 萬京次計算的節能人工智慧處理能力。

比較 16 節點 GH200 搭配 NVIDIA RAPIDS™ 加速器以 SF10 執行 Apache Spark,相較於 16 節點高階 CPU 執行 Apache Spark 的 NDS-DS 結果。

資料處理

近期儲存與網路頻寬技術有所進展,但摩爾定律終結,因此 CPU 反倒成了分析與查詢時的瓶頸。在 GH200,CPU 與 GPU 共用單一每行程頁表,所有 CPU 和 GPU 執行緒因而得以存取所有系統分配的記憶體,而且記憶體的位置可以是實體 CPU 或 GPU 記憶體。GH200 再也不必在 CPU 與 GPU 之間反覆複製記憶體,資料處理速度加快 36 倍。

臉部辨識 | 批次 = 1,024 | 輸出向量 = 8,500 萬,向量大小為 768。向量搜尋:批次 = 10,000 | 在 8,500 萬個向量的向量搜尋查詢 = 10,000。

檢索增強生成

檢索增強生成 (RAG) 連線大型語言模型 (LLM) 與知識庫可提升模型準確度。RAG 需要大規模生成嵌入及執行向量搜尋。72 個節能的 Arm 技術 Grace CPU 核心加速預先處理知識庫資料,而且相較於 PCIe,NVLink-C2C 將傳輸預先處理資料至 Hopper GPU 的速度加快 7 倍,嵌入生成程序最終得以加速 30 倍。

圖神經網路參考完整的 GraphSAGE 模型測量指標,比較 PCIe H100 與 GH200。

圖神經網路

圖神經網路 (GNN) 應用廣泛,例如社群網路分析、藥物發現、詐騙偵測與分子化學。相較於 H100 PCIe GPU,GH200 利用 624 GB 整合的 CPU 與 GPU 快速記憶體、4 petaFLOPS 的 H200 GPU 與每秒 900 GB NVLink-C2C,GNN 訓練的速度加快達 8 倍。

運用 GH200 探索 LaunchPad 實驗室

運用 Grace Hopper 加快運算與人工智慧速度

在這場技術展示,您將體驗 NVIDIA GH200 Grace Hopper Superchip 與 NVIDIA 軟體堆疊如何順暢整合。展示內容包含互動式技術展示,以及 LLM 在內的實際應用情境與案例研究。

專為現代資料中心工作負載設計的 NVIDIA Grace Hopper

搭載 GH200 的 NVIDIA MGX 適用於人工智慧訓練、推論、5G 與高效能運算

NVIDIA MGX™ 這款模組化參考設計,可加速各式各樣企業工作負載。MGX 整合 GH200 Superchip 的先進功能,以及 NVIDIA BlueField®-3 DPU、OEM 定義的輸入/輸出 (IO),以及第 4 代 NVLink,為現代資料中心量身打造解決方案。

NVIDIA 為 NVIDIA Grace 提供深度支援,包含效能調整指南、開發人員工具和函式庫。