NVIDIA GH200 Grace Hopper 슈퍼칩

대규모 AI 및 HPC 애플리케이션을 위한 획기적인 디자인입니다.

더 높은 성능과 더 빠른 메모리, 컴퓨팅 효율성을 위한 방대한 대역폭

NVIDIA GH200 Grace Hopper™ 슈퍼칩은 처음부터 대규모 AI고성능 컴퓨팅 (HPC) 애플리케이션을 위해 설계된 획기적인 프로세서입니다. 슈퍼칩은 테라바이트 단위의 데이터를 실행하는 애플리케이션의 성능을 최대 10배 향상하여 과학자와 연구원들이 세계에서 가장 복잡한 문제에 대한 탁월한 솔루션을 이끌어내도록 지원합니다.

Superchip 자세히 살펴보기

NVIDIA GH200 Grace Hopper 슈퍼칩

GH200 Grace Hopper 슈퍼칩은 NVIDIA NVLink™-C2C를 사용하는 NVIDIA Grace™ 및 Hopper™ 아키텍처를 결합하여 가속화된 AI와 HPC 애플리케이션을 위한 CPU+GPU 일관성 메모리 모델을 제공합니다. 초당 900GB/s의 일관된 인터페이스를 갖춘 이 슈퍼칩은 PCIe Gen5보다 7배 빠릅니다. 또한 HBM3 및 HBM3e GPU 메모리를 통해 가속 컴퓨팅과 생성형 AI를 강력하게 지원합니다. GH200은 NVIDIA AI Enterprise, HPC SDK, Omniverse™를 포함한 모든 NVIDIA 소프트웨어 스택과 플랫폼을 실행합니다

GH200은 현재 사용 가능합니다.

NVIDIA GH200 NVL2

NVIDIA GH200 NVL2는 2개의 GH200 슈퍼칩을 NVLink로 완전히 연결하여 최대 288GB의 고대역폭 메모리, 10TB/s의 메모리 대역폭, 1.2TB의 빠른 메모리를 제공합니다. 현재 사용 가능한 GH200 NVL2는 컴퓨팅 및 메모리 집약적인 워크로드를 위해 단일 서버에서 NVIDIA H100 텐서 코어 GPU보다 최대 3.5배 더 많은 GPU 메모리 용량과 3배 더 많은 대역폭을 제공합니다.

성능

GH200과 듀얼 소켓 프리미엄 CPU의 비교 | 물리 시뮬레이션: MILC Apex Medium

과학적 컴퓨팅

NVIDIA GH200 슈퍼칩NVLink-C2C를 사용하는 Arm® 기반 Grace CPU와 Hopper GPU 아키텍처를 통합하여 전 세계 슈퍼컴퓨터에서 과학 연구와 발견의 속도를 높이고 있습니다. NVIDIA Grace Hopper 슈퍼칩을 활용하는 슈퍼컴퓨터들은 함께 200엑사플롭스, 즉 초당 200경 번의 계산이 가능한 에너지 효율적인 AI 처리 성능을 제공합니다.

SF10을 사용한 16노드 GH200에서 NVIDIA RAPIDS™ 가속기를 사용하여 Apache Spark를 실행한 NDS-DS 결과와 16노드 프리미엄 CPU 비교.

데이터 처리

최근 스토리지와 네트워킹 대역폭의 발전, 그리고 무어의 법칙의 한계로 인해 분석 및 쿼리 병목 현상이 CPU에서 발생하게 되었습니다. GH200을 사용하면 CPU와 GPU가 프로세스당 단일 페이지 테이블을 공유하므로 모든 CPU 및 GPU 스레드가 물리적 CPU 또는 GPU 메모리에 상주할 수 있는 시스템 할당 메모리 전체에 액세스할 수 있습니다. GH200은 CPU와 GPU 간에 메모리를 앞뒤로 복사할 필요가 없어 데이터 처리 속도를 최대 36배 높입니다.

Face | batch = 1,024 | 출력 벡터 = 768 크기의 8,500만 개. 벡터 검색: 배치 = 10,000 | 벡터 검색 쿼리 = 8,500만 개 벡터에서 10,000개.

검색 증강 생성(RAG)

검색 증강 생성(RAG)은 거대 언어 모델(LLM)을 기술 기반과 연결하여 모델 정확도를 높일 수 있습니다. RAG는 임베딩을 생성하고 벡터 검색을 대규모로 실행해야 합니다. 72개의 고효율 Arm 기반 Grace CPU 코어는 기술 자료 데이터의 사전 처리를 가속화하며, NVLink-C2C는 사전 처리된 데이터를 PCIe 대비 7배 빠른 속도로 Hopper GPU로 전송하여 임베딩 생성 프로세스가 30배 빨라집니다.

PCIe H100과 GH200을 비교한 GraphSAGE 모델 전체 측정값을 기반으로 한 그래프 뉴럴 네트워크.

그래프 뉴럴 네트워크

그래프 뉴럴 네트워크(GNN)는 소셜 네트워크 분석, 신약 개발, 사기 감지, 분자 화학 등의 다양한 분야에서 사용됩니다. GH200은 최대 624GB의 CPU 및 GPU 통합 고속 메모리, 4페타플롭스의 H200 GPU, 900GB/s NVLink-C2C를 활용하여 H100 PCIe GPU 대비 GNN 훈련 속도를 최대 8배 높입니다.

GH200을 사용하는 LaunchPad 실습 살펴보기

Grace Hopper로 컴퓨팅 및 AI 가속화

이 데모에서는 NVIDIA GH200 Grace Hopper 슈퍼칩과 NVIDIA의 소프트웨어 스택의 완벽한 통합을 경험할 수 있습니다. 여기에는 LLM을 포함한 인터랙티브 데모, 실제 애플리케이션, 사례 연구가 포함됩니다.

최신 데이터센터 워크로드를 위한 NVIDIA Grace Hopper 레퍼런스 디자인 살펴보기

AI 트레이닝, 추론, 5G, HPC를 위한 GH200을 탑재한 NVIDIA MGX

NVIDIA MGX™는 다양한 엔터프라이즈 워크로드를 가속화할 수 있는 모듈형 레퍼런스 디자인입니다. MGX는 GH200 슈퍼칩의 첨단 기능을 NVIDIA BlueField®-3 DPU, OEM 정의 입/출력(IO), 4세대 NVLink와 통합하여 최신 데이터센터에 적합한 맞춤형 솔루션을 제공합니다.

NVIDIA는 성능 조정 가이드, 개발자 도구 및 라이브러리를 통해 NVIDIA Grace에 대한 심층적인 지원을 제공합니다.