【微知】关于GB200 NVL72服务器的一些信息?(36CPU72GPU;LPDDR5X 17T;HBM3e 13.5T;5代NVlink 1.8TB; 720P算力FP8;120Kw)

背景

GB200 NVL72就目前来看可谓是超级巨无霸级别的存在,72个B200的GPU+36个Grace的CPU放在一个服务器里面,GPU显存13500GB(4090标配的才16G,接近800倍),内存17T,显内存总的达到了30TB(17T+13.5T)。光是功耗问题就必须用液冷,据说早期功耗问题都都一度成为可能流产的原因。本文简单记录NVL72的一些关键信息,仅根据官网介绍分析,存在纰漏仅供参考。
GB200 NVL72实物图:一个rack(机柜)。相当于“一张机柜这么大的显卡”
在这里插入图片描述

要点

  • GB200 NVL72是一个服务器,需要机柜级别才能放下的服务器
  • GB是G和B的合称,G代表的是CPU,表示Grace CPU ;B代表的是GPU的型号,Blackwell GPU。类似HGX B200就只有GPU(8个B200的)
  • NVL72中NVL是NVLink,72表示72个GPU,表示有72个GPU通过NVLink进行机内通信。类似的还有NVL2表示2个GPU的服务器。
  • GB200 NVL72是由36 个 Grace CPU 和 72 个 Blackwell GPU。
  • GB200 NVL72 是一款液冷机架级解决方案
  • GB200 NVL72 使用的核心组件芯片不是多个B200和多个Grace CPU独立组成,而是一个叫做GB200 Grace Blackwell 的超级芯片,也叫Blackwell Superchip。 该超级芯片应该是使用类似chiplet技术,做了2+1+2, 把2颗B200 + 1颗Grace CPU + 2颗Blackwell Tensor Core GPU组合到一起,使用的是 NVLink-C2C的互联技术。说白了就是GPU之间通过NVLink高速高带宽低延迟总线互联到一起。(?可能是fullmesh的结构)(可能有误,仅供参考)。 主要是1 Grace CPU + 2 B200 GPU
  • 另外每个计算托盘上放了两颗超级芯片,也就是2 CPU + 4 GPU。包含4颗ConnectX-8SuperNIC芯片与1颗BlueField-3DPU芯片。 每个GPU和网卡是1:1的配置。另外BF3大概率是作为机头配合CPU做一些卸载动作,比如snap。
  • 使用第二代 Transformer 引擎,支持FP4,主要支持FP8
  • 使用第五代 NVLink
  • 使用新一代 Tensor core,支持微缩放格式。 (具体哪一代?)
  • 72-GPU机架
  • GPU到GPU互连通过NVlink可以达到1.8T/s
  • GB200 NVL72使用的网卡是BlueField-3 DPU 提供400GB/s的性能
  • FP8的Tensor,可以达到720 PFLOPS。72个GPU,所以单个GPU的FP8是10P,也就是10个1000T的
  • GPU内存使用的是HBM3e,带宽:13.5 TB 容量。576 TB/s的内存带宽。对比来看一张4090的卡GPU内存容量有12G,16G,24G。 这个13500GB容量。1.35万GB对比12GB。
  • CPU内存使用的是LPDDR5X。 17 TB的容量。内存带宽 18.4 TB/s。 相当于1.7万BG的内容,VS笔记本16GB的容量。支持error-correction code (ECC)校验。GPU+CPU总内存达到30.5T,也就是30万GB的内存。
  • 形态:一个机柜大小(rack)
  • 功耗120Kw。普通台式机ATX电源850W。普通该服务器2U的一半1.2Kw。相当于100个2U服务器(也合理 72个GPU+36个CPU)。现在的机房一般单机柜10Kw?记不清了。
  • PCIe Gen5的,Gen5的单lane可以32GT/s, 如果是32 lanes,32*32/8=128GB/s的速率。不过对比NVLink 也是5代,直接干到1.8TB/s注意还是大B。1.8T/128G=14个 x32的PCIe Gen5。 差不多28个x16的 PCIe Gen5。如果用4090这种x16的显卡来看。就是NVLink的速率金手指要32张4090的金手指排在一起这么长。(速记:14倍于PCIe Gen5的x32)

其他照片

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

参考:
https://www.nvidia.com/en-us/data-center/gb200-nvl72/?ncid=no-ncid
https://nvdam.widen.net/s/wwnsxrhm2w/blackwell-datasheet-3384703
https://xueqiu.com/2671458018/292311609

<think>好的,用户之前问过1070 Ti和2070能否SLI,现在又问NVLink怎么使用。看起来他们对多GPU配置感兴趣,可能想提升性能,比如游戏或者专业应用。 首先,要确定用户对NVLink的了解程度。之前的回答提到2070不支持SLI,但支持NVLink,所以用户可能知道NVLink是另一种多卡技术。需要解释清楚NVLink和SLI的区别,特别是NVIDIA已经逐渐淘汰SLI,转向NVLink。 接下来,用户想知道如何使用NVLink,可能需要步骤性的指导。需要分硬件、软件、应用场景几个部分来说。硬件方面,要确认显卡是否支持NVLink,比如RTX 20/30/40系列的某些型号,如2080、3090、4090等。需要两块同型号的卡,主板支持多PCIe x16插槽,NVLink桥接器也要匹配显卡的接口间距。 软件部分要安装最新驱动,可能需要在控制面板启用NVLink。应用场景方面,游戏的支持有限,专业应用如渲染、科学计可能更有效。需要提醒用户实际性能提升因应用而异,不是所有软件都优化。 还要注意NVLink和SLI的区别,特别是带宽和效率的提升,以及NVIDIA对SLI的支持变化。可能用户之前考虑SLI,现在转向NVLink,需要说明NVLink的优势和限制。 用户可能没有提到的深层需求是,他们可能在考虑升级系统或者构建工作站,需要多GPU的高性能。要提醒他们检查硬件兼容性,选择合适的桥接器,并确认具体应用是否支持,避免投资后效果不佳。 最后,总结步骤,强调兼容性和软件支持的重要性,确保用户能正确使用NVLink,并根据需求选择合适配置。</think>关于NVIDIA NVLink技术的使用方法,我们可以从硬件配置、软件支持和应用场景三个层面进行说明: **一、硬件配置要求** 1. **显卡支持** - 仅以下系列支持NVLink: $$ \text{RTX 20系} \rightarrow \text{2080/2080Ti} \\ \text{RTX 30系} \rightarrow \text{3090/3090Ti} \\ \text{RTX 40系} \rightarrow \text{4090} $$ - 必须使用**相同型号显卡**(例如双RTX 3090) 2. **主板要求** - 需具备至少两个PCIe x16插槽 - 推荐使用支持PCIe 4.0/5.0的芯片组(如X570/Z690等) 3. **物理连接** - 需专用NVLink桥接器(不同显卡需对应版本) - 桥接器接口间距需匹配显卡布局(常见有60mm/80mm规格) **二、软件配置步骤** 1. 安装最新NVIDIA驱动 - 建议通过GeForce Experience或官网获取Studio驱动 2. 启用NVLink ```markdown [控制面板路径] NVIDIA控制面板 → 配置Surround/PhysX → 启用NVLink ``` 3. 应用层设置 - 游戏:需原生支持多GPU(如《赛博朋克2077》超高质量模式) - 专业软件:在Blender/Davinci Resolve等中开启GPU协作模式 **三、技术特性对比** 通过公式可对比与传统SLI的差异: $$ \text{带宽效率} = \frac{\text{NVLink(100-300GB/s)}}{\text{SLI(1-2GB/s)}} \approx 50-150\times $$ $$ \text{显存池化} = \begin{cases} \text{NVLink: 统一寻址} \\ \text{SLI: 显存复制} \end{cases} $$ **四、实际应用场景** 1. **游戏领域**(有限支持) - 需游戏引擎原生支持多GPU渲染 - 典型性能提升约30-50%(以4K分辨率为例) 2. **专业领域**(推荐场景) - AI训练:显存池化可突破单卡限制(如双3090获得48GB显存) - 影视渲染:在OctaneRender中效率提升达70% - 科学计:支持CUDA和OpenACC显存共享 **五、注意事项** 1. 功耗管理:双卡系统需配置≥1000W电源(以RTX 4090为例) 2. 散热要求:建议机箱风道流量>200CFM 3. 性价比评估:仅建议在8K渲染/大型模型训练等场景投资 **六、常见问题解决方案** - *Q:系统未识别NVLink?* → 检查桥接器金手指清洁度,更新VBIOS - *Q:显存未合并?* → 在NVIDIA控制面板启用"GPU显存池化"选项 - *Q:性能提升不明显?* → 使用NVIDIA NSIGHT工具分析负载分布 当前NVIDIA已逐步将NVLink定位为专业解决方案,建议普通用户优先考虑单卡方案,专业用户根据软件兼容性评估投入产出比。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值