GPU 的架构
- GPU 包含成千上万个计算单元,可以同时执行大量的并行任务。
- 例如,NVIDIA 的 A100 GPU 有 6912 个 CUDA 核心,可以同时处理多个计算任务。
NVIDIA 的 CUDA 核心
- NVIDIA 的 CUDA 核心是其 GPU 中的并行计算单元,专门用于加速深度学习、科学计算、图形渲染等任务。
- CUDA 核心是 NVIDIA 的专有架构,其他 GPU 厂商有类似的并行计算单元。
各厂商 GPU 的对比
以下是 NVIDIA、AMD 和 Intel GPU 计算单元的对比:
厂商 | 计算单元名称 | 示例 GPU | 计算单元数量 | 编程接口 |
---|---|---|---|---|
NVIDIA | CUDA 核心 | NVIDIA A100 | 6912 个 CUDA 核心 | CUDA、cuDNN |
AMD | 流处理器(SPs) | AMD Radeon RX 6800 XT | 4608 个流处理器 | ROCm |
Intel | 执行单元(EUs) | Intel Arc A770 | 4096 个执行单元 | oneAPI |