Published at 2024-08-19 | Last Update 2024-08-19
记录一些平时接触到的 GPU 知识。由于是笔记而非教程,因此内容不求连贯,有基础的同学可作查漏补缺之用。
水平及维护精力所限,文中不免存在错误或过时之处,请酌情参考。 传播知识,尊重劳动,年满十八周岁,转载请注明出处。
Intel/AMD x86 CPU
+ NVIDIA GPU
NVIDIA CPU
+ NVIDIA GPU
2024 之前,不管是 NVIDIA 原厂还是第三方服务器厂商的 NVIDIA GPU 机器,都是以 x86 CPU 机器为底座, GPU 以 PCIe 板卡或 8 卡模组的方式连接到主板上,我们在第一篇中有过详细介绍,
典型 8 卡 A100 主机硬件拓扑
这时 CPU 和 GPU 是独立的,服务器厂商只要买 GPU 模组(例如 8*A100),都可以自己组装服务器。 至于 Intel/AMD CPU 用哪家,就看性能、成本或性价比考虑了。
随着 2024 年 NVIDIA GH200 芯片的问世,NVIDIA 的 GPU 开始自带 CPU 了。
所以 NVIDIA 集成度越来越高,开始提供整机或整机柜。
ARM
)基于 ARMv9
设计。
比如 Hopper 系列,先出的 H100-80GB,后面继续迭代:
H800
:H100 的阉割版,H20
:H200 的阉割版,比 H800 还差,差多了。算力对比:GPU Performance (Data Sheets) Quick Reference (2023)
GH200
一张板子:
NVIDIA GH200 芯片(板卡)渲染图。左:Grace CPU 芯片;右:Hopper GPU 芯片 [2]
GB200
一个板子(模块),功耗太大,自带液冷:
NVIDIA GB200 渲染图,一个模块包括 2 Grace CPU + 4 B200 GPU,另外自带了液冷模块。 [3]
72 张 B200 组成一个原厂机柜 NVL72:
NVIDIA GB200 NVL72 机柜。 [3]
CPU+GPU+RAM+VRAM
集成到单颗芯片NVIDIA GH200 芯片(单颗)逻辑图。[2]
如上图所示,一颗 GH200 超级芯片集成了下面这些核心部件:
CPU 通过 4 个 PCIe Gen5 x16 连接到主板,
CPU 和 GPU 之间,通过 NVLink® Chip-2-Chip (NVLink-C2C
) 技术互连,
GPU 互连(同主机扩跨主机):18x NVLINK4
NVLink-C2C 提供了一种 NVIDIA 所谓的“memory coherency”:内存/显存一致性。好处:
下面再展开看看 CPU、内存、GPU 等等硬件。
72-core ARMv9
CPU72-core
Grace CPU (Neoverse V2 Armv9 core
)480GB LPDDR5X
(Low-Power DDR) 内存参考下这个速度在存储领域的位置:
Fig. Peak bandwidth of storage media, networking, and distributed storage solutions. [1]
DDR vs. LPDDR vs. HBM
DDR
内存,通过主板上的 DIMM 插槽连接到 CPU,[1] 中有详细介绍;下面列个表格对比三种内存的优缺点,注意其中的高/中/低都是三者相对而言的:
DDR | LPDDR | HBM | |
---|---|---|---|
容量 | 大 | 中 | 小 |
速度 | 慢 | 中 | 快 |
带宽 | 低 | 中 | 高 |
可扩展性 | 好 | 差 | 差 |
可插拔 | 可 | 不可 | 不可 |
成本 | 低 | 中 | 高 |
功耗 | 高 | 中 | 低 |
更多细节,见 [1]。
例如,与 8-channel DDR5
(目前高端 x86 服务器的配置)相比,
GH200 的 LPDDR5X 内存带宽高 53%
,功耗还低 1/8
。
算力见下面。
支持两种显存,二选一:
GH200 NVL2
,用 NVLINK 全连接两颗 GH200
在一张板子内放两颗 GH200 芯片,CPU/GPU/RAM/VRAM 等等都翻倍,而且两颗芯片之间是全连接。
例如,对于一台能插 8 张板卡的服务器,
8 * {72 Grace CPU, 1 H200 GPU}
8 * {144 Grace CPU, 2 H200 GPU}
GH200
& GH200 NVL2
产品参数(算力)NVIDIA GH200 产品参数。上半部分是 CPU、内存等参数,从 "FP64" 往下是 GPU 参数。[2]
两种服务器规格,分别对应 PCIe 板卡和 NVLINK 板卡。
下图是单卡 node 的一种组网方式:
NVIDIA GH200 MGX 服务器组网。每台 node 只有一片 GH200 芯片,作为 PCIe 板卡,没有 NVLINK。[2]
GPU->CPU-->NIC
出去)的方式实现通信;通过 NVLINk 将 32 个 GH200 芯片全连接为一个逻辑 GPU 模块,所以叫 NVL32
,
NVIDIA GH200 NVL32 组网。[2]
19.5TB
内存+显存;NVLink TLB 能让任意一个 GPU 访问这个机柜内的任意内存/显存;
NVIDIA GH200 NVL32 中 3 种内存/显存访问方式。[2]
本文粗浅地整理了一些 NVIDIA GH200 相关技术知识。
其他: