GPU 显存模型与分布式通信基础

从 GPU 显存层级到 NCCL 通信原语,理解 LLM Infra 优化的两大基石。

2026年3月15日 · 12 分钟 · Zhanfeng Mo