分布式并行策略全景

从 DDP 到混合并行,系统梳理大模型训练中的所有并行策略。

2026年3月16日 · 13 分钟 · Zhanfeng Mo