Volcano 批调度实战:AI 训练集群的 Gang Scheduling、队列与抢占2026-03-25·1782 字·9 分钟K8s 默认调度器对 AI 训练极不友好。Volcano 把 HPC 调度理念搬进 K8s:Gang Scheduling、Queue、Fairshare、Preemption、拓扑亲和。这篇讲清楚它在 AI 训练集群的落地。