Kubernetes 1.35 原生 Gang Scheduling:调度生态的“大一统”前夜
Kubernetes 1.35 引入的原生 Workload API 和 Gang Scheduling 支持,被业界视为云原生 AI 基础设施的一次“内核级重构”。要真正理解这次升级的分量,我们不仅要看它带来了什么,更要看它试图取代(或融合)什么。
在 v1.35 之前,面对 AI 训练任务的“资源死锁”痛点,社区实际上已经演化出了一个庞杂的“第三方调度器动物园”。本文将从原生原语出发,盘点现有生态选择,并揭示生产环境中的架构演进方向。
1. 缘起与冲突:原子化调度在 AI 时代的“水土不服”
在 Kubernetes 的经典设计中,Pod 是最小的原子调度单元。调度器采用“贪婪算法”,依次处理队列中的 Pod,只要当前节点满足需求就立即绑定。这种机制在微服务时代运转完美,但在 AI 分布式训练场景下却遭遇了语义冲突: