Notebook 不受队列配额控制¶
在 AI Lab 中,用户在创建 Notebook 时,发现选择的队列即使资源不足,Notebook 依然可以创建成功。
问题 01: Kubernetes 版本不支持¶
-
分析:
AI Lab 中的队列管理能力由 Kueue 提供, Notebook 服务是通过 JupyterHub 提供的。 JupyterHub 对 Kubernetes 的版本要求较高,对于低于 v1.27 的版本,即使在 AI 算力中心中设置了队列配额, 用户在创建 Notebook 时也选择了配额,但 Notebook 实际也不会受到队列配额的限制。
-
解决办法:提前规划,生产环境中建议使用 Kubernetes 版本
v1.27
以上。
问题 02: 配置未启用¶
-
分析:
当 Kubernetes 集群版本 大于 v1.27 时,Notebook 仍无法受到队列配额的限制。
这是因为,Kueue 需要启用对
enablePlainPod
支持,才会对 Notebook 服务生效。 -
解决办法:在工作集群中部署
baize-agent
时,启用 Kueue 对enablePlainPod
的支持。