创建任务(Job)¶
任务管理是指通过作业调度和管控组件来创建和管理任务生命周期的功能。
AI Lab 采用 Kubernetes 的 Job 机制来调度各项 AI 推理、训练任务。
通用步骤¶
-
在左侧导航栏中点击 任务中心 -> 训练任务 ,点击右侧的 创建 按钮。
-
系统会预先填充基础配置数据,包括要部署的集群、命名空间、任务类型、队列、优先级等。 调整这些参数后点击 下一步 。
-
配置镜像地址、运行参数以及关联的数据集、环境和资源后,点击 下一步 。
-
按需添加标签、注解、环境变量等任务参数,选择调度策略后点击 确定 。
-
任务创建成功后,会有几种运行状态:
- 运行中
- 排队中
- 提交成功、提交失败
- 任务成功、任务失败