运维管理¶ 运维管理是 IT 运维人员日常管理 IT 资源,处理工作的空间。 在这里可以直观地了解当前集群、节点、CPU、GPU、vGPU 等资源的使用状况。 常见术语¶ GPU 分配率:统计当前集群内所有未完成的任务的 GPU 分配情况,统计请求的 GPU(Request)与总资源量(Total)之间的比例。 GPU 利用率:统计当前集群中所有运行中的任务的实际资源利用情况,统计实际使用的 GPU(Usage)与总资源量(Total)之间的比例。