Skip to content

运维管理

运维管理是 IT 运维人员日常管理 IT 资源,处理工作的空间。

运维管理概览

在这里可以直观地了解当前集群、节点、CPU、GPU、vGPU 等资源的使用状况。

常见术语

  • GPU 分配率:统计当前集群内所有未完成的任务的 GPU 分配情况,统计请求的 GPU(Request)与总资源量(Total)之间的比例。
  • GPU 利用率:统计当前集群中所有运行中的任务的实际资源利用情况,统计实际使用的 GPU(Usage)与总资源量(Total)之间的比例。