报表管理¶
报表管理以可视化的方式,展示了集群、节点、容器组(Pod)、工作空间、命名空间、审计及告警维度的统计数据,为平台的计费及使用情况的调优提供了可靠的基础数据。
功能特性¶
- 支持查询自定义时间范围的统计数据
- 支持以 CSV 和 Excel 两种格式导出报表
- 支持开启/关闭单个报表,开启/关闭后,平台将在 20 分钟内开始/停止采集数据,往期已经采集到的数据还将正常显示
- 支持展示 CPU 使用率、内存使用率、存储使用率和 GPU 显存使用率的最大、最小和平均值
报表维度¶
目前支持以下几种报表:
- 集群报表:展示某段时间内所有集群的 CPU 使用率、内存使用率、存储使用率和 GPU 显存使用率的最大、最小和平均值,以及该段时间内集群下的节点数量, 可通过点击节点数量快捷进入节点报表,并查看该段时间内该集群下的节点使用情况。
- 节点报表:展示某段时间内所有节点的 CPU 使用率、内存使用率、存储使用率和 GPU 显存使用率的最大、最小和平均值,以及节点的 IP、类型和所属集群。
- 容器组报表:展示某段时间内所有容器组的 CPU 使用率、内存使用率、存储使用率和 GPU 显存使用率的最大、最小和平均值,以及容器组的所属命名空间、所属集群和所属工作空间。
- 工作空间报表:展示某段时间内所有工作空间的 CPU 使用率、内存使用率、存储使用率和 GPU 显存使用率的最大、最小和平均值,以及命名空间数量和容器组数量, 可通过点击命名空间数量快捷进入命名空间报表,并查看该段时间内该工作空间下命名空间的使用情况;同样的方式可查看该段时间下该工作空间下的容器组的使用情况。
- 命名空间报表:展示某段时间内所有命名空间的 CPU 使用率、内存使用率、存储使用率和 GPU 显存使用率的最大、最小和平均值,以及容器组数量、所属集群、所属工作空间, 可通过点击容器组数量快捷进入容器组报表,并查看该段时间内该命名空间下的容器组的使用情况。
- 审计报表:分为用户操作和资源操作两个报表。用户操作报表主要统计单个用户在一段时间内的操作次数,以及成功和失败的次数; 资源操作报表主要统计所有用户对某种类型资源的操作次数。
- 告警报表:展示某段时间内所有节点的告警数量,以及致命、严重、告警分别产生的次数。
操作步骤¶
-
使用具有 Admin 角色的用户登录 AI 算力平台。点击左侧导航栏底部的 全局管理 -> 运营管理 。
-
进入运营管理后切换不同菜单可查看集群、节点、容器组等报表。