Skip to content

基于内置指标创建 HPA

算丰 AI 算力平台支持 Pod 资源基于指标进行弹性伸缩(Horizontal Pod Autoscaling, HPA)。 用户可以通过设置 CPU 利用率、内存用量及自定义指标指标来动态调整 Pod 资源的副本数量。 例如,为工作负载设置基于 CPU 利用率指标弹性伸缩策略后,当 Pod 的 CPU 利用率超过/低于您设置的指标阀值,工作负载控制器将会自动增加/较少 Pod 副本数。

本文将介绍如何为工作负载配置基于内置指标的弹性伸缩。

Note

  1. HPA 仅适用于 Deployment 和 StatefulSet,每个工作负载只能创建一个 HPA。
  2. 如果基于 CPU 利用率创建 HPA 策略,必须预先为工作负载设置配置限制(Limit),否则无法计算 CPU 利用率。
  3. 如果同时使用内置指标和多种自定义指,HPA 会根据多项指标分别计算所需伸缩副本数,取较大值(但不会超过设置 HPA 策略时配置的最大副本数)进行弹性伸缩。

内置指标弹性伸缩策略

系统内置了 CPU 和内存两种弹性伸缩指标以满足用户的基础业务使用场景。

前提条件

在为工作负载配置内置指标弹性伸缩策略之前,需要满足以下前提条件:

操作步骤

参考以下步骤,为工作负载配置内置指标弹性伸缩策略。

  1. 点击左侧导航栏上的 集群列表 进入集群列表页面。点击一个集群名称,进入 集群详情 页面。

    集群详情

  2. 在集群详情页面,点击左侧导航栏的 工作负载 进入工作负载列表后,点击一个负载名称,进入 工作负载详情 页面。

    工作负载

  3. 点击 弹性伸缩 页签,查看当前集群的弹性伸缩配置情况。

    弹性伸缩

  4. 确认集群已安装了 metrics-server 插件,且插件运行状态为正常后,即可点击 新建伸缩 按钮。

    新建伸缩

  5. 创建自定义指标弹性伸缩策略参数。

    工作负载

    • 策略名称:输入弹性伸缩策略的名称,请注意名称最长 63 个字符,只能包含小写字母、数字及分隔符(“-”),且必须以小写字母或数字开头及结尾,例如 hpa-my-dep。
    • 命名空间:负载所在的命名空间。
    • 工作负载:执行弹性伸缩的工作负载对象。
    • 目标 CPU 利用率:工作负载资源下 Pod 的 CPU 使用率。计算方式为:工作负载下所有的 Pod 资源 / 工作负载的请求(request)值。当实际 CPU 用量大于/小于目标值时,系统自动减少/增加 Pod 副本数量。
    • 目标内存用量:工作负载资源下的 Pod 的内存用量。当实际内存用量大于/小于目标值时,系统自动减少/增加 Pod 副本数量。
    • 副本范围:Pod 副本数的弹性伸缩范围。默认区间为为 1 - 10。
  6. 完成参数配置后,点击 确定 按钮,自动返回弹性伸缩详情页面。点击列表右侧的 ,可以执行编辑、删除操作,还可以查看相关事件。

    工作负载