使用 MIG GPU 资源¶
本节介绍应用如何使用 MIG GPU 资源。
前提条件¶
- 已经部署 算丰 AI 算力平台 容器管理平台,且平台运行正常。
- 容器管理模块已接入 Kubernetes 集群或者已创建 Kubernetes 集群,且能够访问集群的 UI 界面。
- 已安装 GPU Operator。
- 集群节点上具有对应型号的 GPU 卡
UI 界面使用 MIG GPU¶
-
确认集群是否已识别 GPU 卡类型
进入 集群详情 -> 节点管理 ,查看是否已正确识别为 MIG 模式。
-
通过镜像部署应用,可选择并使用 NVIDIA MIG 资源。
-
MIG Single 模式示例(与整卡使用方式相同):
Note
MIG single 策略允许用户以与 GPU 整卡相同的方式(
nvidia.com/gpu
)请求和使用GPU资源,不同的是这些资源可以是 GPU 的一部分(MIG设备),而不是整个GPU。了解更多 GPU MIG 模式设计 -
MIG Mixed 模式示例:
-
YAML 配置使用 MIG¶
MIG Single 模式:
apiVersion: apps/v1
kind: Deployment
metadata:
name: mig-demo
namespace: default
spec:
replicas: 1
selector:
matchLabels:
app: mig-demo
template:
metadata:
creationTimestamp: null
labels:
app: mig-demo
spec:
containers:
- name: mig-demo1
image: chrstnhntschl/gpu_burn
resources:
limits:
nvidia.com/gpu: 2 # (1)!
imagePullPolicy: Always
restartPolicy: Always
- 申请 MIG GPU 的数量
MIG Mixed 模式:
apiVersion: apps/v1
kind: Deployment
metadata:
name: mig-demo
namespace: default
spec:
replicas: 1
selector:
matchLabels:
app: mig-demo
template:
metadata:
creationTimestamp: null
labels:
app: mig-demo
spec:
containers:
- name: mig-demo1
image: chrstnhntschl/gpu_burn
resources:
limits:
nvidia.com/mig-4g.20gb: 1 # (1)!
imagePullPolicy: Always
restartPolicy: Always
- 通过 nvidia.com/mig-g.gb 的资源类型公开各个 MIG 设备
进入容器后可以查看只使用了一个 MIG 设备。