Skip to content

使用 MIG GPU 资源

本节介绍应用如何使用 MIG GPU 资源。

前提条件

UI 界面使用 MIG GPU

  1. 确认集群是否已识别 GPU 卡类型

    进入 集群详情 -> 节点管理 ,查看是否已正确识别为 MIG 模式。

    gpu

  2. 通过镜像部署应用,可选择并使用 NVIDIA MIG 资源。

    • MIG Single 模式示例(与整卡使用方式相同):

      Note

      MIG single 策略允许用户以与 GPU 整卡相同的方式(nvidia.com/gpu)请求和使用GPU资源,不同的是这些资源可以是 GPU 的一部分(MIG设备),而不是整个GPU。了解更多 GPU MIG 模式设计

      usemig

    • MIG Mixed 模式示例:

      mig02

YAML 配置使用 MIG

MIG Single 模式:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: mig-demo
  namespace: default
spec:
  replicas: 1
  selector:
    matchLabels:
      app: mig-demo
  template:
    metadata:
      creationTimestamp: null
      labels:
        app: mig-demo
    spec:
      containers:
        - name: mig-demo1
          image: chrstnhntschl/gpu_burn
          resources:
            limits:
              nvidia.com/gpu: 2 # (1)!
          imagePullPolicy: Always
      restartPolicy: Always
  1. 申请 MIG GPU 的数量

MIG Mixed 模式:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: mig-demo
  namespace: default
spec:
  replicas: 1
  selector:
    matchLabels:
      app: mig-demo
  template:
    metadata:
      creationTimestamp: null
      labels:
        app: mig-demo
    spec:
      containers:
        - name: mig-demo1
          image: chrstnhntschl/gpu_burn
          resources:
            limits:
              nvidia.com/mig-4g.20gb: 1 # (1)!
          imagePullPolicy: Always
      restartPolicy: Always
  1. 通过 nvidia.com/mig-g.gb 的资源类型公开各个 MIG 设备

进入容器后可以查看只使用了一个 MIG 设备。

mig03