NVIDIA Grid vGPU 디바이스에 대한 사용자 지정 VM 클래스를 생성하려면 이 항목을 참조하십시오.

vGPU 프로파일(v8 U2 P03 이상)을 사용하여 사용자 지정 VM 클래스 생성

NVIDIA vGPU(가상 그래픽 처리 장치)를 사용하면 여러 VM(가상 시스템)이 하나의 물리적 GPU를 공유할 수 있습니다. TKGS 클러스터에서 vGPU를 사용하려면 사용자 지정 VM 클래스를 정의합니다. 이 릴리스부터 사용자 지정 VM 클래스를 정의하기 위한 새로운 마법사가 제공됩니다. 사용자 지정 VM 클래스를 정의하기 위한 이전 방법과 달리 vGPU 프로파일은 VM 클래스에서 구성되지 않고 디바이스에서 읽습니다.

VM 운영자는 vCenter 인벤토리를 폴링하여 감독자가 배포된 vSphere 클러스터를 구성하는 ESXi 호스트에 설치된 모든 vGPU 디바이스를 가져옵니다. vGPU 디바이스는 해당 프로파일을 정의합니다. vGPU 디바이스 이름은 프로파일이 다중 인스턴스 GPU(MIG)인지 아니면 시간 공유 GPU인지 나타냅니다. MIG는 계산을 분할하고 여러 워크로드를 단일 GPU에서 병렬로 실행할 수 있도록 지원합니다. 시간 공유는 GPU에 대한 공유 액세스를 제공합니다. MIG 모드는 최신 GPU 아키텍처를 기반으로 하며 NVIDIA A100 및 A30 디바이스에서만 지원됩니다. 자세한 내용은 NVIDIA 설명서를 참조하십시오.

예를 들어, GPU 디바이스 "grid-a100-40c"는 40GB 메모리가 있는 NVIDIA A100 GPU 디바이스를 VM에 할당하는 시간 공유 vGPU 프로파일을 제공합니다. 이에 상응하는 MIG 기반 vGPU 프로파일은 "grid-a100-7-40c" 디바이스입니다. 디바이스와 RAM 사이에 추가 번호가 있으므로 MIG 프로파일임을 식별할 수 있습니다. "7"은 GPU 디바이스에 7개의 계산 슬라이스가 있음을 나타냅니다. MIG 기반 vGPU 프로파일에는 1, 2, 3 또는 7개의 계산 슬라이스가 있을 수 있습니다.

  1. vSphere Client 홈 메뉴에서 워크로드 관리 > 서비스를 선택합니다.
  2. VM 클래스 탭을 선택합니다.
  3. VM 클래스 생성을 클릭합니다.

    이 작업을 수행하면 VM 클래스 생성을 안내하는 VM 클래스 생성 마법사가 시작됩니다.

  4. 이름에 VM 클래스의 이름을 입력하고 다음을 클릭합니다.
    VM 클래스 이름은 VM 클래스를 식별합니다. 다음 요구 사항을 따르는 고유한 DNS 규정 준수 이름을 입력합니다.
    • 사용자 환경에서 기본 또는 사용자 지정 VM 클래스의 이름과 중복되지 않는 고유한 이름을 사용합니다.
    • 영숫자 문자열(최대 길이 63자)을 사용합니다.
    • 대문자나 공백은 사용하지 마십시오.
    • 대시는 첫 번째 또는 마지막 문자를 제외한 아무 곳에나 사용합니다. 예: vm-class1.
    • VM 클래스를 생성한 후에는 이름을 변경할 수 없습니다.
  5. 호환성의 경우 ESXi 8.0 U2 이상을 선택하고 다음을 클릭합니다.
    자세한 내용은 가상 시스템 호환성을 참조하십시오.
    참고: VM 클래스가 생성된 후에는 하드웨어 호환성을 변경할 수 없습니다.
  6. 구성 > 가상 하드웨어의 경우 NVIDIA GPU 디바이스를 VM 클래스에 추가합니다.
    1. 구성 > 가상 하드웨어 > 새 디바이스 추가 > PCI 디바이스를 선택합니다.
    2. 목록에서 원하는 NVIDIA Grid vGPU 디바이스를 선택합니다. NVIDIA Grid vGPU 프로파일에는 시간 공유다중 인스턴스 GPU 공유의 두 가지 유형이 있습니다. 디바이스를 선택하면 시스템에서 프로파일이 감지됩니다.
      참고: VM 클래스에는 MIG 프로파일 유형의 NVIDIA GRID vGPU 디바이스를 하나만 추가할 수 있습니다.
    3. 선택을 클릭하면 [가상 하드웨어] 탭에 새 PCI 디바이스가 나타납니다.
  7. 구성 > 가상 하드웨어의 경우 CPU, 메모리, 새 PCI 디바이스, 비디오 카드보안 디바이스에 대해 원하는 설정을 지정합니다.
    표 1. CPU 구성
    설정 구성
    CPU VM의 가상 CPU 수를 선택합니다. 자세한 내용은 가상 CPU 구성 및 제한 사항을 참조하십시오.
    CPU 토폴로지 전원을 켤 때 할당됨
    예약 예약은 0에서 10MHz 사이여야 합니다.
    제한 제한은 10MHz보다 크거나 같아야 합니다.
    공유 옵션은 낮음, 보통, 높음, 사용자 지정입니다.
    하드웨어 가상화 게스트 운영 체제에 하드웨어 지원 가상화를 노출하려면 이 옵션을 선택합니다.
    성능 카운터 가상화된 CPU 성능 카운터 사용
    스케줄링 선호도 이 가상 시스템에 대한 물리적 프로세서 선호도를 선택합니다. 범위를 나타내려면 '-'를 사용하고 값을 구분하려면 ','를 사용합니다. 예를 들어 "0, 2, 4-7"은 프로세서 0, 2, 4, 5, 6 및 7을 나타냅니다. 선호도 설정을 제거하려면 문자열을 지우십시오.
    I/O MMU 메모리 관리 단위(페이지 - 디스크)를 사용하도록 설정하려면 선택합니다.
    표 2. 메모리 구성
    설정 구성
    메모리 VM의 메모리 크기를 선택합니다. 자세한 내용은 최대 가상 시스템 메모리를 참조하십시오.
    예약 가상 시스템에 보장된 최소 할당을 지정하거나 모든 게스트 메모리를 예약합니다. 예약이 충족되지 않으면 VM을 실행할 수 없습니다.
    제한 제한할 메모리 양을 선택하여 VM의 메모리 소비량에 제한을 설정합니다.
    공유 공유할 메모리 양을 선택합니다. 공유는 메모리 용량 할당을 위한 상대적인 메트릭을 나타냅니다. 자세한 내용은 메모리 공유를 참조하십시오.
    메모리 핫 플러그 전원이 켜진 VM에 메모리 리소스를 추가할 수 있도록 허용하려면 사용하도록 설정(선택)합니다. 자세한 내용은 메모리 무중단 추가 설정을 참조하십시오.
    표 3. 새 PCI 디바이스 > GPU 공유 구성
    시간 공유 모드 MIG 모드

    시간 공유 모드에서 vGPU 스케줄러는 vGPU 간에 성능을 밸런싱하는 최선의 목표로 일정 기간 동안 각 vGPU 지원 VM에 대해 직렬로 작업을 수행하도록 GPU에 지시합니다.

    MIG 모드에서는 여러 vGPU 지원 VM을 단일 GPU 디바이스에서 병렬로 실행할 수 있습니다. MIG 옵션이 표시되지 않으면 선택한 PCI 디바이스가 MIG 옵션을 지원하지 않는 것입니다.

    표 4. 비디오 카드 구성
    설정 구성
    비디오 카드 하드웨어에서 설정을 자동으로 감지하도록 선택하거나 사용자 지정 설정을 입력합니다. 자동 감지를 선택하면 다른 설정은 구성할 수 없습니다.
    디스플레이 수 디스플레이 수를 선택합니다.
    총 비디오 메모리 총 비디오 메모리(MB)를 입력합니다.
    3D 그래픽 3D 지원 사용하려면 선택합니다.
    표 5. 보안 디바이스 구성
    설정 구성
    보안 디바이스 SGX 보안 디바이스가 설치된 경우 여기에서 VM 설정을 구성할 수 있습니다. 그렇지 않으면 이 필드를 구성할 수 없습니다. 자세한 내용은 SGX 설명서를 참조하십시오.
  8. 구성 > VM 옵션 탭을 선택하고 추가적인 VM 설정을 구성합니다. 지침은 가상 시스템 옵션 구성을 참조하십시오.
  9. 구성 > 고급 매개 변수 탭을 선택하고 VM 클래스에 대한 특성을 추가합니다.
  10. 다음을 클릭합니다.
  11. 검토 및 확인 페이지에서 세부 정보를 검토하고 마침을 클릭합니다.
  12. 새 VM 클래스를 vSphere 네임스페이스와 연결합니다. VM 클래스를 vSphere 네임스페이스와 연결의 내용을 참조하십시오.
그림 1. NVIDIA vGPU 디바이스 선택
NVIDIA vGPU 디바이스 선택
그림 2. NVIDIA vGPU 새 PCI 디바이스
NVIDIA vGPU 새 PCI 디바이스

vGPU 프로파일(v8 U2 이하)을 사용하여 사용자 지정 VM 클래스 생성

다음 단계에서는 vGPU 프로파일을 사용하여 사용자 지정 VM 클래스를 생성합니다. 시스템에서는 TKG 클러스터 노드를 생성할 때 이 클래스 정의를 사용합니다.

아래 지침에 따라 vGPU 프로파일을 사용하여 사용자 지정 VM 클래스를 생성합니다.
  1. vSphere Client를 사용하여 vCenter Server에 로그인합니다.
  2. 워크로드 관리를 선택합니다.
  3. 서비스를 선택합니다.
  4. VM 클래스를 선택합니다.
  5. VM 클래스 생성을 클릭합니다.
  6. 구성 탭에서 사용자 지정 VM 클래스를 구성합니다.
    구성 필드 설명
    이름 사용자 지정 VM 클래스에 대한 자체 설명 이름을 입력합니다(예: vmclass-vgpu-1).
    vCPU 수 2
    CPU 리소스 예약 선택 사항, 비워 둘 수 있음
    메모리 예: 80GB
    메모리 리소스 예약 100%(PCI 디바이스가 VM 클래스에 구성된 경우 필수)
    PCI 디바이스
    참고: PCI 디바이스에 대해 [예]를 선택하면 GPU 디바이스를 사용 중임을 시스템에 알리고 vGPU 구성을 지원하도록 VM 클래스 구성이 변경됩니다. 자세한 내용은 vSphere with Tanzu의 VM 클래스에 PCI 디바이스 추가를 참조하십시오.

    예:

    ""

  7. 다음을 클릭합니다.
  8. PCI 디바이스 탭에서 PCI 디바이스 추가 > NVIDIA vGPU 옵션을 선택합니다.
  9. NVIDIA vGPU 모델을 구성합니다.
    NVIDIA vGPU 필드 설명
    모델 NVIDIA vGPU > 모델 메뉴에서 사용 가능한 NVIDIA GPU 하드웨어 디바이스 모델을 선택합니다. 시스템에 프로파일이 표시되지 않으면 클러스터의 어떤 호스트에도 지원되는 PCI 디바이스가 없는 것입니다.
    GPU 공유

    이 설정은 GPU 디바이스가 GPU 지원 VM 간에 공유되는 방식을 정의합니다. vGPU 구현에는 시간 공유다중 인스턴스 GPU 공유의 두 가지 유형이 있습니다.

    시간 공유 모드에서 vGPU 스케줄러는 vGPU 간에 성능을 밸런싱하는 최선의 목표로 일정 기간 동안 각 vGPU 지원 VM에 대해 직렬로 작업을 수행하도록 GPU에 지시합니다.

    MIG 모드에서는 여러 vGPU 지원 VM을 단일 GPU 디바이스에서 병렬로 실행할 수 있습니다. MIG 모드는 최신 GPU 아키텍처를 기반으로 하며 NVIDIA A100 및 A30 디바이스에서만 지원됩니다. MIG 옵션이 표시되지 않으면 선택한 PCI 디바이스가 MIG 옵션을 지원하지 않는 것입니다.

    GPU 모드 계산
    GPU 메모리 예: 8GB
    vGPU 수 예: 1

    예를 들어 시간 공유 모드로 구성된 NVIDIA vGPU 프로파일은 다음과 같습니다.

    시간 공유 모드에서 구성한 NVIDIA vGPU 프로파일이 있는 [PCI 디바이스] 탭입니다.

    예를 들어 지원되는 GPU 디바이스에서 MIG 모드로 구성된 NVIDIA vGPU 프로파일은 다음과 같습니다.

    다중 인스턴스 GPU 공유 모드에서 구성한 NVIDIA vGPU 프로파일이 있는 [PCI 디바이스] 탭입니다.

  10. 다음을 클릭합니다.
  11. 선택 항목을 검토하고 확인합니다.
  12. 마침을 클릭합니다.
  13. 새 사용자 지정 VM 클래스를 VM 클래스 목록에서 사용할 수 있는지 확인합니다.

동적 DirectPath IO가 있는 vGPU

동적 DirectPath IO가 있는 vGPU를 사용하는 경우 다음 추가 구성을 완료합니다. 동적 DirectPath IO를 지정하고 지원되는 PCI 디바이스를 선택하여 생성한 사용자 지정 VM 클래스에 두 번째 PCI 디바이스 구성을 추가합니다. 이 유형의 VM 클래스가 인스턴스화되면 vSphere DRS(Distributed Resource Scheduler)에 따라 VM 배치가 결정됩니다.
  1. 워크로드 관리를 선택합니다.
  2. 서비스를 선택합니다.
  3. VM 클래스를 선택합니다.
  4. NVIDIA vGPU 프로파일로 이미 구성된 사용자 지정 VM 클래스를 편집합니다.
  5. PCI 디바이스 탭을 선택합니다.
  6. PCI 디바이스 추가를 클릭합니다.
  7. 동적 DirectPath IO 옵션을 선택합니다.

    ""

  8. PCI 디바이스를 선택합니다.

    예:

    ""
  9. 다음을 클릭합니다.
  10. 선택 항목을 검토하고 확인합니다.
  11. 마침을 클릭합니다.
  12. 새 사용자 지정 VM 클래스를 VM 클래스 목록에서 사용할 수 있는지 확인합니다.