GPU 관련 문제로 인해 vSphere Bitfusion 서버의 가상 시스템을 시작할 수 없는 몇 가지 시나리오가 있습니다.

문제

vSphere Bitfusion 서버의 가상 시스템 전원을 켜면 가상 시스템을 시작할 수 없습니다.

원인

일반적으로 새 vSphere Bitfusion 서버의 설치 프로세스 중에 다음과 같은 시나리오가 있습니다.
  • vSphere Bitfusion 서버의 가상 시스템에 동일한 GPU의 여러 인스턴스를 추가하는 경우.
  • vSphere Bitfusion 서버에 사용되는 GPU의 총 메모리가 128GB를 초과하는 경우.
  • 실행 중인 다른 VM에 이미 할당된 GPU를 사용하는 경우.

해결책

  • 동일한 GPU를 여러 번 추가하면 vCenter Server는 첫 번째 GPU를 여러 번 추가합니다. 추가 GPU에 대한 PCI 버스의 ID를 고유한 값으로 수동 업데이트해야 합니다.
    1. vSphere Client에서 vSphere Bitfusion 서버의 가상 시스템을 마우스 오른쪽 버튼으로 클릭하고 설정 편집을 선택합니다.
    2. PCI 디바이스 드롭다운 메뉴에서 GPU에 대한 고유 ID를 선택합니다.
  • 단일 vSphere Bitfusion 서버에 사용되는 GPU의 총 메모리가 128GB를 초과하면 GPU 패스스루의 고급 가상 시스템 속성인 pciPassthru.64bitMMIOSizeGB 속성의 값을 변경해야 합니다.
    1. 속성에 대한 올바른 값을 계산합니다. vSphere Bitfusion 서버 가상 시스템에서 사용하는 PCI 디바이스(예: GPU)의 수를 세고, 이 숫자에 GPU 크기(GB)를 곱한 다음, 이 값을 다음으로 큰 2의 거듭제곱 값으로 올림합니다. 예를 들어 16GB GPU 디바이스 2개에서 GPU 패스스루를 사용하려면, 값을 64(2 * 16 = 32 * 2 = 64)로 올림합니다. 16GB GPU가 1개인 경우 32를 값으로 사용합니다.
    2. 가상 시스템 속성을 수정합니다.
      1. vSphere Client에서 vSphere Bitfusion 서버의 가상 시스템을 선택하고 전원을 끕니다.
      2. 가상 시스템을 선택한 상태로 작업 > 설정 편집 > VM 옵션 > 고급 > 구성 편집을 선택합니다.
      3. pciPassthru.64bitMMIOSizeGB를 검색하여 새 값을 설정합니다.
      4. 가상 시스템의 전원을 켭니다.
  • vSphere Bitfusion 서버의 가상 시스템에 할당하는 GPU가 실행 중인 서버에 이미 할당되어 있으면 다른 GPU를 선택해야 합니다. vSphere Bitfusion 서버 하나에 GPU 하나를 패스스루할 수 있습니다.