GPU 관련 문제로 인해 vSphere Bitfusion 서버의 가상 시스템을 시작할 수 없는 몇 가지 시나리오가 있습니다.
문제
vSphere Bitfusion 서버의 가상 시스템 전원을 켜면 가상 시스템을 시작할 수 없습니다.
원인
- vSphere Bitfusion 서버의 가상 시스템에 동일한 GPU의 여러 인스턴스를 추가하는 경우.
- vSphere Bitfusion 서버에 사용되는 GPU의 총 메모리가 128GB를 초과하는 경우.
- 실행 중인 다른 VM에 이미 할당된 GPU를 사용하는 경우.
해결책
- 동일한 GPU를 여러 번 추가하면 vCenter Server는 첫 번째 GPU를 여러 번 추가합니다. 추가 GPU에 대한 PCI 버스의 ID를 고유한 값으로 수동 업데이트해야 합니다.
- vSphere Client에서 vSphere Bitfusion 서버의 가상 시스템을 마우스 오른쪽 버튼으로 클릭하고 설정 편집을 선택합니다.
- 각 PCI 디바이스 드롭다운 메뉴에서 GPU에 대한 고유 ID를 선택합니다.
- 단일 vSphere Bitfusion 서버에 사용되는 GPU의 총 메모리가 128GB를 초과하면 GPU 패스스루의 고급 가상 시스템 속성인
pciPassthru.64bitMMIOSizeGB
속성의 값을 변경해야 합니다.- 속성에 대한 올바른 값을 계산합니다. vSphere Bitfusion 서버 가상 시스템에서 사용하는 PCI 디바이스(예: GPU)의 수를 세고, 이 숫자에 GPU 크기(GB)를 곱한 다음, 이 값을 다음으로 큰 2의 거듭제곱 값으로 올림합니다. 예를 들어 16GB GPU 디바이스 2개에서 GPU 패스스루를 사용하려면, 값을 64(
2 * 16 = 32 * 2 = 64
)로 올림합니다. 16GB GPU가 1개인 경우 32를 값으로 사용합니다. - 가상 시스템 속성을 수정합니다.
- vSphere Client에서 vSphere Bitfusion 서버의 가상 시스템을 선택하고 전원을 끕니다.
- 가상 시스템을 선택한 상태로 을 선택합니다.
pciPassthru.64bitMMIOSizeGB
를 검색하여 새 값을 설정합니다.- 가상 시스템의 전원을 켭니다.
- 속성에 대한 올바른 값을 계산합니다. vSphere Bitfusion 서버 가상 시스템에서 사용하는 PCI 디바이스(예: GPU)의 수를 세고, 이 숫자에 GPU 크기(GB)를 곱한 다음, 이 값을 다음으로 큰 2의 거듭제곱 값으로 올림합니다. 예를 들어 16GB GPU 디바이스 2개에서 GPU 패스스루를 사용하려면, 값을 64(
- vSphere Bitfusion 서버의 가상 시스템에 할당하는 GPU가 실행 중인 서버에 이미 할당되어 있으면 다른 GPU를 선택해야 합니다. vSphere Bitfusion 서버 하나에 GPU 하나를 패스스루할 수 있습니다.