GPU 関連の問題によって vSphere Bitfusion サーバの仮想マシンを起動できない状況がいくつかあります。
問題
vSphere Bitfusion サーバの仮想マシンをパワーオンしても、仮想マシンが起動しません。
原因
- vSphere Bitfusion サーバの仮想マシンに同じ GPU のインスタンス複数回追加した。
- vSphere Bitfusion サーバで使用される GPU の合計メモリが 128 GB を超えている。
- 実行中の別の仮想マシンにすでに割り当てられている GPU を使用している。
解決方法
- 同じ GPU を複数回追加すると、vCenter Server では最初の GPU が複数回追加されます。追加の GPU の PCI バスの ID を一意の値に手動で更新する必要があります。
- vSphere Client で、vSphere Bitfusion サーバの仮想マシンを右クリックし、[設定の編集] を選択します。
- 各 [PCI デバイス] ドロップダウン メニューから、GPU に一意の ID を選択します。
- 1 台の vSphere Bitfusion サーバで使用される GPU の合計メモリが 128 GB を超える場合は、GPU パススルーの高度な仮想マシン プロパティである
pciPassthru.64bitMMIOSizeGB
プロパティの値を変更する必要があります。- プロパティの正しい値を計算します。vSphere Bitfusion サーバ仮想マシンが使用する GPU などの PCI デバイスの数を数え、その数を GPU のサイズ (GB) で乗算して、値を 2 の累乗に切り上げます。たとえば、2 台の 16 GB GPU デバイスで GPU パススルーを使用する場合、値を 64 (
2 * 16 = 32 * 2 = 64
) に切り上げます。1 台の 16 GB GPU の場合、32 の値を使用します。 - 仮想マシンのプロパティを変更します。
- vSphere Client で、vSphere Bitfusion サーバの仮想マシンを選択し、パワーオフします。
- 仮想マシンを選択した状態で、 を選択します。
pciPassthru.64bitMMIOSizeGB
を検索して、新しい値を設定します。- 仮想マシンをパワーオンします。
- プロパティの正しい値を計算します。vSphere Bitfusion サーバ仮想マシンが使用する GPU などの PCI デバイスの数を数え、その数を GPU のサイズ (GB) で乗算して、値を 2 の累乗に切り上げます。たとえば、2 台の 16 GB GPU デバイスで GPU パススルーを使用する場合、値を 64 (
- vSphere Bitfusion サーバの仮想マシンに割り当てる GPU が、実行中のサーバにすでに割り当てられている場合は、別の GPU を選択する必要があります。1 台の vSphere Bitfusion サーバには、1 つの GPU をパススルーできます。