GPU 関連の問題によって vSphere Bitfusion サーバの仮想マシンを起動できない状況がいくつかあります。

問題

vSphere Bitfusion サーバの仮想マシンをパワーオンしても、仮想マシンが起動しません。

原因

通常、新しい vSphere Bitfusion サーバのインストール プロセスで次の状況が発生しています。
  • vSphere Bitfusion サーバの仮想マシンに同じ GPU のインスタンス複数回追加した。
  • vSphere Bitfusion サーバで使用される GPU の合計メモリが 128 GB を超えている。
  • 実行中の別の仮想マシンにすでに割り当てられている GPU を使用している。

解決方法

  • 同じ GPU を複数回追加すると、vCenter Server では最初の GPU が複数回追加されます。追加の GPU の PCI バスの ID を一意の値に手動で更新する必要があります。
    1. vSphere Client で、vSphere Bitfusion サーバの仮想マシンを右クリックし、[設定の編集] を選択します。
    2. [PCI デバイス] ドロップダウン メニューから、GPU に一意の ID を選択します。
  • 1 台の vSphere Bitfusion サーバで使用される GPU の合計メモリが 128 GB を超える場合は、GPU パススルーの高度な仮想マシン プロパティである pciPassthru.64bitMMIOSizeGB プロパティの値を変更する必要があります。
    1. プロパティの正しい値を計算します。vSphere Bitfusion サーバ仮想マシンが使用する GPU などの PCI デバイスの数を数え、その数を GPU のサイズ (GB) で乗算して、値を 2 の累乗に切り上げます。たとえば、2 台の 16 GB GPU デバイスで GPU パススルーを使用する場合、値を 64 (2 * 16 = 32 * 2 = 64) に切り上げます。1 台の 16 GB GPU の場合、32 の値を使用します。
    2. 仮想マシンのプロパティを変更します。
      1. vSphere Client で、vSphere Bitfusion サーバの仮想マシンを選択し、パワーオフします。
      2. 仮想マシンを選択した状態で、[アクション] > [設定の編集] > [仮想マシン オプション] > [詳細] > [設定の編集] を選択します。
      3. pciPassthru.64bitMMIOSizeGB を検索して、新しい値を設定します。
      4. 仮想マシンをパワーオンします。
  • vSphere Bitfusion サーバの仮想マシンに割り当てる GPU が、実行中のサーバにすでに割り当てられている場合は、別の GPU を選択する必要があります。1 台の vSphere Bitfusion サーバには、1 つの GPU をパススルーできます。