VI ワークロード ドメインの VMware Cloud Foundation 環境に VMware Private AI Foundation with NVIDIA のコンポーネントを展開します。このドメインには、特定の NVIDIA コンポーネントがインストールされている必要があります。

必要な VMware ソフトウェア バージョン

VMware Private AI Foundation with NVIDIA の VMware コンポーネントを参照してください。

サポート対象の NVIDIA GPU デバイス

VMware Private AI Foundation with NVIDIA の使用を開始する前に、ESXi ホストの GPU が VMware by Broadcom によってサポートされていることを確認してください。

表 1. VMware Private AI Foundation with NVIDIA でサポートされる NVIDIA コンポーネント
NVIDIA コンポーネント サポートされているオプション
NVIDIA GPU
  • NVIDIA A100
  • NVIDIA L40S
  • NVIDIA H100
GPU 共有モード
  • タイム スライス
  • マルチインスタンス GPU (MIG)

必要な NVIDIA ソフトウェア

GPU デバイスは、最新の NVIDIA AI Enterprise (NVAIE) vGPU プロファイルをサポートしている必要があります。ガイダンスについては、『NVIDIA 仮想 GPU ソフトウェアでサポートされる GPU』ドキュメントを参照してください。

必要な VMware Cloud Foundation 設定

VMware Private AI Foundation with NVIDIA を展開する前に、VMware Cloud Foundation で特定の構成が利用可能である必要があります。

  • VMware Cloud Foundation ライセンス。
  • VMware Private AI Foundation with NVIDIA アドオン ライセンス。
  • ESXi ホスト用のホスト ドライバ VIB ファイルとゲスト OS ドライバを含む、ライセンス付与された NVIDIA vGPU 製品。ガイダンスについては、『NVIDIA 仮想 GPU ソフトウェアでサポートされる GPU』ドキュメントを参照してください。
  • https://nvid.nvidia.com/ からダウンロードした NVIDIA vGPU ホスト ドライバの VIB ファイル
  • SDDC Manager で使用可能な vGPU ホスト マネージャ ドライバの VIB ファイルを含む vSphere Lifecycle Manager イメージ。VMware Cloud Foundation での vSphere Lifecycle Manager イメージの管理を参照してください。
  • ホスト マネージャ ドライバ VIB ファイルを含む vSphere Lifecycle Manager イメージに基づく、少なくとも 3 台の ESXi GPU 対応ホストを含む VI ワークロード ドメイン。SDDC Manager ユーザー インターフェイスを使用した VI ワークロード ドメインの展開VMware Cloud Foundation での vSphere Lifecycle Manager イメージの管理を参照してください。
  • AI ワークロード用のクラスタ内の各 ESXi ホストに NVIDIA vGPU ホスト ドライバがインストールされ、vGPU が構成されていること。
    1. 各 ESXi ホストで、AI 操作のために BIOS で SR-IOV を有効にし、グラフィック デバイスで Shared Direct を有効にします。

      SR-IOV の構成の詳細については、ハードウェア ベンダーのドキュメントを参照してください。グラフィック デバイスで Shared Direct を構成する方法については、「vSphere での仮想グラフィックの構成」を参照してください。

    2. 次のいずれかの方法で、各 ESXi ホストに NVIDIA vGPU ホスト マネージャ ドライバをインストールします。
      • 各ホストにドライバをインストールし、ドライバの VIB ファイルをクラスタの vSphere Lifecycle イメージに追加します。

        NVIDIA 仮想 GPU ソフトウェア クイック スタート ガイド』を参照してください。

      • ドライバの VIB ファイルをクラスタの vSphere Lifecycle イメージに追加し、ホストを修正します。
    3. マルチインスタンス GPU (MIG) 共有を使用する場合は、クラスタ内の各 ESXi ホストで有効にします。

      NVIDIA MIG ユーザー ガイドを参照してください。

    4. VI ワークロード ドメインの vCenter Server インスタンスで、vgpu.hotmigrate.enabled 詳細設定を true に設定して、vGPU を搭載した仮想マシンを vSphere vMotion を使用して移行できるようにします。

      詳細設定の構成」を参照してください。