VI ワークロード ドメインの VMware Cloud Foundation 環境に VMware Private AI Foundation with NVIDIA のコンポーネントを展開します。このドメインには、特定の NVIDIA コンポーネントがインストールされている必要があります。

必要な VMware ソフトウェア バージョン

VMware Private AI Foundation with NVIDIA の VMware コンポーネントを参照してください。

サポート対象の NVIDIA GPU デバイス

VMware Private AI Foundation with NVIDIA の使用を開始する前に、ESXi ホストの GPU が VMware by Broadcom によってサポートされていることを確認してください。

表 1. VMware Private AI Foundation with NVIDIA でサポートされる NVIDIA コンポーネント
NVIDIA コンポーネント サポートされているオプション
NVIDIA GPU
  • NVIDIA A100
  • NVIDIA L40S
  • NVIDIA H100
GPU 共有モード
  • タイム スライス
  • マルチインスタンス GPU (MIG)

必要な NVIDIA ソフトウェア

GPU デバイスは、最新の NVIDIA AI Enterprise (NVAIE) vGPU プロファイルをサポートしている必要があります。ガイダンスについては、『NVIDIA 仮想 GPU ソフトウェアでサポートされる GPU』ドキュメントを参照してください。

必要な VMware Cloud Foundation 設定

VMware Private AI Foundation with NVIDIA を展開する前に、VMware Cloud Foundation で特定の構成が利用可能である必要があります。

  • vSAN ReadyNode™ の VMware Cloud Foundation
  • VMware Cloud Foundation ライセンス。
  • VMware Private AI Foundation with NVIDIA アドオン ライセンス。

    以下の機能にアクセスするには、VMware Private AI Foundation with NVIDIA アドオン ライセンスが必要です。

    • カタログ アイテムのための VMware Aria Automation でのプライベート AI セットアップにより、GPU アクセラレーション ディープ ラーニング仮想マシンと TKG クラスタを簡単にプロビジョニングする。
    • エンタープライズ サポート付きの pgvector 拡張機能を使用して PostgreSQL データベースをプロビジョニングする。
    • VMware by Broadcom が提供するディープ ラーニング仮想マシン イメージを展開して使用する。
    • vSphere Client のガイド付き展開ワークフロー。

    スーパーバイザーを有効にした状態および有効にしていない状態で AI ワークロードを展開し、VMware Cloud Foundation ライセンスの下で vCenter Server と VMware Aria Operations で GPU メトリックを使用できます。

    VMware Private AI Foundation with NVIDIA ライセンスをソリューション ライセンスとして管理 vCenter Server のライセンス管理システムに追加します。ライセンスは、次のいずれかの方法で追加できます。

  • ESXi ホスト用のホスト ドライバ VIB ファイルとゲスト OS ドライバを含む、ライセンス付与された NVIDIA vGPU 製品。ガイダンスについては、『NVIDIA 仮想 GPU ソフトウェアでサポートされる GPU』ドキュメントを参照してください。
  • https://nvid.nvidia.com/ からダウンロードした NVIDIA vGPU ホスト ドライバの VIB ファイル
  • SDDC Manager で使用可能な vGPU ホスト マネージャ ドライバの VIB ファイルを含む vSphere Lifecycle Manager イメージ。VMware Cloud Foundation での vSphere Lifecycle Manager イメージの管理を参照してください。
  • VI ワークロード ドメインのデフォルト クラスタに含める 3 台以上の GPU 対応 ESXi ホスト。
  • AI ワークロード用のクラスタ内の各 ESXi ホストに NVIDIA vGPU ホスト ドライバがインストールされ、vGPU が構成されていること。
    1. 各 ESXi ホストで、AI 操作のために BIOS で SR-IOV を有効にし、グラフィック デバイスで Shared Direct を有効にします。

      SR-IOV の構成の詳細については、ハードウェア ベンダーのドキュメントを参照してください。グラフィック デバイスで Shared Direct を構成する方法については、「vSphere での仮想グラフィックの構成」を参照してください。

    2. 次のいずれかの方法で、各 ESXi ホストに NVIDIA vGPU ホスト ドライバをインストールします。
      • 各ホストにドライバをインストールし、ドライバの VIB ファイルをクラスタの vSphere Lifecycle イメージに追加します。

        NVIDIA 仮想 GPU ソフトウェア クイック スタート ガイド』を参照してください。

      • ドライバの VIB ファイルをクラスタの vSphere Lifecycle イメージに追加し、ホストを修正します。
    3. マルチインスタンス GPU (MIG) 共有を使用する場合は、クラスタ内の各 ESXi ホストで有効にします。

      NVIDIA MIG ユーザー ガイドを参照してください。