VMware Private AI Foundation with NVIDIA を展開するための要件

VI ワークロードドメインの VMware Cloud Foundation 環境に VMware Private AI Foundation with NVIDIA のコンポーネントを展開します。このドメインには、特定の NVIDIA コンポーネントがインストールされている必要があります。

必要な VMware ソフトウェアバージョン

VMware Private AI Foundation with NVIDIA の VMware コンポーネントを参照してください。

サポート対象の NVIDIA GPU デバイス

VMware Private AI Foundation with NVIDIA の使用を開始する前に、ESXi ホストの GPU が VMware by Broadcom によってサポートされていることを確認してください。

表 1. VMware Private AI Foundation with NVIDIA でサポートされる NVIDIA コンポーネント
NVIDIA コンポーネント	サポートされているオプション
NVIDIA GPU	NVIDIA A100 NVIDIA L40S NVIDIA H100
GPU 共有モード	タイムスライスマルチインスタンス GPU (MIG)

必要な NVIDIA ソフトウェア

GPU デバイスは、最新の NVIDIA AI Enterprise (NVAIE) vGPU プロファイルをサポートしている必要があります。ガイダンスについては、『NVIDIA 仮想 GPU ソフトウェアでサポートされる GPU』ドキュメントを参照してください。

VMware Cloud Foundation バージョンと互換性のある NVIDIA vGPU ホストドライバ（ESXi ホストの VIB を含む）。『VMware vSphere の仮想 GPU ソフトウェアリリースノート』を参照してください。
展開された TKG クラスタの Kubernetes バージョンと互換性のある NVIDIA GPU Operator。『NVIDIA GPU Operator リリースノート』および「VMware Tanzu Kubernetes リリース (TKr) リリースノート」を参照してください。

必要な VMware Cloud Foundation 設定

VMware Private AI Foundation with NVIDIA を展開する前に、VMware Cloud Foundation で特定の構成が利用可能である必要があります。

vSAN ReadyNode™ の VMware Cloud Foundation。
VMware Cloud Foundation ライセンス。
VMware Private AI Foundation with NVIDIA アドオンライセンス。
以下の機能にアクセスするには、VMware Private AI Foundation with NVIDIA アドオンライセンスが必要です。
- カタログアイテムのための VMware Aria Automation でのプライベート AI セットアップにより、GPU アクセラレーションディープラーニング仮想マシンと TKG クラスタを簡単にプロビジョニングする。
- エンタープライズサポート付きの pgvector 拡張機能を使用して PostgreSQL データベースをプロビジョニングする。
- VMware by Broadcom が提供するディープラーニング仮想マシンイメージを展開して使用する。
- vSphere Client のガイド付き展開ワークフロー。
スーパーバイザーを有効にした状態および有効にしていない状態で AI ワークロードを展開し、VMware Cloud Foundation ライセンスの下で vCenter Server と VMware Aria Operations で GPU メトリックを使用できます。
VMware Private AI Foundation with NVIDIA ライセンスをソリューションライセンスとして管理 vCenter Server のライセンス管理システムに追加します。ライセンスは、次のいずれかの方法で追加できます。
- vSphere Client でガイド付き展開ワークフローを初めて使用する。
- vSphere Client でライセンス管理ユーザーインターフェイスを使用する。vSphere ライセンスの管理を参照してください。
ESXi ホスト用のホストドライバ VIB ファイルとゲスト OS ドライバを含む、ライセンス付与された NVIDIA vGPU 製品。ガイダンスについては、『NVIDIA 仮想 GPU ソフトウェアでサポートされる GPU』ドキュメントを参照してください。
https://nvid.nvidia.com/ からダウンロードした NVIDIA vGPU ホストドライバの VIB ファイル
SDDC Manager で使用可能な vGPU ホストマネージャドライバの VIB ファイルを含む vSphere Lifecycle Manager イメージ。VMware Cloud Foundation での vSphere Lifecycle Manager イメージの管理を参照してください。
VI ワークロードドメインのデフォルトクラスタに含める 3 台以上の GPU 対応 ESXi ホスト。
AI ワークロード用のクラスタ内の各 ESXi ホストに NVIDIA vGPU ホストドライバがインストールされ、vGPU が構成されていること。
1. 各 ESXi ホストで、AI 操作のために BIOS で SR-IOV を有効にし、グラフィックデバイスで Shared Direct を有効にします。
  SR-IOV の構成の詳細については、ハードウェアベンダーのドキュメントを参照してください。グラフィックデバイスで Shared Direct を構成する方法については、「vSphere での仮想グラフィックの構成」を参照してください。
2. 次のいずれかの方法で、各 ESXi ホストに NVIDIA vGPU ホストドライバをインストールします。
  - 各ホストにドライバをインストールし、ドライバの VIB ファイルをクラスタの vSphere Lifecycle イメージに追加します。
    『NVIDIA 仮想 GPU ソフトウェアクイックスタートガイド』を参照してください。
  - ドライバの VIB ファイルをクラスタの vSphere Lifecycle イメージに追加し、ホストを修正します。
3. マルチインスタンス GPU (MIG) 共有を使用する場合は、クラスタ内の各 ESXi ホストで有効にします。
  NVIDIA MIG ユーザーガイドを参照してください。

必要な VMware ソフトウェア バージョン

サポート対象の NVIDIA GPU デバイス

必要な NVIDIA ソフトウェア

必要な VMware Cloud Foundation 設定

必要な VMware ソフトウェアバージョン