VMware Private AI Foundation with NVIDIA の展開

クラウド管理者は、データサイエンティストと DevOps エンジニアが AI ワークロードを VMware Private AI Foundation with NVIDIA 上に展開できるように、固有のソフトウェアを展開し、ターゲット VI ワークロードドメインを構成する必要があります。

VMware Private AI Foundation with NVIDIA の VMware コンポーネント

VMware Private AI Foundation with NVIDIA ソリューションの機能は、複数のソフトウェアコンポーネントで使用できます。

VMware Cloud Foundation 5.1.1
VMware Aria Automation 8.16.2 および VMware Aria Automation 8.17
VMware Aria Operations 8.16 および VMware Aria Operations 8.17.1
VMware Data Services Manager 2.0.x

VMware Private AI Foundation with NVIDIA アーキテクチャとコンポーネントの詳細については、「VMware Private AI Foundation with NVIDIA について」を参照してください。

VMware Private AI Foundation with NVIDIA の展開ワークフロー

切断された環境では、アプライアンスをセットアップして展開し、ローカルでリソースを提供して、ワークロードがアクセスできるようにするための追加の手順を実行する必要があります。

接続された環境


タスク	関連する AI ワークロードの展開オプション	手順
VMware Private AI Foundation with NVIDIA の展開の要件を参照してください。	ディープラーニング仮想マシンを展開する GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開する	VMware Private AI Foundation with NVIDIA を展開するための要件
NVIDIA ライセンスポータルでライセンスサービスインスタンスを構成し、クライアント構成トークンを生成します。	ディープラーニング仮想マシンを展開する GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開する	NVIDIA ライセンスシステムユーザーガイド。
NVIDIA NGC カタログにアクセスするための API キーを生成します。	ディープラーニング仮想マシンを展開する GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開する	NVIDIA AI Enterprise コンテナのプルと実行
ディープラーニング仮想マシンまたは TKG クラスタを vSphere with Tanzu のスーパーバイザーに直接展開する場合は、スーパーバイザーインスタンスにアクセスでき、Docker、Helm、Kubernetes CLI Tools for vSphere を備えたマシンをセットアップします。	kubectl を使用してディープラーニング仮想マシンを直接展開する kubectl を使用してプロビジョニングされた GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開する kubectl を使用して RAG ワークロードを含むディープラーニング仮想マシンを展開する TKG クラスタへ RAG ワークロードを展開する	Kubernetes CLI Tools for vSphere のインストール
vSphere With Tanzu を有効にします。	kubectl を使用してディープラーニング仮想マシンを直接展開する kubectl を使用してプロビジョニングされた GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開する kubectl を使用して RAG ワークロードを含むディープラーニング仮想マシンを展開する TKG クラスタへ RAG ワークロードを展開する	VMware Private AI Foundation with NVIDIA の vSphere with Tanzu の構成
VMware Aria Automation を展開します。	セルフサービスカタログアイテムを使用してディープラーニング仮想マシンを直接展開するセルフサービスカタログアイテムを使用してプロビジョニングされた GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開するセルフサービスカタログアイテムを使用して RAG ワークロードを含むディープラーニング仮想マシンを展開するセルフサービスカタログアイテムを使用してプロビジョニングされた TKG クラスタに RAG ワークロードを展開する	VMware Private AI Foundation with NVIDIA 用の VMware Aria Automation の設定
VMware Aria Operations を展開します。	クラスタ、ホストシステム、およびホストプロパティで GPU メトリックを監視し、これらのメトリックをカスタムダッシュボードに追加するオプションを使用する。	VMware Aria Operations 8.16 の場合は、「VMware Cloud Foundation のためのインテリジェントな運用管理」に従います。 VMware Aria Operations 8.17.1 で拡張 GPU 監視機能を使用する場合は、次の手順を実行します。 VMware Aria Operations 8.17.1 の製品サポートパックを VMware Aria Suite Lifecycle 8.16 に適用します。『VMware Aria Suite Lifecycle 8.16 Product Support Pack リリースノート』を参照してください。「VMware Cloud Foundation のためのインテリジェントな運用管理」に従って VMware Aria Operations を展開します。
VMware Data Services Manager の展開	RAG ワークロードを展開する	VMware Data Services Manager のインストールと構成 AI ワークロードを持つ VI ワークロードドメインに VMware Data Services Manager インスタンスを展開します。 VMware Aria Automation のセルフサービスカタログアイテムを使用して、pgvector 拡張機能を備えた PostgreSQL データベースをプロビジョニングできるようにするには、VMware Data Services Manager 2.0.2 を展開します。

切断された環境


タスク	関連する AI ワークロードの展開オプション	手順
VMware Private AI Foundation with NVIDIA の展開の要件を参照してください。	ディープラーニング仮想マシンを展開する GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開する	VMware Private AI Foundation with NVIDIA を展開するための要件
NVIDIA 委任ライセンスサービスインスタンスを展開します。	ディープラーニング仮想マシンを展開する GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開する	DLS 仮想アプライアンスのインストールと構成仮想アプライアンスは、AI ワークロードと同じワークロードドメインに展開するか、または管理ドメインに展開できます。
NVIDIA ライセンスポータルに NVIDIA DLS インスタンスを登録し、ライセンスサーバをバインドしてインストールします。クライアント構成トークンを生成します。	ディープラーニング仮想マシンを展開する GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開する	サービスインスタンスの構成ライセンスサーバでのライセンスの管理。
vSphere With Tanzu の有効化	kubectl を使用してディープラーニング仮想マシンを直接展開する kubectl を使用してプロビジョニングされた GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開する kubectl を使用して RAG ワークロードを含むディープラーニング仮想マシンを展開する TKG クラスタへ RAG ワークロードを展開する	VMware Private AI Foundation with NVIDIA の vSphere with Tanzu の構成
スーパーバイザーで Harbor レジストリサービスをセットアップします。	ディープラーニング仮想マシンを展開する kubectl を使用してディープラーニング仮想マシンを直接展開するセルフサービスカタログアイテムを使用してディープラーニング仮想マシンを直接展開する GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開する kubectl を使用して RAG ワークロードを含むディープラーニング仮想マシンを展開するセルフサービスカタログアイテムを使用してディープラーニング仮想マシンを直接展開する TKG クラスタへ RAG ワークロードを展開する	VMware Private AI Foundation with NVIDIA でのプライベート Harbor レジストリの設定
vGPU ゲストドライバをダウンロードする場所を指定します。	ディープラーニング仮想マシンを展開する	必要な vGPU ゲストドライババージョンと、次のいずれかの形式のインデックスをローカル Web サーバにアップロードします。 vGPU ゲストドライバの .run ファイルのリストを含むインデックスファイル。 `host-driver-version-1` `guest-driver-download-URL-1` `host-driver-version-2` `guest-driver-download-URL-2` `host-driver-version-3` `guest-driver-download-URL-3` NGINX や Apache HTTP Server などの Web サーバによって生成された形式のディレクトリインデックス。
NVIDIA NGC コンテナイメージを、スーパーバイザーの Harbor レジストリサービスなどのプライベートコンテナレジストリにアップロードします。	ディープラーニング仮想マシンを展開する kubectl を使用してディープラーニング仮想マシンを直接展開するセルフサービスカタログアイテムを使用してディープラーニング仮想マシンを直接展開する GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開する kubectl を使用して RAG ワークロードを含むディープラーニング仮想マシンを展開するセルフサービスカタログアイテムを使用してディープラーニング仮想マシンを直接展開する TKG クラスタへ RAG ワークロードを展開する	VMware Private AI Foundation with NVIDIA のプライベート Harbor レジストリに AI コンテナイメージをアップロードする
VMware Aria Automation の展開	セルフサービスカタログアイテムを使用してディープラーニング仮想マシンを直接展開するセルフサービスカタログアイテムを使用してプロビジョニングされた GPU アクセラレーション TKG クラスタに AI ワークロードを展開する RAG ワークロードを展開するセルフサービスカタログアイテムを使用してディープラーニング仮想マシンを直接展開するセルフサービスカタログアイテムを使用してプロビジョニングされた TKG クラスタに RAG ワークロードを展開する	VMware Private AI Foundation with NVIDIA 用の VMware Aria Automation の設定
VMware Aria Operations の展開	クラスタ、ホストシステム、およびホストプロパティで GPU メトリックを監視し、これらのメトリックをカスタムダッシュボードに追加するオプションを使用する。	VMware Aria Operations 8.16 の場合は、「VMware Cloud Foundation のためのインテリジェントな運用管理」に従います。 VMware Aria Operations 8.17.1 で拡張 GPU 監視機能を使用する場合は、次の手順を実行します。 VMware Aria Operations 8.17.1 の製品サポートパックを VMware Aria Suite Lifecycle 8.16 に適用します。『VMware Aria Suite Lifecycle 8.16 Product Support Pack リリースノート』を参照してください。「VMware Cloud Foundation のためのインテリジェントな運用管理」に従って VMware Aria Operations を展開します。
VMware Data Services Manager の展開	RAG ワークロードを展開する	VMware Data Services Manager のインストールと構成 AI ワークロードを持つ VI ワークロードドメインに VMware Data Services Manager インスタンスを展開します。 VMware Aria Automation のセルフサービスカタログアイテムを使用して、pgvector 拡張機能を備えた PostgreSQL データベースをプロビジョニングできるようにするには、VMware Data Services Manager 2.0.2 を展開します。
インターネットにアクセスでき、Docker と Helm がインストールされているマシンをセットアップします。 VI ワークロードドメインの vCenter Server、スーパーバイザーインスタンス、およびローカルコンテナレジストリにアクセスできるマシンをセットアップします。マシンには、Docker、Helm、および Kubernetes CLI Tools for vSphere がインストールされている必要があります。	ディープラーニング仮想マシンを展開する GPU アクセラレーション TKG クラスタを展開する RAG ワークロードを展開する	Kubernetes CLI Tools for vSphere のインストール VMware vSphere with VMware Tanzu（エアギャップ）のインストール