プライベート AI ワークロード展開のための VMware Cloud Foundation の準備

クラウド管理者は、データサイエンティストと DevOps エンジニアが AI ワークロードを VMware Private AI Foundation with NVIDIA 上に展開できるように、固有のソフトウェアを展開し、ターゲット VI ワークロードドメインを構成する必要があります。

VMware Private AI Foundation with NVIDIA の VMware コンポーネント

VMware Private AI Foundation with NVIDIA ソリューションの機能は、VMware Cloud Foundation および特定のバージョンの VMware Aria Automation、VMware Aria Operations、および VMware Data Services Manager で使用できます。


VMware Cloud Foundation のバージョン	VMware Aria コンポーネントと VMware Data Services Manager のバージョン
VMware Cloud Foundation 5.2.1	VMware Aria Automation 8.18.1 VMware Aria Operations 8.18.1 VMware Data Services Manager 2.1
VMware Cloud Foundation 5.2 注：このドキュメントは、 VMware Cloud Foundation 5.2.1 に基づいています。 VMware Cloud Foundation 5.2 の VMware Private AI Foundation with NVIDIA 機能の詳細については、 VMware Cloud Foundation 5.2 向け VMware Private AI Foundation with NVIDIA ガイドを参照してください。	VMware Aria Automation 8.18 VMware Aria Operations 8.18 VMware Data Services Manager 2.1

VMware Private AI Foundation with NVIDIA アーキテクチャとコンポーネントの詳細については、「VMware Private AI Foundation with NVIDIA のシステムアーキテクチャ」を参照してください。

vSphere Client でのガイド付き展開

VMware Cloud Foundation 5.2.1 以降では、vSphere Client のガイド付き展開ユーザーインターフェイスを使用して、VMware Private AI Foundation with NVIDIA コンポーネントを完全に設定できます。ガイド付き展開ユーザーインターフェイスは SDDC Manager に接続して、要求された操作を実行します。

VMware Private AI Foundation with NVIDIA のガイド付き展開を開くには、次の手順を実行します。

vSphere Client (https://<management_vcenter_server>/ui) を使用して、管理 vCenter Server に [email protected] としてログインします。
[vSphere Client] サイドパネルで、[Private AI Foundation] をクリックし、VMware Private AI Foundation with NVIDIA ライセンスを入力します。
ライセンスキーは、ソリューションライセンスとして管理 vCenter Server に割り当てられます。
ウィザードに従って、以下の展開ワークフローどおりに VMware Private AI Foundation with NVIDIA の設定を完了します。

VMware Private AI Foundation with NVIDIA の展開ワークフロー

VMware Private AI Foundation with NVIDIA の機能は、次のいずれかの AI ワークロードタイプの展開を可能にするために必要な追加コンポーネントを含むコンポーネントの基本セットに基づいています。

一般的なディープラーニング仮想マシン
GPU アクセラレーション TKG クラスタ上の一般的な AI ワークロード
GPU アクセラレーション TKG クラスタ上のディープラーニング仮想マシンまたはアプリケーションとしての RAG ワークロード
RAG ワークロードの展開は、pgvector PostgreSQL データベースの展開と pgvector データベースを使用したアプリケーションの構成により、TKG クラスタ上のディープラーニング仮想マシンと AI ワークロードの一般的なアプローチを拡張します。

切断された環境では、アプライアンスをセットアップして展開し、ローカルでリソースを提供して、ワークロードがアクセスできるようにするための追加の手順を実行する必要があります。

接続された環境


タスク	AI ワークロード展開のユースケース	手順
VMware Private AI Foundation with NVIDIA を展開するためのアーキテクチャと要件を確認します。	すべて	VMware Private AI Foundation with NVIDIA のシステムアーキテクチャ VMware Private AI Foundation with NVIDIA を展開するための要件
NVIDIA ライセンスポータルでライセンスサービスインスタンスを構成し、クライアント構成トークンを生成します。		NVIDIA ライセンスシステムユーザーガイド。
NVIDIA NGC カタログにアクセスするための API キーを生成します。		NVIDIA AI Enterprise コンテナのプルと実行
GPU アクセラレーション VI ワークロードドメインを展開します。		VMware Private AI Foundation with NVIDIA 用の GPU アクセラレーション VI ワークロードドメインの展開
vSphere IaaS control plane（以前の vSphere with Tanzu）を有効にします。	すべてデータサイエンティストおよび DevOps エンジニアが、VMware Aria Automation のセルフサービスカタログアイテム、または kubectl コマンドを使用してワークロードを展開する場合に必要です。	VMware Private AI Foundation with NVIDIA の vSphere IaaS Control Plane の構成
ディープラーニング仮想マシンイメージ用のコンテンツライブラリを作成します。	ディープラーニング仮想マシンを展開する	VMware Private AI Foundation with NVIDIA のディープラーニング仮想マシンイメージを含むコンテンツライブラリを作成する
AI ワークロード用に vGPU ベースの仮想マシンクラスを構成します。	すべて	VMware Private AI Foundation with NVIDIA の AI ワークロード用に vGPU ベースの仮想マシンクラスを構成する
AI ワークロードの vSphere 名前空間を構成します。	すべて	GPU アクセラレーションワークロードの vSphere 名前空間の構成
VMware Aria Automation の展開 VMware Aria Suite Lifecycle in VMware Cloud Foundation mode を使用して展開します。	すべてデータサイエンティストおよび DevOps エンジニアが、VMware Aria Automation のセルフサービスカタログアイテムを使用してワークロードを展開する場合に必要です。	VMware Cloud Foundation のためのプライベートクラウド自動化 VMware Private AI Foundation with NVIDIA 用の VMware Aria Automation の設定
VMware Aria Suite Lifecycle in VMware Cloud Foundation mode を使用して VMware Aria Operations を展開します。	すべて	VMware Cloud Foundation のためのインテリジェントな運用管理。
VMware Data Services Manager の展開	RAG ワークロードを展開する	VMware Data Services Manager のインストールと構成 VMware Data Services Manager インスタンスを管理ドメインに展開します。スーパーバイザーサービスとして Data Services Manager Consumption Operator をインストールします。vSphere スーパーバイザーサービスカタログを参照してください。少なくとも 1 つのインフラストラクチャポリシーで VMware Data Services Manager を構成します。インフラストラクチャポリシーの作成を参照してください。
スーパーバイザーインスタンスにアクセスでき、Docker、Helm、および Kubernetes CLI Tools for vSphere を備えたマシンをセットアップします。	すべて kubectl コマンドを使用して AI ワークロードを直接展開する場合に必要です。	Kubernetes CLI Tools for vSphere のインストール
VMware Cloud Foundation 5.2.1 以降では、スーパーバイザーで Harbor レジストリサービスをセットアップします。	すべてこれは、次の場合に必須です。 AI ワークロードが vSphere IaaS control plane のスーパーバイザーに展開される。検証済みの ML モデルを格納するために Harbor のモデルギャラリーを使用する予定がある。	VMware Private AI Foundation with NVIDIA でのプライベート Harbor レジストリの設定

切断された環境


タスク	関連する AI ワークロードの展開オプション	手順
VMware Private AI Foundation with NVIDIA の展開の要件を参照してください。	すべて	VMware Private AI Foundation with NVIDIA のシステムアーキテクチャ VMware Private AI Foundation with NVIDIA を展開するための要件
NVIDIA 委任ライセンスサービスインスタンスを展開します。		DLS 仮想アプライアンスのインストールと構成仮想アプライアンスは、AI ワークロードと同じワークロードドメインに展開するか、または管理ドメインに展開できます。
NVIDIA ライセンスポータルに NVIDIA DLS インスタンスを登録し、ライセンスサーバをバインドしてインストールします。クライアント構成トークンを生成します。		サービスインスタンスの構成ライセンスサーバでのライセンスの管理。
GPU アクセラレーション VI ワークロードドメインを展開します。		VMware Private AI Foundation with NVIDIA 用の GPU アクセラレーション VI ワークロードドメインの展開
vSphere IaaS control plane（以前の vSphere with Tanzu）を有効にします。	すべて	VMware Private AI Foundation with NVIDIA の vSphere IaaS Control Plane の構成
ディープラーニング仮想マシンイメージ用のコンテンツライブラリを作成します。	ディープラーニング仮想マシンを展開する	VMware Private AI Foundation with NVIDIA のディープラーニング仮想マシンイメージを含むコンテンツライブラリを作成する
AI ワークロードの vSphere 名前空間を構成します。	すべて	GPU アクセラレーションワークロードの vSphere 名前空間の構成
インターネットにアクセスでき、Docker と Helm がインストールされているマシンをセットアップします。 VI ワークロードドメインの vCenter Server、スーパーバイザーインスタンス、およびローカルコンテナレジストリにアクセスできるマシンをセットアップします。マシンには、Docker、Helm、および Kubernetes CLI Tools for vSphere がインストールされている必要があります。	すべて	Bastion ホストの展開 Kubernetes CLI Tools for vSphere のインストール
スーパーバイザーで Harbor レジストリサービスをセットアップします。	すべて AI ワークロードが vSphere IaaS control plane のスーパーバイザーに展開される場合に必要です。 vSphere IaaS control plane のない環境で、vSphere クラスタで直接実行されているディープラーニング仮想マシンでコンテナイメージをプルするには、別のベンダーのレジストリを構成する必要があります。	VMware Private AI Foundation with NVIDIA でのプライベート Harbor レジストリの設定
Ubuntu の Tanzu Kubernetes リリース (TKr) のコンテンツライブラリを構成します。	GPU アクセラレーション TKG クラスタに RAG ワークロードを展開する GPU アクセラレーション TKG クラスタに AI ワークロードを展開する	切断された VMware Private AI Foundation with NVIDIA 環境用に Ubuntu TKr でコンテンツライブラリを構成する
NVIDIA Operator のコンポーネントを環境にアップロードします。	GPU アクセラレーション TKG クラスタに RAG ワークロードを展開する GPU アクセラレーション TKG クラスタに AI ワークロードを展開する	切断された環境への NVIDIA GPU Operator コンポーネントのアップロード
vGPU ゲストドライバをダウンロードする場所を指定します。	ディープラーニング仮想マシンを展開する	NVIDIA ライセンスポータルからダウンロードされた必要な vGPU ゲストドライババージョンと、次のいずれかの形式のインデックスをローカル Web サーバにアップロードします。 vGPU ゲストドライバの .run または .zip ファイルのリストを含むインデックス .txt ファイル。 `host-driver-version-1` `guest-driver-download-URL-1` `host-driver-version-2` `guest-driver-download-URL-2` `host-driver-version-3` `guest-driver-download-URL-3` NGINX や Apache HTTP Server などの Web サーバによって生成された形式のディレクトリインデックス。バージョン固有の vGPU ドライバファイルは、.zip ファイルとして指定する必要があります。
NVIDIA NGC コンテナイメージを、スーパーバイザーの Harbor レジストリサービスなどのプライベートコンテナレジストリにアップロードします。	すべて vSphere IaaS control plane のない環境で、vSphere クラスタで直接実行されているディープラーニング仮想マシンでコンテナイメージをプルするには、別のベンダーのレジストリを構成する必要があります。	VMware Private AI Foundation with NVIDIA のプライベート Harbor レジストリに AI コンテナイメージをアップロードする
VMware Aria Suite Lifecycle in VMware Cloud Foundation mode を使用して VMware Aria Automation を展開します。	すべてデータサイエンティストおよび DevOps エンジニアが、VMware Aria Automation のセルフサービスカタログアイテムを使用してワークロードを展開する場合に必要です。	VMware Cloud Foundation のためのプライベートクラウド自動化 VMware Private AI Foundation with NVIDIA 用の VMware Aria Automation の設定
VMware Aria Suite Lifecycle in VMware Cloud Foundation mode を使用して VMware Aria Operations を展開します。	すべて	VMware Cloud Foundation のためのインテリジェントな運用管理
VMware Data Services Manager の展開	RAG ワークロードを展開する	VMware Data Services Manager のインストールと構成また、vSphere Client のガイド付き展開ユーザーインターフェイスを使用して、管理ドメインに VMware Data Services Manager インスタンスを展開することもできます。スーパーバイザーサービスとして Data Services Manager Consumption Operator をインストールします。vSphere スーパーバイザーサービスカタログを参照してください。少なくとも 1 つのインフラストラクチャポリシーで VMware Data Services Manager を構成します。インフラストラクチャポリシーの作成を参照してください。