Automation Service Broker で VMware Private AI Foundation カタログアイテムを展開する方法

クラウド管理者が VMware Aria Automation で Private AI Automation Services を設定している場合は、Automation Service Broker カタログを使用して AI ワークロードにアクセスしたり、AI ワークロードを申請したりできます。

注：このドキュメントは、 VMware Aria Automation 8.18 に基づいています。 VMware Aria Automation 8.18.1 の VMware Private AI Foundation 機能については、 VMware Private AI Foundation with NVIDIA ドキュメントを参照してください。

データサイエンティストや DevOps エンジニアは、次の Private AI Automation Services カタログアイテムを申請できます。

[AI Workstation] - 目的の vCPU、vGPU、メモリ、および AI/ML フレームワーク（PyTorch、CUDA Samples、TensorFlow など）を事前にインストールするオプションを使用して構成できる GPU 対応の仮想マシン。
[AI RAG Workstation] - 取得拡張生成 (RAG) リファレンスソリューションを持つ GPU 対応の仮想マシン。
[Triton 推論サーバ] - NVIDIA Triton 推論サーバを持つ GPU 対応の仮想マシン。
[AI Kubernetes クラスタ] - AI/ML クラウドネイティブワークロードを実行するための GPU 対応のワーカーノードを持つ VMware Tanzu Kubernetes Grid クラスタ。
[AI Kubernetes RAG クラスタ] - リファレンス RAG ソリューションを実行するための GPU 対応のワーカーノードを持つ VMware Tanzu Kubernetes Grid クラスタ。

開始する前に

クラウド管理者がプロジェクト用の Private AI Automation Services を構成済みであることを確認します。
AI カタログアイテムを申請する権限があることを確認します。

Private AI Automation Services カタログアイテムにアクセスする方法

Automation Service Broker で、[使用] タブを開いて [カタログ] をクリックします。使用可能なカタログアイテムは、選択したプロジェクトに基づいて異なります。プロジェクトを選択しなかった場合は、使用可能なすべてのカタログアイテムがカタログに表示されます。

このセクションで説明する手順に示されている値はすべて、使用事例で使用されるサンプルです。アカウントの値は環境によって異なります。

Private AI 展開を監視する方法

Automation Service Broker の [展開] 画面を使用して、展開および関連付けられたリソースの管理、展開の変更、失敗した展開のトラブルシューティング、リソースの変更、および使用されていない展開の削除を実行します。

展開を管理するには、[使用] > [展開] > [展開] の順に選択します。

詳細については、Automation Service Broker 展開の管理方法を参照してください。

開始する前に

Private AI Automation Services カタログ アイテムにアクセスする方法

Private AI 展開を監視する方法

Private AI Automation Services カタログアイテムにアクセスする方法