VMware Aria Automation のセルフサービスカタログアイテムを使用して RAG ワークロードを備えたディープラーニング仮想マシンを展開する

DevOps エンジニアは、セルフサービス Automation Service Broker カタログから RAG リファレンスソリューションを備えたディープラーニング仮想マシンを展開できます。

手順

Automation Service Broker の [カタログ] ページで、[AI RAG Workstation] カードを見つけて、[要求] をクリックします。
プロジェクトを選択します。
展開の名前と説明を入力します。

RAG ワークステーションパラメータを構成します。

設定	サンプル値
仮想マシンクラス	`A100 Small - 1 個の vGPU (16 GB)、8 個の CPU、16 GB のメモリ` 仮想マシンクラスの最小仕様： CPU：10 個の vCPU CPU RAM：64 GB GPU：2xH100 GPU メモリ：50 GB
データディスクサイズ	`3 Gi`
ユーザーパスワード	デフォルトユーザーのパスワードを入力します。初回ログイン時にパスワードのリセットを求められる場合があります。
SSH パブリックキー	このフィールド値の指定は任意です。

ソフトウェアカスタマイズをインストールします。
1. （オプション） RAG ソフトウェアバンドルに定義されている cloud-init に加えてカスタム cloud-init をインストールする場合は、チェックボックスをオンにして、構成パッケージの内容を貼り付けます。
  VMware Aria Automation は、RAG ソフトウェアバンドルとカスタム cloud-init から cloud-init をマージします。
2. NVIDIA NGC ポータルのアクセスキーを指定します。
3. Docker Hub 認証情報を入力します。
[送信] をクリックします。

ディープラーニング仮想マシンには、Ubuntu 22.04、NVIDIA vGPU ドライバ、Docker エンジン、NVIDIA Container Toolkit、および Llama-2-13b-chat モデルを使用するリファレンス RAG ソリューションが含まれています。