DevOps エンジニアは、セルフサービス Automation Service Broker カタログから RAG リファレンス ソリューションを備えたディープ ラーニング仮想マシンを展開できます。
手順
- Automation Service Broker の [カタログ] ページで、[AI RAG Workstation] カードを見つけて、[要求] をクリックします。
- プロジェクトを選択します。
- 展開の名前と説明を入力します。
- RAG ワークステーション パラメータを構成します。
設定 サンプル値 仮想マシン クラス A100 Small - 1 個の vGPU (16 GB)、8 個の CPU、16 GB のメモリ 仮想マシン クラスの最小仕様:- CPU:10 個の vCPU
- CPU RAM:64 GB
- GPU:2xH100
- GPU メモリ:50 GB
データ ディスク サイズ 3 Gi ユーザー パスワード デフォルト ユーザーのパスワードを入力します。初回ログイン時にパスワードのリセットを求められる場合があります。 SSH パブリック キー このフィールド値の指定は任意です。 - ソフトウェア カスタマイズをインストールします。
- (オプション) RAG ソフトウェア バンドルに定義されている cloud-init に加えてカスタム cloud-init をインストールする場合は、チェックボックスをオンにして、構成パッケージの内容を貼り付けます。
VMware Aria Automation は、RAG ソフトウェア バンドルとカスタム cloud-init から cloud-init をマージします。
- NVIDIA NGC ポータルのアクセス キーを指定します。
- Docker Hub 認証情報を入力します。
- (オプション) RAG ソフトウェア バンドルに定義されている cloud-init に加えてカスタム cloud-init をインストールする場合は、チェックボックスをオンにして、構成パッケージの内容を貼り付けます。
- [送信] をクリックします。