データ サイエンティストである場合は、セルフサービス Automation Service Broker カタログから、VMware Data Services Manager (DSM) によって管理される pgvector PostgreSQL データベースを使用して GPU 対応の RAG ワークステーションを展開できます。
カタログで [AI RAG Workstation with DSM] を要求する場合は、既存のデータベース インスタンスを使用するか、新しいデータベース インスタンスを作成できます。展開時に、ディープ ラーニング仮想マシンと接続先のデータベース仮想マシンの両方がプロビジョニングされます。データベースは、RAG 展開の外部にプロビジョニングされます。
- [既存のデータベース] オプションを選択する場合は、事前に展開されたデータベースを使用します。このデータベースは、外部データベース、または別の [AI RAG Workstation with DSM] 展開によってプロビジョニングされたデータベースであることができます。展開時に、新しいデータベース インスタンスはプロビジョニングされません。
- 使用できる既存のデータベースがない場合、または特定の使用事例に独自のプライベート データベースが必要な場合は、[新しいデータベース] オプションを選択します。
手順
- Automation Service Broker の [カタログ] ページで、[AI RAG Workstation with DSM] カードを見つけて、[要求] をクリックします。
- プロジェクトを選択します。
- 展開の名前と説明を入力します。
- RAG ワークステーション パラメータを構成します。
設定 サンプル値 仮想マシン クラス vgpu-1xa100-40c 仮想マシン クラスの最小仕様:- CPU:10 個の vCPU
- CPU RAM:64 GB
- GPU:2xH100
- GPU メモリ:50 GB
データ ディスク サイズ 32 Gi 20 GB ~ 1TB のディスク サイズを選択します。
ユーザー パスワード デフォルト ユーザーのパスワードを入力します。初回ログイン時にパスワードのリセットを求められる場合があります。 SSH パブリック キー このフィールド値の指定は任意です。 - ワークステーション データベースを構成します。
設定 サンプル値 データベース インスタンス 既存のデータベース 接続文字列 DSM 展開の概要から DSM 接続文字列を指定します。
- ソフトウェア カスタマイズをインストールします。
- (オプション) RAG ソフトウェア バンドルに定義されている cloud-init に加えてカスタム cloud-init をインストールする場合は、チェックボックスをオンにして、構成パッケージの内容を貼り付けます。
VMware Aria Automation は、RAG ソフトウェア バンドルとカスタム cloud-init から cloud-init をマージします。
- NVIDIA NGC ポータルのアクセス キーを指定します。
- (オプション) ロード バランサを介して NVIDIA Data Center GPU Manager (DCGM) メトリックを公開します。
NVIDIA DCGM は、データセンター環境の GPU を管理および監視します。
- Docker Hub 認証情報を入力します。
- (オプション) RAG ソフトウェア バンドルに定義されている cloud-init に加えてカスタム cloud-init をインストールする場合は、チェックボックスをオンにして、構成パッケージの内容を貼り付けます。
- [送信] をクリックします。