データ サイエンティストである場合は、セルフサービス Automation Service Broker カタログから、VMware Data Services Manager (DSM) によって管理される pgvector PostgreSQL データベースを使用して GPU 対応の RAG ワークステーションを展開できます。

カタログで [AI RAG Workstation with DSM] を要求する場合は、既存のデータベース インスタンスを使用するか、新しいデータベース インスタンスを作成できます。展開時に、ディープ ラーニング仮想マシンと接続先のデータベース仮想マシンの両方がプロビジョニングされます。データベースは、RAG 展開の外部にプロビジョニングされます。

  • [既存のデータベース] オプションを選択する場合は、事前に展開されたデータベースを使用します。このデータベースは、外部データベース、または別の [AI RAG Workstation with DSM] 展開によってプロビジョニングされたデータベースであることができます。展開時に、新しいデータベース インスタンスはプロビジョニングされません。
  • 使用できる既存のデータベースがない場合、または特定の使用事例に独自のプライベート データベースが必要な場合は、[新しいデータベース] オプションを選択します。

手順

  1. Automation Service Broker[カタログ] ページで、[AI RAG Workstation with DSM] カードを見つけて、[要求] をクリックします。
  2. プロジェクトを選択します。
  3. 展開の名前と説明を入力します。
  4. RAG ワークステーション パラメータを構成します。
    設定 サンプル値
    仮想マシン クラス vgpu-1xa100-40c
    仮想マシン クラスの最小仕様:
    • CPU:10 個の vCPU
    • CPU RAM:64 GB
    • GPU:2xH100
    • GPU メモリ:50 GB
    データ ディスク サイズ 32 Gi

    20 GB ~ 1TB のディスク サイズを選択します。

    ユーザー パスワード デフォルト ユーザーのパスワードを入力します。初回ログイン時にパスワードのリセットを求められる場合があります。
    SSH パブリック キー このフィールド値の指定は任意です。
  5. ワークステーション データベースを構成します。
    設定 サンプル値
    データベース インスタンス 既存のデータベース
    接続文字列

    DSM 展開の概要から DSM 接続文字列を指定します。

  6. ソフトウェア カスタマイズをインストールします。
    1. (オプション) RAG ソフトウェア バンドルに定義されている cloud-init に加えてカスタム cloud-init をインストールする場合は、チェックボックスをオンにして、構成パッケージの内容を貼り付けます。
      VMware Aria Automation は、RAG ソフトウェア バンドルとカスタム cloud-init から cloud-init をマージします。
    2. NVIDIA NGC ポータルのアクセス キーを指定します。
    3. (オプション) ロード バランサを介して NVIDIA Data Center GPU Manager (DCGM) メトリックを公開します。
      NVIDIA DCGM は、データセンター環境の GPU を管理および監視します。
    4. Docker Hub 認証情報を入力します。
  7. [送信] をクリックします。