VMware Private AI Foundation with NVIDIA で Retrieval-Augmented Generation (RAG) を使用する場合は、VMware Data Services Manager を使用して pgvector を備えた PostgreSQL データベースをセットアップします。

DSM ユーザーである場合は、VMware Data Services Manager コンソールでデータベースを直接作成できます。また、DevOps エンジニアまたは開発者である場合は、VMware Aria Automation でセルフサービス カタログを使用することができます。

前提条件

手順

  1. VI ワークロード ドメインに PostgreSQL データベースを展開し、データベースの接続文字列を取得します。
    次のワークフローのいずれかを使用できます。データ サイエンティストの場合は、 VMware Aria Automation からデータベースを直接展開できます。それ以外の場合は、DSM 管理者または DSM ユーザーにデータベースの展開を要求します。
    展開のワークフロー 必要なユーザー ロール 説明
    VMware Aria Automation から PostgreSQL データベースを展開して接続文字列を取得します。 データ サイエンティストまたは DevOps エンジニア VMware Aria Automation でセルフサービス カタログ アイテムを使用してベクター データベースを展開するを参照してください。
    VMware Data Services Manager コンソールから PostgreSQL データベースを展開して接続文字列を取得します。 DSM 管理者または DSM ユーザー、またはこれらのロールのいずれかを割り当てられたクラウド管理者 VMware Data Services Manager でのデータベースの作成VMware Data Services Manager でのデータベースへの接続を参照してください。
    kubectl コマンドを使用して PostgreSQL データベースを展開し、接続文字列を取得します。 DSM 管理者または DSM ユーザー、またはこれらのロールのいずれかを割り当てられた DevOps エンジニア VMware Data Services Manager のセルフサービス使用の有効化を参照してください。
    展開されたデータベースの接続文字列の形式は次のとおりです。
    postgres://pgvector_db_admin:encoded_pgvector_db_admin_password@pgvector_db_ip_address:5432/pgvector_db_name
  2. psql コマンド ライン ユーティリティを使用して、データベースで pgvector 拡張機能を有効化します。
    1. データベースに接続します。
      psql -h pgvector_db_ip_address -p 5432 -d pgvector_db_name -U pgvector_db_admin -W
    2. pgvector 拡張機能を有効化します。
      pgvector_db_name=# CREATE EXTENSION vector;

次のタスク

RAG ワークロードにデータベースを統合します。 RAG ワークロードでディープ ラーニング仮想マシンを展開するTKG クラスタへ RAG ワークロードを展開するを参照してください。

VMware Aria Automation でセルフサービス カタログ アイテムを使用してベクター データベースを展開する

データ サイエンティストまたは DevOps エンジニアである場合は、Automation Service Broker のセルフサービス カタログ アイテムを使用して、VMware Data Services Manager によって管理される pgvector PostgreSQL データベースを展開できます。

展開されたデータベース インスタンスはチームの他のメンバーの展開を含む他の展開に使用できるため、複数のディープ ラーニング仮想マシンで単一のベクター データベースを共有できます。

手順

  1. Automation Service Broker[カタログ] ページで、[DSM データベース] カードを見つけて、[要求] をクリックします。
  2. プロジェクトを選択します。
  3. 展開の名前を入力します。
  4. データベースの名前を入力します。
  5. データベースを構成します。
    設定 サンプル値
    仮想マシン クラス 小さい

    クラスの選択により、データベースに割り当てられる vCPU およびメモリ リソースの量が定義されます。

    ストレージ ポリシー pacific-storage-policy
    ディスク サイズ 256 Gi
    データベース設定の詳細については、「 データベースの作成」を参照してください。
  6. [送信] をクリックします。
  7. 展開されたデータベースの接続文字列を取得します。
    1. Automation Service Broker で、[展開] > [展開] をクリックします。
    2. データベースの展開エントリを選択します。
    3. [トポロジ] タブで、データベース展開のクラウド テンプレートを選択し、テンプレートの [アクション] メニューから [接続文字列を取得] を選択します。