DevOps エンジニアである場合は、スーパーバイザーの TKG クラスタで、VMware Data Services Manager によって管理される pgvector PostgreSQL データベースを使用する NVIDIA の RAG サンプル マルチターン アプリケーションに基づいて RAG ワークロードを展開できます。

前提条件

手順

  1. GPU アクセラレーション TKG クラスタをプロビジョニングします。
    次のワークフローのいずれかを使用できます。
    プロビジョニング ワークフロー 手順
    VMware Aria Automation でカタログ アイテムを使用する VMware Aria Automation でセルフサービス カタログ アイテムを使用してベクター データベースを備えた RAG クラスタを展開する
    kubectl コマンドを使用する
    1. kubectl コマンドを使用して、GPU アクセラレーション TKG クラスタをプロビジョニングします。
  2. kubectl コマンドを使用している場合は、NVIDIA NIM を展開します。
    1. NVIDIA NIM を使用して Helm チャートを取得します。
      マルチターン RAG」を参照してください。
    2. NVIDIA NIM LLM、NVIDIA NeMo Retriever Embedding、および NVIDIA NeMo Retriever Ranking Microservice を展開します。
      マルチターン RAG」を参照してください。
  3. サンプルのマルチターン チャットボットの Helm チャートを取得します。
    helm fetch https://helm.ngc.nvidia.com/nvidia/aiworkflows/charts/rag-app-multiturn-chatbot-24.08.tgz --username='$oauthtoken' --password=<YOUR API KEY>
    
  4. pgvector PostgreSQL データベースにチャットボットを構成するためのカスタム値を使用して YAML を作成します。
    接続文字列が postgres://pgvector_db_admin:encoded_pgvector_db_admin_password@pgvector_db_ip_address:5432/pgvector_db_name の pgvector データベースの場合は、次の app_values.yaml ファイルを準備します。

    サンプル チャット アプリケーションの外部 IP アドレスを提供するには、YAML ファイルで frontend.service.typeloadBalancer に設定します。

    query:
      env:
        APP_VECTORSTORE_URL: "pgvector_db_ip_address:5432"
        APP_VECTORSTORE_NAME: "pgvector"
        POSTGRES_PASSWORD: "encoded_pgvector_db_admin_password"
        POSTGRES_USER: "pgvector_db_admin"
        POSTGRES_DB: "pgvector_db_name"
        APP_EMBEDDINGS_MODELNAME: "nvidia/nv-embedqa-e5-v5"
    frontend:
      service:
        type: LoadBalancer
  5. カスタム値ファイルを使用して、名前空間にマルチターン チャットボットを展開します。
    kubectl create namespace multiturn-rag
    kubectl label --overwrite ns multiturn-rag pod-security.kubernetes.io/enforce=privileged
     
    export NGC_CLI_API_KEY="<NGC-API-key>"
     
    helm install multiturn-rag rag-app-multiturn-chatbot-24.08.tgz -n multiturn-rag --set imagePullSecret.password=$NGC_CLI_API_KEY -f ./app_values.yaml
  6. チャットボット アプリケーションにアクセスするには、次のコマンドを実行してアプリケーションの外部 IP アドレスを取得します。
    kubectl -n multiturn-rag get service
  7. Web ブラウザで、http://application_external_ip:3001/converse にあるサンプル チャット アプリケーションを開きます。