Bereitstellen einer RAG-Arbeitslast auf einem TKG-Cluster

Auf einem TKG-Cluster in einem Supervisor können Sie eine RAG-Arbeitslast basierend auf der RAG-Beispiel-Pipeline von NVIDIA bereitstellen, die eine pgvector-PostgreSQL-Datenbank verwendet, die von VMware Data Services Manager verwaltet wird.

Voraussetzungen

Stellen Sie sicher, dass VMware Private AI Foundation with NVIDIA für die VI-Arbeitslastdomäne verfügbar ist. Weitere Informationen finden Sie unter Bereitstellen von VMware Private AI Foundation with NVIDIA.
Bereitstellen einer Vektordatenbank in VMware Private AI Foundation with NVIDIA.

Prozedur

Stellen Sie einen GPU-beschleunigten TKG-Cluster bereit.
Weitere Informationen finden Sie unter Bereitstellen von KI-Arbeitslasten auf TKG-Clustern in VMware Private AI Foundation with NVIDIA.
Installieren Sie den RAG LLM-Operator.
Weitere Informationen finden Sie unter Installieren des RAG LLM-Operators.
Laden Sie die Manifeste für die NVIDIA-Beispiel-RAG-Pipeline herunter.
Weitere Informationen finden Sie unter Beispiel-RAG-Pipeline.
Konfigurieren Sie die Beispiel-RAG-Pipeline mit der PostgreSQL-Datenbank „pgvector“.
1. Bearbeiten Sie eine Beispiel-Pipeline-YAML-Datei.
  Weitere Informationen finden Sie unter Schritt 4 in Beispiel-RAG-Pipeline.
2. Konfigurieren Sie in der YAML-Datei die Beispiel-Pipeline mit der PostgreSQL-Datenbank „pgvector“, indem Sie die Verbindungszeichenfolge der Datenbank verwenden.
  Weitere Informationen finden Sie unter Vektordatenbank für RAG-Beispiel-Pipeline.
Um eine externe IP-Adresse für die Beispiel-Chat-Anwendung anzugeben, legen Sie in der YAML-Datei frontend.service.type auf loadBalancer fest.
Starten Sie die Beispiel-RAG-Pipeline.
Weitere Informationen finden Sie unter Beispiel-RAG-Pipeline.
Für den Zugriff auf die Beispiel-Chat-Anwendung führen Sie den folgenden Befehl aus, um die externe IP-Adresse der Anwendung abzurufen.
```
kubectl -n rag-sample get service rag-playground
```
Öffnen Sie in einem Webbrowser die Beispiel-Chat-Anwendung unter http://application_external_ip:3001/orgs/nvidia/models/text-qa-chatbot.