Wenn Sie Retrieval-Augmented Generation (RAG) mit VMware Private AI Foundation with NVIDIA verwenden möchten, richten Sie mithilfe von VMware Data Services Manager eine PostgreSQL-Datenbank mit pgvector ein.

Als DSM-Benutzer können Sie die Datenbank direkt in der VMware Data Services Manager-Konsole erstellen, während Sie als DevOps-Ingenieur oder -Entwickler einen Self-Service-Katalog in VMware Aria Automation verwenden können.

Voraussetzungen

Prozedur

  1. Stellen Sie eine PostgreSQL-Datenbank in der VI-Arbeitslastdomäne bereit und rufen Sie die Verbindungszeichenfolge für die Datenbank ab.
    Sie können Sie einen der folgenden Workflows verwenden. Als Datenwissenschaftler können Sie eine Datenbank direkt über VMware Aria Automation bereitstellen. Andernfalls fordern Sie eine Datenbankbereitstellung bei Ihrem DSM-Administrator oder DSM-Benutzer an.
    Bereitstellungsworkflow Benötigte Benutzerrolle Beschreibung
    Stellen Sie die Verbindungszeichenfolge einer PostgreSQL-Datenbank bereit und rufen Sie sie aus VMware Aria Automation ab Datenwissenschaftler oder DevOps-Ingenieur Weitere Informationen finden Sie unter Bereitstellen einer Vektordatenbank mithilfe eines Self-Service-Katalogelements in VMware Aria Automation.
    Stellen Sie die Verbindungszeichenfolge einer PostgreSQL-Datenbank über die VMware Data Services Manager-Konsole bereit und rufen Sie sie ab. DSM-Administrator oder DSM-Benutzer oder ein Cloud-Administrator, dem eine dieser Rollen zugewiesen wurde Weitere Informationen finden Sie unter Erstellen von Datenbanken in VMware Data Services Manager und Herstellen einer Verbindung mit einer Datenbank in VMware Data Services Manager.
    Stellen Sie die Verbindungszeichenfolge einer PostgreSQL-Datenbank mithilfe des Befehls kubectl bereit und rufen Sie sie ab. DSM-Administrator oder DSM-Benutzer oder ein DevOps-Ingenieur, dem eine dieser Rollen zugewiesen wurde Weitere Informationen finden Sie unter Aktivieren der Self-Service-Nutzung von VMware Data Services Manager.
    Die Verbindungszeichenfolge der bereitgestellten Datenbank weist das folgende Format auf.
    postgres://pgvector_db_admin:encoded_pgvector_db_admin_password@pgvector_db_ip_address:5432/pgvector_db_name
  2. Aktivieren Sie die pgvector-Erweiterung in der Datenbank mithilfe des Befehlszeilendienstprogramms psql.
    1. Stellen Sie eine Verbindung zur Datenbank her.
      psql -h pgvector_db_ip_address -p 5432 -d pgvector_db_name -U pgvector_db_admin -W
    2. Aktivieren Sie die pgvector-Erweiterung.
      pgvector_db_name=# CREATE EXTENSION vector;

Nächste Maßnahme

Integrieren Sie die Datenbank in Ihre RAG-Arbeitslast. Weitere Informationen finden Sie unter Bereitstellen einer Deep Learning-VM mit einer RAG-Arbeitslast und Bereitstellen einer RAG-Arbeitslast auf einem TKG-Cluster.

Bereitstellen einer Vektordatenbank mithilfe eines Self-Service-Katalogelements in VMware Aria Automation

Als Datenwissenschaftler oder DevOps-Ingenieur können Sie ein Self-Service-Katalogelement in Automation Service Broker verwenden, um eine PostgreSQL-Datenbank vom Typ „pgvector“ bereitzustellen, die von VMware Data Services Manager verwaltet wird.

Nach der Bereitstellung kann die Datenbankinstanz für andere Bereitstellungen verwendet werden, auch von anderen Mitgliedern Ihres Teams, sodass mehrere Deep Learning-VMs eine einzelne Vektordatenbank gemeinsam nutzen können.

Prozedur

  1. Suchen Sie auf der Seite Katalog in Automation Service Broker nach der Karte DSM-Datenbank und klicken Sie auf Anfordern.
  2. Wählen Sie ein Projekt aus.
  3. Geben Sie einen Namen für die Bereitstellung ein.
  4. Geben Sie einen Namen für die Datenbank ein.
  5. Konfigurieren Sie die Datenbank.
    Einstellung Beispielwert
    VM-Klasse small

    Mit der Klassenauswahl wird die Menge der vCPU- und Arbeitsspeicherressourcen definiert, die der Datenbank zugeteilt werden.

    Speicherrichtlinie pacific-storage-policy
    Festplattengröße 256 Gi
    Weitere Informationen zu Datenbankeinstellungen finden Sie unter Erstellen von Datenbanken.
  6. Klicken Sie auf Senden.
  7. Rufen Sie die Verbindungszeichenfolge der bereitgestellten Datenbank ab.
    1. Klicken Sie in Automation Service Broker auf Bereitstellungen > Bereitstellungen.
    2. Wählen Sie den Bereitstellungseintrag für die Datenbank aus.
    3. Wählen Sie auf der Registerkarte Topologie die Cloud-Vorlage für die Datenbankbereitstellung aus und wählen Sie im Menü Aktionen für die Vorlage die Option Verbindungszeichenfolge abrufen aus.