Wenn Sie die Retrieval-Augmented Generation (RAG) mit VMware Private AI Foundation with NVIDIA verwenden möchten, richten Sie mithilfe von VMware Data Services Manager eine PostgreSQL-Datenbank mit pgvector ein.

Sie können die Datenbank manuell erstellen oder einen Self-Service-Katalog in VMware Aria Automation erstellen, der von DevOps-Ingenieuren und Entwicklern verwendet werden kann.

Voraussetzungen

Prozedur

  1. Stellen Sie eine PostgreSQL-Datenbank in der VI-Arbeitslastdomäne bereit und rufen Sie die Verbindungszeichenfolge für die Datenbank ab.
    Sie können Sie einen der folgenden Workflows verwenden. Als Datenwissenschaftler können Sie eine Datenbank direkt über VMware Aria Automation bereitstellen. Andernfalls fordern Sie eine Datenbankbereitstellung bei Ihrem DSM-Administrator oder DSM-Benutzer an.
    Bereitstellungsworkflow Benötigte Benutzerrolle Beschreibung
    Stellen Sie die Verbindungszeichenfolge einer PostgreSQL-Datenbank bereit und rufen Sie sie aus VMware Aria Automation ab Datenwissenschaftler oder DevOps-Ingenieur Weitere Informationen finden Sie unter Bereitstellen einer Vektordatenbank mithilfe eines Self-Service-Katalogelements in VMware Aria Automation.
    Stellen Sie die Verbindungszeichenfolge einer PostgreSQL-Datenbank über die VMware Data Services Manager-Konsole bereit und rufen Sie sie ab. DSM-Administrator oder DSM-Benutzer oder ein Cloud-Administrator, dem eine dieser Rollen zugewiesen wurde Weitere Informationen finden Sie unter Erstellen von Datenbanken und Herstellen einer Verbindung zu einer Datenbank.
    Stellen Sie die Verbindungszeichenfolge einer PostgreSQL-Datenbank mithilfe des Befehls kubectl bereit und rufen Sie sie ab DSM-Administrator oder DSM-Benutzer oder ein DevOps-Ingenieur, dem eine dieser Rollen zugewiesen wurde Weitere Informationen finden Sie unter Aktivieren der Self-Service-Nutzung von VMware Data Services Manager.
    Die Verbindungszeichenfolge der bereitgestellten Datenbank weist das folgende Format auf.
    postgres://pgvector_db_admin:encoded_pgvector_db_admin_password@pgvector_db_ip_address:5432/pgvector_db_name
  2. Aktivieren Sie die pgvector-Erweiterung in der Datenbank mithilfe des Befehlszeilendienstprogramms psql.
    1. Stellen Sie eine Verbindung zur Datenbank her.
      psql -h pgvector_db_ip_address -p 5432 -d pgvector_db_name -U pgvector_db_admin -W
    2. Aktivieren Sie die pgvector-Erweiterung.
      pgvector_db_name=# CREATE EXTENSION vector;

Nächste Maßnahme

Integrieren Sie die Datenbank in Ihre RAG-Arbeitslast. Weitere Informationen finden Sie unter Bereitstellen einer Deep Learning-VM mit einer RAG-Arbeitslast und Bereitstellen einer RAG-Arbeitslast auf einem TKG-Cluster.

Bereitstellen einer Vektordatenbank mithilfe eines Self-Service-Katalogelements in VMware Aria Automation

In VMware Private AI Foundation with NVIDIA können Sie als Datenwissenschaftler oder DevOps-Ingenieur eine Vektordatenbank aus VMware Aria Automation bereitstellen, indem Sie ein Self-Service-Katalogelement in Automation Service Broker verwenden.

Prozedur

  1. Melden Sie sich bei VMware Aria Automation an und suchen Sie in Automation Service Broker das Katalogelement für die Datenbankbereitstellung gemäß den Informationen Ihres Cloud-Administrators.
    Standardmäßig wird das Katalogelement als DSM DBaaS bezeichnet.
  2. Klicken Sie auf der Katalogelementkarte auf Anforderung und geben Sie die Details für die neue PostgreSQL-Datenbank ein.
    Weitere Informationen zu den Einstellungen für die Datenbank finden Sie unter Erstellen von Datenbanken.
  3. Rufen Sie die Verbindungszeichenfolge der bereitgestellten Datenbank ab.
    1. Klicken Sie in Automation Service Broker auf Bereitstellungen > Bereitstellungen.
    2. Wählen Sie den Bereitstellungseintrag für die Datenbank aus.
    3. Wählen Sie auf der Registerkarte Topologie die Cloud-Vorlage für die Datenbankbereitstellung aus und wählen Sie im Menü Aktionen für die Vorlage die Option Verbindungszeichenfolge abrufen aus.

Ergebnisse

Weitere Informationen zur Bereitstellung und Durchführung von Vorgängen für Datenbanken in VMware Data Services Manager über VMware Aria Automation finden Sie in der Datei readme.md im Paket AriaAutomation_DataServicesManager .