Se si prevede di utilizzare Retrieval-Augmented Generation (RAG) con VMware Private AI Foundation with NVIDIA, configurare un database PostgreSQL con pgvector utilizzando VMware Data Services Manager.

In qualità di utente di DSM, è possibile creare il database direttamente nella console di VMware Data Services Manager oppure, in qualità di tecnico o sviluppatore DevOps, è possibile utilizzare un catalogo self-service in VMware Aria Automation.

Prerequisiti

Procedura

  1. Distribuire un database PostgreSQL nel dominio del carico di lavoro VI e recuperare la stringa di connessione per il database.
    È possibile utilizzare uno dei workflow seguenti. Se si è un data scientist, è possibile distribuire direttamente un database da VMware Aria Automation. In caso contrario, richiedere una distribuzione del database all'amministratore DSM o all'utente DSM.
    Workflow di distribuzione Ruolo utente obbligatorio Descrizione
    Distribuire e recuperare la stringa di connessione di un database PostgreSQL da VMware Aria Automation. Data scientist o tecnico DevOps Vedere Distribuzione di un database vettore mediante un elemento catalogo self-service in VMware Aria Automation.
    Distribuire e recuperare la stringa di connessione di un database PostgreSQL dalla console di VMware Data Services Manager. L'amministratore DSM o l'utente DSM oppure un amministratore del cloud ha assegnato uno di questi ruoli Vedere Creazione di database in VMware Data Services Manager e Connessione a un database in VMware Data Services Manager.
    Distribuire e recuperare la stringa di connessione di un database PostgreSQL utilizzando il comando kubectl. L'amministratore DSM o l'utente DSM o un tecnico DevOps ha assegnato uno di questi ruoli Vedere Abilitazione dell'utilizzo self-service di VMware Data Services Manager.
    Il formato della stringa di connessione del database distribuito è il seguente.
    postgres://pgvector_db_admin:encoded_pgvector_db_admin_password@pgvector_db_ip_address:5432/pgvector_db_name
  2. Attivare l'estensione pgvector nel database mediante l'utilità della riga di comando psql.
    1. Connettersi al database.
      psql -h pgvector_db_ip_address -p 5432 -d pgvector_db_name -U pgvector_db_admin -W
    2. Attivare l'estensione pgvector.
      pgvector_db_name=# CREATE EXTENSION vector;

Operazioni successive

Integrare il database nel carico di lavoro RAG. Vedere Distribuzione di Deep Learning VM con un carico di lavoro RAG e Distribuzione di un carico di lavoro RAG in un cluster TKG.

Distribuzione di un database vettore mediante un elemento catalogo self-service in VMware Aria Automation

In qualità di data scientist o tecnico DevOps, è possibile utilizzare un elemento del catalogo self-service in Automation Service Broker per distribuire un database PostgreSQL pgvector gestito da VMware Data Services Manager.

Una volta distribuita, l'istanza del database può essere utilizzata per altre distribuzioni, anche da altri membri del team, in modo che più macchine virtuali di deep learning possano condividere un singolo database vettoriale.

Procedura

  1. Nella pagina Catalogo in Automation Service Broker, individuare la scheda Database DSM e fare clic su Richiedi.
  2. Selezionare un progetto.
  3. Immettere un nome per la distribuzione.
  4. Immettere un nome per il database.
  5. Configurare il database.
    Impostazione Valore di esempio
    Classe di macchine virtuali small

    La selezione della classe definisce la quantità di risorse di vCPU e memoria allocate al database.

    Criterio di storage pacific-storage-policy
    Dimensione disco 256 Gi
    Per ulteriori informazioni sulle impostazioni del database, vedere Creazione di database.
  6. Fare clic su Invia.
  7. Recuperare la stringa di connessione del database distribuito.
    1. In Automation Service Broker fare clic su Distribuzioni > Distribuzioni.
    2. Selezionare la voce di distribuzione per il database.
    3. Nella scheda Topologia selezionare il modello cloud per la distribuzione del database e dal menu Azioni per il modello selezionare Ottieni stringa di connessione.