Se si prevede di utilizzare Retrieval-Augmented Generation (RAG) con VMware Private AI Foundation with NVIDIA, configurare un database PostgreSQL con pgvector utilizzando VMware Data Services Manager.

È possibile creare il database manualmente oppure creare un catalogo self-service in VMware Aria Automation che possa essere utilizzato dagli sviluppatori e dai tecnici DevOps.

Prerequisiti

Procedura

  1. Distribuire un database PostgreSQL nel dominio del carico di lavoro VI e recuperare la stringa di connessione per il database.
    È possibile utilizzare uno dei workflow seguenti. Se si è un data scientist, è possibile distribuire direttamente un database da VMware Aria Automation. In caso contrario, richiedere una distribuzione del database all'amministratore DSM o all'utente DSM.
    Workflow di distribuzione Ruolo utente obbligatorio Descrizione
    Distribuire e recuperare la stringa di connessione di un database PostgreSQL da VMware Aria Automation. Data scientist o tecnico DevOps Vedere Distribuzione di un database vettore mediante un elemento catalogo self-service in VMware Aria Automation.
    Distribuire e recuperare la stringa di connessione di un database PostgreSQL dalla console di VMware Data Services Manager. L'amministratore DSM o l'utente DSM oppure un amministratore del cloud ha assegnato uno di questi ruoli Vedere Creazione di database e Connessione a un database.
    Distribuire e recuperare la stringa di connessione di un database PostgreSQL utilizzando il comando kubectl. L'amministratore DSM o l'utente DSM o un tecnico DevOps ha assegnato uno di questi ruoli Vedere Abilitazione dell'utilizzo self-service di VMware Data Services Manager.
    Il formato della stringa di connessione del database distribuito è il seguente.
    postgres://pgvector_db_admin:encoded_pgvector_db_admin_password@pgvector_db_ip_address:5432/pgvector_db_name
  2. Attivare l'estensione pgvector nel database mediante l'utilità della riga di comando psql.
    1. Connettersi al database.
      psql -h pgvector_db_ip_address -p 5432 -d pgvector_db_name -U pgvector_db_admin -W
    2. Attivare l'estensione pgvector.
      pgvector_db_name=# CREATE EXTENSION vector;

Operazioni successive

Integrare il database nel carico di lavoro RAG. Vedere Distribuzione di una macchina virtuale di deep learning con un carico di lavoro RAG e Distribuzione di un carico di lavoro RAG in un cluster TKG.

Distribuzione di un database vettore mediante un elemento catalogo self-service in VMware Aria Automation

In VMware Private AI Foundation with NVIDIA in qualità di data scientist o tecnico DevOps, è possibile distribuire un database vettore da VMware Aria Automation utilizzando un elemento catalogo self-service in Automation Service Broker.

Procedura

  1. Accedere a VMware Aria Automation e, in Automation Service Broker, individuare l'elemento catalogo per la distribuzione del database in base alle informazioni ricevute dall'amministratore del cloud.
    Per impostazione predefinita, l'elemento catalogo è denominato DSM DBaaS.
  2. Nella scheda dell'elemento catalogo fare clic su Richiedi e immettere i dettagli del nuovo database PostgreSQL.
    Per ulteriori informazioni sulle impostazioni del database, vedere Creazione di database.
  3. Recuperare la stringa di connessione del database distribuito.
    1. In Automation Service Broker fare clic su Distribuzioni > Distribuzioni.
    2. Selezionare la voce di distribuzione per il database.
    3. Nella scheda Topologia selezionare il modello cloud per la distribuzione del database e dal menu Azioni per il modello selezionare Ottieni stringa di connessione.

risultati

Per ulteriori informazioni sul provisioning e l'esecuzione di operazioni relative ai database in VMware Data Services Manager da VMware Aria Automation, vedere il file readme.md nel bundle AriaAutomation_DataServicesManager .