Se si prevede di utilizzare Retrieval-Augmented Generation (RAG) con VMware Private AI Foundation with NVIDIA, configurare un database PostgreSQL con pgvector utilizzando VMware Data Services Manager.

È possibile creare il database manualmente oppure creare un catalogo self-service in VMware Aria Automation che possa essere utilizzato dagli sviluppatori e dai tecnici DevOps.

Prerequisiti

Procedura

  1. Distribuire un database PostgreSQL nel dominio del carico di lavoro VI e recuperare la stringa di connessione per il database.
    Workflow di distribuzione Descrizione
    Distribuire e recuperare la stringa di connessione di un database PostgreSQL dalla console di VMware Data Services Manager. Vedere Creazione di database e Connessione a un database.
    Distribuire e recuperare la stringa di connessione di un database PostgreSQL utilizzando il comando kubectl. Vedere Abilitazione dell'utilizzo self-service di VMware Data Services Manager.
    Distribuire e recuperare la stringa di connessione di un database PostgreSQL da VMware Aria Automation. Vedere Distribuzione di un database vettore mediante un elemento catalogo self-service in VMware Aria Automation.
    Il formato della stringa di connessione del database distribuito è il seguente.
    postgres://pgvector_db_admin:encoded_pgvector_db_admin_password@pgvector_db_ip_address:5432/pgvector_db_name
  2. Attivare l'estensione pgvector nel database mediante l'utilità della riga di comando psql.
    1. Connettersi al database.
      psql -h pgvector_db_ip_address -p 5432 -d pgvector_db_name -U pgvector_db_admin -W
    2. Attivare l'estensione pgvector.
      pgvector_db_name=# CREATE EXTENSION vector;

Distribuzione di un database vettore mediante un elemento catalogo self-service in VMware Aria Automation

I data scientist e i tecnici DevOps possono utilizzare VMware Aria Automation per eseguire il provisioning di un database PostgreSQL con estensione pgvector nel dominio del carico di lavoro VI dedicato per i carichi di lavoro AI.

Creazione di un elemento catalogo di un database vettore in VMware Aria Automation

In qualità di amministratore del cloud, aggiungere un elemento catalogo per il provisioning dei database di VMware Data Services Manager in Service Broker di VMware Aria Automation.

Prerequisiti

  • Verificare di aver distribuito VMware Data Services Manager 2.0.2.
  • Specificare una macchina in cui sia installato Python 3.10 che abbia accesso alle istanze di VMware Data Services Manager e VMware Aria Automation.

Procedura

  1. Nella macchina che esegue Python, scaricare il bundle AriaAutomation_DataServicesManager per VMware Data Services Manager 2.0.2 da VMware Tanzu Network ed estrarne il contenuto.
  2. Aggiornare il file config.json nella cartella in cui è stato estratto il bundle con gli URL e le credenziali utente per VMware Data Services Manager e VMware Aria Automation.
    Facoltativamente, è anche possibile impostare il nome dell'elemento catalogo, il progetto di Automation Assembler e altri parametri.
  3. Per creare gli elementi catalogo in VMware Aria Automation, eseguire lo script Python aria.py nel modo seguente.
    python3 aria.py enable-blueprint-version-2

risultati

Lo script Python crea in VMware Aria Automation elementi necessari per l'utilizzo di VMware Data Services Manager per il provisioning del database. Vedere il file readme.md nel bundle AriaAutomation_DataServicesManager

Distribuzione di un database vettore mediante un elemento catalogo self-service in VMware Aria Automation

In VMware Private AI Foundation with NVIDIA in qualità di data scientist o tecnico DevOps, è possibile distribuire un database vettore da VMware Aria Automation utilizzando un elemento catalogo self-service in Automation Service Broker.

Prerequisiti

Verificare con l'amministratore del cloud che i prerequisiti per la creazione di un database PostgreSQL siano soddisfatti. Vedere Creazione di database.

Procedura

  1. Accedere a VMware Aria Automation e, in Automation Service Broker, individuare l'elemento catalogo per la distribuzione del database in base alle informazioni ricevute dall'amministratore del cloud.
    Per impostazione predefinita, l'elemento catalogo è denominato DSM DBaaS.
  2. Nella scheda dell'elemento catalogo fare clic su Richiedi e immettere i dettagli del nuovo database PostgreSQL.
    Per ulteriori informazioni sulle impostazioni del database, vedere Creazione di database.
  3. Recuperare la stringa di connessione del database distribuito.
    1. In Automation Service Broker fare clic su Distribuzioni > Distribuzioni.
    2. Selezionare la voce di distribuzione per il database.
    3. Nella scheda Topologia selezionare il modello cloud per la distribuzione del database e dal menu Azioni per il modello selezionare Ottieni stringa di connessione.

risultati

Per ulteriori informazioni sul provisioning e l'esecuzione di operazioni relative ai database in VMware Data Services Manager da VMware Aria Automation, vedere il file readme.md nel bundle AriaAutomation_DataServicesManager e il post del blog relativo all'integrazione di Data Services Manager v2.0.2 con VMware Aria Automation.