Distribuzione di un database vettore in VMware Private AI Foundation with NVIDIA

Se si prevede di utilizzare Retrieval-Augmented Generation (RAG) con VMware Private AI Foundation with NVIDIA, configurare un database PostgreSQL con pgvector utilizzando VMware Data Services Manager.

In qualità di utente di DSM, è possibile creare il database direttamente nella console di VMware Data Services Manager oppure, in qualità di tecnico o sviluppatore DevOps, è possibile utilizzare un catalogo self-service in VMware Aria Automation.

Prerequisiti

Verificare che VMware Private AI Foundation with NVIDIA sia disponibile per il dominio del carico di lavoro VI. Vedere Preparazione di VMware Cloud Foundation per la distribuzione del carico di lavoro di Private AI.
Verificare con l'amministratore del cloud che i prerequisiti per la creazione di un database PostgreSQL siano soddisfatti. Vedere Creazione di database in VMware Data Services Manager.
Installare l'utilità della riga di comando psql dal sito Web di PostgreSQL.

Procedura

Distribuire un database PostgreSQL nel dominio del carico di lavoro VI e recuperare la stringa di connessione per il database.

È possibile utilizzare uno dei workflow seguenti. Se si è un data scientist, è possibile distribuire direttamente un database da VMware Aria Automation. In caso contrario, richiedere una distribuzione del database all'amministratore DSM o all'utente DSM.


Workflow di distribuzione	Ruolo utente obbligatorio	Descrizione
Distribuire e recuperare la stringa di connessione di un database PostgreSQL da VMware Aria Automation.	Data scientist o tecnico DevOps	Vedere Distribuzione di un database vettore mediante un elemento catalogo self-service in VMware Aria Automation.
Distribuire e recuperare la stringa di connessione di un database PostgreSQL dalla console di VMware Data Services Manager.	L'amministratore DSM o l'utente DSM oppure un amministratore del cloud ha assegnato uno di questi ruoli	Vedere Creazione di database in VMware Data Services Manager e Connessione a un database in VMware Data Services Manager.
Distribuire e recuperare la stringa di connessione di un database PostgreSQL utilizzando il comando `kubectl`.	L'amministratore DSM o l'utente DSM o un tecnico DevOps ha assegnato uno di questi ruoli	Vedere Abilitazione dell'utilizzo self-service di VMware Data Services Manager.

Il formato della stringa di connessione del database distribuito è il seguente.

postgres://pgvector_db_admin:encoded_pgvector_db_admin_password@pgvector_db_ip_address:5432/pgvector_db_name

Attivare l'estensione pgvector nel database mediante l'utilità della riga di comando psql.
1. Connettersi al database.
```
psql -h pgvector_db_ip_address -p 5432 -d pgvector_db_name -U pgvector_db_admin -W
```
2. Attivare l'estensione pgvector.
```
pgvector_db_name=# CREATE EXTENSION vector;
```

Operazioni successive

Integrare il database nel carico di lavoro RAG. Vedere Distribuzione di Deep Learning VM con un carico di lavoro RAG e Distribuzione di un carico di lavoro RAG in un cluster TKG.

Distribuzione di un database vettore mediante un elemento catalogo self-service in VMware Aria Automation

In qualità di data scientist o tecnico DevOps, è possibile utilizzare un elemento del catalogo self-service in Automation Service Broker per distribuire un database PostgreSQL pgvector gestito da VMware Data Services Manager.

Una volta distribuita, l'istanza del database può essere utilizzata per altre distribuzioni, anche da altri membri del team, in modo che più macchine virtuali di deep learning possano condividere un singolo database vettoriale.

Procedura

Nella pagina Catalogo in Automation Service Broker, individuare la scheda Database DSM e fare clic su Richiedi.
Selezionare un progetto.
Immettere un nome per la distribuzione.
Immettere un nome per il database.

Configurare il database.

Impostazione	Valore di esempio
Classe di macchine virtuali	`small` La selezione della classe definisce la quantità di risorse di vCPU e memoria allocate al database.
Criterio di storage	`pacific-storage-policy`
Dimensione disco	`256 Gi`

Per ulteriori informazioni sulle impostazioni del database, vedere Creazione di database.

Fare clic su Invia.
Recuperare la stringa di connessione del database distribuito.
1. In Automation Service Broker fare clic su Distribuzioni > Distribuzioni.
2. Selezionare la voce di distribuzione per il database.
3. Nella scheda Topologia selezionare il modello cloud per la distribuzione del database e dal menu Azioni per il modello selezionare Ottieni stringa di connessione.