Se si prevede di utilizzare Retrieval-Augmented Generation (RAG) con VMware Private AI Foundation with NVIDIA, configurare un database PostgreSQL con pgvector utilizzando VMware Data Services Manager.
È possibile creare il database manualmente oppure creare un catalogo self-service in VMware Aria Automation che possa essere utilizzato dagli sviluppatori e dai tecnici DevOps.
Prerequisiti
- Verificare che VMware Private AI Foundation with NVIDIA sia disponibile per il dominio del carico di lavoro VI. Vedere Distribuzione di VMware Private AI Foundation with NVIDIA.
- Installare l'utilità della riga di comando psql dal sito Web di PostgreSQL.
Procedura
Distribuzione di un database vettore mediante un elemento catalogo self-service in VMware Aria Automation
I data scientist e i tecnici DevOps possono utilizzare VMware Aria Automation per eseguire il provisioning di un database PostgreSQL con estensione pgvector nel dominio del carico di lavoro VI dedicato per i carichi di lavoro AI.
Creazione di un elemento catalogo di un database vettore in VMware Aria Automation
In qualità di amministratore del cloud, aggiungere un elemento catalogo per il provisioning dei database di VMware Data Services Manager in Service Broker di VMware Aria Automation.
Prerequisiti
- Verificare di aver distribuito VMware Data Services Manager 2.0.2.
- Specificare una macchina in cui sia installato Python 3.10 che abbia accesso alle istanze di VMware Data Services Manager e VMware Aria Automation.
Procedura
risultati
Distribuzione di un database vettore mediante un elemento catalogo self-service in VMware Aria Automation
In VMware Private AI Foundation with NVIDIA in qualità di data scientist o tecnico DevOps, è possibile distribuire un database vettore da VMware Aria Automation utilizzando un elemento catalogo self-service in Automation Service Broker.
Prerequisiti
Verificare con l'amministratore del cloud che i prerequisiti per la creazione di un database PostgreSQL siano soddisfatti. Vedere Creazione di database.