In qualità di data scientist, è possibile distribuire una workstation RAG abilitata per GPU con un database PostgreSQL pgvector gestito da VMware Data Services Manager (DSM) dal catalogo self-service di Automation Service Broker.
Quando si richiede Workstation RAG AI con DSM nel catalogo, è possibile utilizzare l'istanza di un database esistente o crearne una nuova. Durante la distribuzione, viene eseguito il provisioning di Deep Learning VM e della macchina virtuale del database a cui si connette. Il provisioning del database viene eseguito all'esterno della distribuzione di RAG.
- Se si sceglie l'opzione Database esistente, si utilizza un database pre-distribuito, che può essere un database esterno o un database il cui provisioning è stato eseguito da un'altra distribuzione di Workstation RAG AI con DSM. Durante la distribuzione, non viene eseguito il provisioning di una nuova istanza del database.
- Se non è presente alcun database che può essere utilizzato o si desidera usare un database privato per un caso d'uso specifico, scegliere l'opzione Nuovo database.
Procedura
- Nella pagina Catalogo di Automation Service Broker, individuare la scheda Workstation RAG AI con DSM e fare clic su Richiedi.
- Selezionare un progetto.
- Immettere un nome e una descrizione per la distribuzione.
- Configurare i parametri della workstation RAG.
Impostazione Valore di esempio Classe di macchine virtuali vgpu-1xa100-40c Specifica minima della classe di macchine virtuali:- CPU: 10 vCPU
- RAM CPU: 64 GB
- GPU: 2xH100
- Memoria GPU: 50 GB
Dimensioni disco dati 32 Gi Selezionare dimensioni del disco comprese tra 20 GB e 1 TB.
Password utente Immettere una password per l'utente predefinito. È possibile che venga richiesto di reimpostare la password al primo accesso. Chiave pubblica SSH Questa impostazione è opzionale. - Configurare il database della workstation.
Impostazione Valore di esempio Istanza database Database esistente Stringa di connessione Specificare la stringa di connessione DSM dalla panoramica della distribuzione DSM.
- Installare le personalizzazioni del software.
- (Facoltativo) Se si desidera installare un cloud-init personalizzato oltre al cloud-init definito per il bundle software RAG, selezionare la casella di controllo e incollare il contenuto del pacchetto di configurazione.
VMware Aria Automation unisce il cloud-init del bundle del software RAG e il cloud-init personalizzato.
- Specificare la chiave di accesso al portale NVIDIA NGC.
- (Facoltativo) Esporre le metriche di NVIDIA Data Center GPU Manager (DCGM) tramite un bilanciamento del carico.
NVIDIA DCGM gestisce e monitora le GPU negli ambienti di data center.
- Immettere le credenziali di Docker Hub.
- (Facoltativo) Se si desidera installare un cloud-init personalizzato oltre al cloud-init definito per il bundle software RAG, selezionare la casella di controllo e incollare il contenuto del pacchetto di configurazione.
- Fare clic su Invia.