Poiché è una soluzione che include più componenti, VMware Private AI Foundation with NVIDIA può essere utilizzato per eseguire carichi di lavoro di AI generativa utilizzando l'elaborazione accelerata di NVIDIA, nonché la gestione dell'infrastruttura virtuale e la gestione del cloud di VMware Cloud Foundation.
VMware Private AI Foundation with NVIDIA fornisce una piattaforma per il provisioning dei carichi di lavoro AI negli host ESXi con GPU NVIDIA. Inoltre, l'esecuzione dei carichi di lavoro AI basati su container NVIDIA GPU Cloud (NGC) è convalidata in modo specifico da VMware.
VMware Private AI Foundation with NVIDIA supporta due casi d'uso:
- Caso d'uso di sviluppo
- Gli amministratori del cloud e i tecnici DevOps possono eseguire il provisioning dei carichi di lavoro AI, tra cui RAG (Retrieval-Augmented Generation), sotto forma di Deep Learning VM. I data scientist e gli sviluppatori di applicazioni AI possono utilizzare queste istanze di Deep Learning VM per lo sviluppo di AI. Vedere Informazioni sulle immagini di Deep Learning VM in VMware Private AI Foundation with NVIDIA.
- Caso d'uso di produzione
- Gli amministratori del cloud possono fornire ai tecnici DevOps un ambiente di VMware Private AI Foundation with NVIDIA per il provisioning di carichi di lavoro AI pronti per la produzione nei cluster TKG (Tanzu Kubernetes Grid) in vSphere IaaS control plane.
Per informazioni sui componenti che fanno parte della soluzione VMware Private AI Foundation with NVIDIA e sulla loro architettura in VMware Cloud Foundation, vedere Architettura di sistema di VMware Private AI Foundation with NVIDIA.