Distribuzione di una macchina virtuale di deep learning direttamente in un cluster vSphere in VMware Private AI Foundation with NVIDIA

Per testare rapidamente i modelli di macchine virtuali di deep learning in VMware Private AI Foundation with NVIDIA, è possibile distribuire una macchina virtuale di deep learning direttamente in un cluster vSphere utilizzando vSphere Client.

Prerequisiti

Verificare che siano soddisfatti i prerequisiti seguenti per l'infrastruttura pronta per AI.

VMware Private AI Foundation with NVIDIA deve essere distribuito e configurato. Vedere Distribuzione di VMware Private AI Foundation with NVIDIA.
È disponibile una libreria di contenuti con macchine virtuali di deep learning. Vedere Creazione di una libreria di contenuti con immagini di macchine virtuali di deep learning per VMware Private AI Foundation with NVIDIA.

Procedura

Accedere all'istanza di vCenter Server per il dominio del carico di lavoro VI.
Dal menu Home di vSphere Client selezionare Librerie di contenuti.
Distribuire una macchina virtuale di deep learning dalla libreria di contenuti.
1. Passare all'immagine della macchina virtuale di deep learning nella libreria di contenuti.
2. Fare clic con il pulsante destro del mouse su un modello OVF e scegliere Nuova macchina virtuale da questo modello.
3. Eseguire la procedura guidata per immettere un nome e selezionare una cartella della macchina virtuale, quindi selezionare un cluster abilitato per la GPU nel dominio del carico di lavoro VI.
4. Selezionare un datastore e una rete nel commutatore distribuito per il cluster.
5. Nella pagina Personalizza modello immettere le proprietà della macchina virtuale personalizzata necessarie per configurare la funzionalità AI.
  Vedere Proprietà OVF delle macchine virtuali di deep learning.
6. Fare clic su Fine
Dopo aver creato la macchina virtuale di deep learning, nelle impostazioni della macchina virtuale, assegnare a tale macchina virtuale un dispositivo NVIDIA vGPU.
Vedere Aggiunta di NVIDIA GRID vGPU in una macchina virtuale.
Per una macchina virtuale di deep learning che esegue NVIDIA RAG, selezionare il profilo vGPU completo per la modalità di slicing temporale o un profilo MIG. Ad esempio, per NVIDIA A100 a 40 GB in modalità di slicing temporale vGPU, selezionare nvidia_a100-40c.
Per una macchina virtuale di deep learning che esegue NVIDIA RAG, nella scheda Parametri avanzati delle impostazioni della macchina virtuale, impostare il parametro pciPassthru<vgpu-id>.cfg.enable_uvm su 1.

dove <vgpu-id> identifica la vGPU assegnata alla macchina virtuale. Ad esempio, se alla macchina virtuale sono assegnate due vGPU, impostare pciPassthru0.cfg.parameter=1 e pciPassthru1.cfg.parameter = 1.
Accendere la macchina virtuale di deep learning.

risultati

Il driver guest della vGPU e il carico di lavoro di deep learning specificato vengono installati la prima volta che si avvia la macchina virtuale di deep learning.

È possibile esaminare i registri o aprire l'istanza di JupyterLab fornita con alcune delle immagini. È possibile condividere i dettagli di accesso con i data scientist dell'organizzazione. Vedere Carichi di lavoro di deep learning in VMware Private AI Foundation with NVIDIA.

Operazioni successive

Connettersi alla macchina virtuale di deep learning tramite SSH e verificare che tutti i componenti siano installati e in esecuzione come previsto.
Inviare i dettagli di accesso ai data scientist.