In qualità di amministratore del cloud, in VMware Cloud Foundation, distribuire un dominio del carico di lavoro VI con ESXi abilitato per GPU in cui data scientist, nonché tecnici MLOps e DevOps eseguiranno i carichi di lavoro di AI.

  • Il dominio del carico di lavoro VI si basa sull'immagine di vSphere Lifecycle Manager contenente il file VIB del driver Host Manager.
  • L'istanza di vCenter Server del dominio del carico di lavoro VI viene distribuita nel dominio di vCenter Single Sign-On del dominio di gestione.
Nota: Questa documentazione si basa su VMware Cloud Foundation 5.2.1. Per informazioni sulla funzionalità VMware Private AI Foundation with NVIDIA in VMware Cloud Foundation 5.2, vedere Guida di VMware Private AI Foundation with NVIDIA per VMware Cloud Foundation 5.2.

Prerequisiti

Vedere Requisiti per la distribuzione di VMware Private AI Foundation with NVIDIA.

Procedura

  1. Per un'istanza di VMware Cloud Foundation 5.2.1, accedere all'istanza di vCenter Server per il dominio di gestione all'indirizzo https://<vcenter_server_fqdn>/ui.
  2. Selezionare vSphere Client > Private AI Foundation.
  3. Se si utilizza per la prima volta il workflow di distribuzione guidata Private AI Foundation, immettere la licenza VMware Private AI Foundation with NVIDIA.
  4. Nel workflow Private AI Foundation, fare clic sulla sezione Configura dominio carico di lavoro.
  5. Creare un pool di reti in modo che gli indirizzi IP statici vengano assegnati automaticamente alle porte di vSAN, NFS, iSCSI e vMotion VMkernel degli host ESXi nel dominio del carico di lavoro.
    Vedere Gestione del pool di reti. La procedura guidata nel workflow di distribuzione guidata ha le stesse opzioni della procedura guidata analoga nell'interfaccia utente di SDDC Manager.
  6. Eseguire il commissioning degli host ESXi per aggiungerli all'inventario di SDDC Manager.
    Vedere Commissioning degli host. La procedura guidata nel workflow di distribuzione guidata ha le stesse opzioni della procedura guidata analoga nell'interfaccia utente di SDDC Manager.
  7. Distribuire il dominio del carico di lavoro VI.
    La procedura guidata nel workflow di distribuzione guidata include le stesse opzioni dell'interfaccia utente di SDDC Manager, ad eccezione delle impostazioni seguenti che sono specifiche di VMware Private AI Foundation with NVIDIA:
    • Unire il dominio del carico di lavoro al dominio di gestione di vCenter Single Sign-On (SSO).
    • Per la gestione del ciclo di vita del cluster, selezionare Gestisci questo cluster utilizzando immagini vLCM, quindi selezionare l'immagine di vSphere Lifecycle Manager con il file VIB del driver host di NVIDIA.
    • Utilizzare solo la rete basata su NSX.
    • Selezionare gli host il cui stato di NVIDIA vGPU è Pronto.
    • Selezionare Aggiungi licenza in seguito e assegnare la licenza di VMware Cloud Foundation al dominio del carico di lavoro VI utilizzando l'interfaccia utente di SDDC Manager o vSphere Client. Per lo storage vSAN, è inoltre necessario aggiungere una chiave di licenza di VMware vSAN.

    Per ulteriori informazioni sulla creazione di un dominio del carico di lavoro VI, vedere Distribuzione di un dominio del carico di lavoro VI tramite l'interfaccia utente di SDDC Manager.

  8. In vSphere Client, nell'istanza di vCenter Server per il dominio del carico di lavoro VI, impostare l'impostazione avanzata vgpu.hotmigrate.enabled su true in modo che le macchine virtuali con vGPU possano essere migrate tramite vSphere vMotion.

risultati

Dopo aver creato il dominio del carico di lavoro VI, l'istanza di vCenter Server correlata viene visualizzata nell'inventario di vSphere Client.