Direktes Bereitstellen einer Deep Learning-VM auf einem vSphere-Cluster in VMware Private AI Foundation with NVIDIA

Um die Deep Learning-VM-Vorlagen in VMware Private AI Foundation with NVIDIA schnell zu testen, können Sie mithilfe des vSphere Client eine Deep Learning-VM direkt auf einem vSphere-Cluster bereitstellen.

Voraussetzungen

Stellen Sie sicher, dass die folgenden Voraussetzungen für die KI-fähige Infrastruktur erfüllt sind.

VMware Private AI Foundation with NVIDIA wird bereitgestellt und konfiguriert. Weitere Informationen finden Sie unter Bereitstellen von VMware Private AI Foundation with NVIDIA.
Eine Inhaltsbibliothek mit Deep Learning-VMs ist verfügbar. Weitere Informationen finden Sie unter Erstellen einer Inhaltsbibliothek mit Deep Learning-VM-Images für VMware Private AI Foundation with NVIDIA.

Prozedur

Melden Sie sich bei der vCenter Server-Instanz für die VI-Arbeitslastdomäne an.
Wählen Sie im vSphere Client-Startmenü die Option Inhaltsbibliotheken aus.
Stellen Sie eine Deep Learning-VM aus der Inhaltsbibliothek bereit.
1. Navigieren Sie zum Deep Learning-VM-Image in der Inhaltsbibliothek.
2. Klicken Sie mit der rechten Maustaste auf eine OVF-Vorlage und wählen Sie Neue VM über diese Vorlage aus.
3. Folgen Sie dem Assistenten, um einen Namen einzugeben und einen VM-Ordner auszuwählen. Wählen Sie anschließend einen GPU-fähigen Cluster in der VI-Arbeitslastdomäne aus.
4. Wählen Sie einen Datenspeicher und ein Netzwerk auf dem Distributed Switch für den Cluster aus.
5. Geben Sie auf der Seite Anpassungsvorlage die benutzerdefinierten VM-Eigenschaften ein, die zum Einrichten der KI-Funktionen erforderlich sind.
  Weitere Informationen finden Sie unter OVF-Eigenschaften von Deep Learning-VMs.
6. Klicken Sie auf Beenden.
Nachdem die Deep Learning-VM erstellt wurde, weisen Sie ihr in den Einstellungen der virtuellen Maschine ein NVIDIA vGPU-Gerät zu.
Weitere Informationen finden Sie unter Hinzufügen einer NVIDIA GRID vGPU zu einer virtuellen Maschine.
Wählen Sie für eine Deep Learning-VM, auf der ein NVIDIA RAG ausgeführt wird, das vGPU-Profil in voller Größe für den Zeitaufteilungsmodus oder ein MIG-Profil aus. Wählen Sie beispielsweise für NVIDIA A100 40 GB im vGPU-Zeitaufteilungsmodus die Option nvidia_a100-40c aus.
Legen Sie für eine Deep Learning-VM, auf der ein NVIDIA RAG ausgeführt wird, auf der Registerkarte Erweitere Parameter der Einstellungen der virtuellen Maschine den Parameter pciPassthru<vgpu-id>.cfg.enable_uvm auf 1 fest.

wobei <vgpu-id> die der virtuellen Maschine zugewiesene vGPU identifiziert. Wenn der virtuellen Maschine beispielsweise zwei vGPUs zugewiesen sind, legen Sie pciPassthru0.cfg.parameter=1 und pciPassthru1.cfg.parameter = 1 fest.
Schalten Sie die Deep Learning-VM ein.

Ergebnisse

Der vGPU-Gasttreiber und die angegebene Deep Learning-Arbeitslast werden beim ersten Start der Deep Learning-VM installiert.

Sie können die Protokolle untersuchen oder die JupyterLab-Instanz öffnen, die in einigen der Images enthalten ist. Sie können Zugriffsdetails für Datenwissenschaftler in Ihrer Organisation freigeben. Weitere Informationen finden Sie unter Deep Learning-Arbeitslasten in VMware Private AI Foundation with NVIDIA.

Nächste Maßnahme

Stellen Sie über SSH eine Verbindung zur Deep Learning-VM her und stellen Sie sicher, dass alle Komponenten installiert sind und wie erwartet ausgeführt werden.
Senden Sie die Zugriffsdetails an Ihre Datenwissenschaftler.