Um die Deep Learning-VM-Vorlagen in VMware Private AI Foundation with NVIDIA schnell zu testen, können Sie mithilfe des vSphere Client eine Deep Learning-VM direkt auf einem vSphere-Cluster bereitstellen.
Voraussetzungen
Stellen Sie sicher, dass die folgenden Voraussetzungen für die KI-fähige Infrastruktur erfüllt sind.
Prozedur
- Melden Sie sich bei der vCenter Server-Instanz für die VI-Arbeitslastdomäne an.
- Wählen Sie im vSphere Client-Startmenü die Option Inhaltsbibliotheken aus.
- Stellen Sie eine Deep Learning-VM aus der Inhaltsbibliothek bereit.
- Navigieren Sie zum Deep Learning-VM-Image in der Inhaltsbibliothek.
- Klicken Sie mit der rechten Maustaste auf eine OVF-Vorlage und wählen Sie Neue VM über diese Vorlage aus.
- Folgen Sie dem Assistenten, um einen Namen einzugeben und einen VM-Ordner auszuwählen. Wählen Sie anschließend einen GPU-fähigen Cluster in der VI-Arbeitslastdomäne aus.
- Wählen Sie einen Datenspeicher und ein Netzwerk auf dem Distributed Switch für den Cluster aus.
- Geben Sie auf der Seite Anpassungsvorlage die benutzerdefinierten VM-Eigenschaften ein, die zum Einrichten der KI-Funktionen erforderlich sind.
- Klicken Sie auf Beenden.
- Nachdem die Deep Learning-VM erstellt wurde, weisen Sie ihr in den Einstellungen der virtuellen Maschine ein NVIDIA vGPU-Gerät zu.
Weitere Informationen finden Sie unter
Hinzufügen einer NVIDIA GRID vGPU zu einer virtuellen Maschine.
Wählen Sie für eine Deep Learning-VM, auf der ein NVIDIA RAG ausgeführt wird, das vGPU-Profil in voller Größe für den Zeitaufteilungsmodus oder ein MIG-Profil aus. Wählen Sie beispielsweise für NVIDIA A100 40 GB im vGPU-Zeitaufteilungsmodus die Option nvidia_a100-40c aus.
- Legen Sie für eine Deep Learning-VM, auf der ein NVIDIA RAG ausgeführt wird, auf der Registerkarte Erweitere Parameter der Einstellungen der virtuellen Maschine den Parameter
pciPassthru<vgpu-id>.cfg.enable_uvm
auf 1 fest.
wobei <vgpu-id>
die der virtuellen Maschine zugewiesene vGPU identifiziert. Wenn der virtuellen Maschine beispielsweise zwei vGPUs zugewiesen sind, legen Sie pciPassthru0.cfg.parameter=1
und pciPassthru1.cfg.parameter = 1
fest.
- Schalten Sie die Deep Learning-VM ein.
Ergebnisse
Der vGPU-Gasttreiber und die angegebene Deep Learning-Arbeitslast werden beim ersten Start der Deep Learning-VM installiert.
Sie können die Protokolle untersuchen oder die JupyterLab-Instanz öffnen, die in einigen der Images enthalten ist. Sie können Zugriffsdetails für Datenwissenschaftler in Ihrer Organisation freigeben. Weitere Informationen finden Sie unter Deep Learning-Arbeitslasten in VMware Private AI Foundation with NVIDIA.
Nächste Maßnahme
- Stellen Sie über SSH eine Verbindung zur Deep Learning-VM her und stellen Sie sicher, dass alle Komponenten installiert sind und wie erwartet ausgeführt werden.
- Senden Sie die Zugriffsdetails an Ihre Datenwissenschaftler.