Um die Deep Learning-VM-Vorlagen in VMware Private AI Foundation with NVIDIA schnell zu testen, können Sie mithilfe des vSphere Client eine Deep Learning-VM direkt auf einem vSphere-Cluster bereitstellen.

Voraussetzungen

Stellen Sie sicher, dass die folgenden Voraussetzungen für die KI-fähige Infrastruktur erfüllt sind.

Prozedur

  1. Melden Sie sich bei der vCenter Server-Instanz für die VI-Arbeitslastdomäne an.
  2. Wählen Sie im vSphere Client-Startmenü die Option Inhaltsbibliotheken aus.
  3. Stellen Sie eine Deep Learning-VM aus der Inhaltsbibliothek bereit.
    1. Navigieren Sie zum Deep Learning-VM-Image in der Inhaltsbibliothek.
    2. Klicken Sie mit der rechten Maustaste auf eine OVF-Vorlage und wählen Sie Neue VM über diese Vorlage aus.
    3. Folgen Sie dem Assistenten, um einen Namen einzugeben und einen VM-Ordner auszuwählen. Wählen Sie anschließend einen GPU-fähigen Cluster in der VI-Arbeitslastdomäne aus.
    4. Wählen Sie einen Datenspeicher und ein Netzwerk auf dem Distributed Switch für den Cluster aus.
    5. Geben Sie auf der Seite Anpassungsvorlage die benutzerdefinierten VM-Eigenschaften ein, die zum Einrichten der KI-Funktionen erforderlich sind.
      Weitere Informationen finden Sie unter OVF-Eigenschaften von Deep Learning-VMs.
    6. Klicken Sie auf Beenden.
  4. Nachdem die Deep Learning-VM erstellt wurde, weisen Sie ihr in den Einstellungen der virtuellen Maschine ein NVIDIA vGPU-Gerät zu.
    Weitere Informationen finden Sie unter Hinzufügen einer NVIDIA GRID vGPU zu einer virtuellen Maschine.

    Wählen Sie für eine Deep Learning-VM, auf der ein NVIDIA RAG ausgeführt wird, das vGPU-Profil in voller Größe für den Zeitaufteilungsmodus oder ein MIG-Profil aus. Wählen Sie beispielsweise für NVIDIA A100 40 GB im vGPU-Zeitaufteilungsmodus die Option nvidia_a100-40c aus.

  5. Legen Sie für eine Deep Learning-VM, auf der ein NVIDIA RAG ausgeführt wird, auf der Registerkarte Erweitere Parameter der Einstellungen der virtuellen Maschine den Parameter pciPassthru<vgpu-id>.cfg.enable_uvm auf 1 fest.

    wobei <vgpu-id> die der virtuellen Maschine zugewiesene vGPU identifiziert. Wenn der virtuellen Maschine beispielsweise zwei vGPUs zugewiesen sind, legen Sie pciPassthru0.cfg.parameter=1 und pciPassthru1.cfg.parameter = 1 fest.

  6. Schalten Sie die Deep Learning-VM ein.

Ergebnisse

Der vGPU-Gasttreiber und die angegebene Deep Learning-Arbeitslast werden beim ersten Start der Deep Learning-VM installiert.

Sie können die Protokolle untersuchen oder die JupyterLab-Instanz öffnen, die in einigen der Images enthalten ist. Sie können Zugriffsdetails für Datenwissenschaftler in Ihrer Organisation freigeben. Weitere Informationen finden Sie unter Deep Learning-Arbeitslasten in VMware Private AI Foundation with NVIDIA.

Nächste Maßnahme

  • Stellen Sie über SSH eine Verbindung zur Deep Learning-VM her und stellen Sie sicher, dass alle Komponenten installiert sind und wie erwartet ausgeführt werden.
  • Senden Sie die Zugriffsdetails an Ihre Datenwissenschaftler.