Um DevOps-Ingenieuren und Datenwissenschaftlern die Möglichkeit zu geben, Deep Learning-VMs oder TKG-Cluster mit KI-Containerarbeitslasten bereitzustellen, müssen Sie einen Supervisor auf einem GPU-fähigen Cluster in einer VI-Arbeitslastdomäne bereitstellen und vGPU-fähige VM-Klassen erstellen.

Hinweis: Diese Dokumentation basiert auf VMware Cloud Foundation 5.2.1. Informationen zur Funktion VMware Private AI Foundation with NVIDIA in VMware Cloud Foundation 5.2 finden Sie im Handbuch zu VMware Private AI Foundation with NVIDIA für VMware Cloud Foundation 5.2.

Voraussetzungen

Prozedur

  1. Melden Sie sich für eine VMware Cloud Foundation 5.2.1-Instanz bei der vCenter Server-Instanz für die Arbeitslastdomäne unter https://<vcenter_server_fqdn>/ui als [email protected] an.
  2. Klicken Sie im Seitenbereich des vSphere Client auf Private AI Foundation.
  3. Klicken Sie im Private AI Foundation-Workflow auf den Abschnitt Arbeitslastdomäne einrichten.
  4. Stellen Sie einen NSX Edge-Cluster in der VI-Arbeitslastdomäne bereit.
    Weitere Informationen finden Sie unter Bereitstellen eines NSX Edge-Clusters. Der Assistent im Workflow für geführte Bereitstellungen verfügt über dieselben Optionen wie der analoge Assistent in der SDDC Manager-Benutzeroberfläche.
    SDDC Manager stellt auch ein Tier-0-Gateway bereit, das Sie bei der Supervisor-Bereitstellung angeben. Das Tier-0-Gateway befindet sich im Aktiv/Aktiv-Hochverfügbarkeitsmodus.
  5. Klicken Sie im Private AI Foundation-Workflow auf den Abschnitt Arbeitslastverwaltung einrichten.
  6. Konfigurieren Sie eine Speicherrichtlinie für den Supervisor.
    Weitere Informationen finden Sie unter Erstellen von Speicherrichtlinien für vSphere with Tanzu. Der Assistent zum Erstellen einer VM-Speicherrichtlinie im Workflow für geführte Bereitstellungen ist identisch mit dem analogen Assistenten im Bereich Richtlinien und Profile des vSphere Client.
  7. Aktivieren Sie die Arbeitslastverwaltung, indem Sie einen Supervisor im Standardcluster mit GPU-fähigen ESXi-Hosts in der VI-Arbeitslastdomäne bereitstellen.
    Sie verwenden die Zuweisung statischer IP-Adressen für das Verwaltungsnetzwerk. Weisen Sie das Supervisor-VM-Verwaltungsnetzwerk auf dem vSphere Distributed Switch für den Cluster zu.

    Konfigurieren Sie das Arbeitslastnetzwerk wie folgt:

    • Verwenden Sie die vSphere Distributed Switch für den Cluster oder erstellen Sie einen speziell für KI-Arbeitslasten.
    • Konfigurieren Sie den Supervisor mit dem NSX Edge-Cluster und dem Tier-0-Gateway, das Sie mithilfe von SDDC Manager bereitgestellt haben.
    • Legen Sie die restlichen Werte entsprechend Ihrer Einrichtung fest.

    Verwenden Sie die von Ihnen erstellte Speicherrichtlinie.

    Weitere Informationen zum Bereitstellen eines Supervisors in einem einzelnen Cluster finden Sie unter Aktivieren der Arbeitslastverwaltung und Bereitstellen eines Supervisors für eine Zone mit NSX-Netzwerk. Der Assistent im Workflow für geführte Bereitstellungen entspricht dem analogen Assistenten im Bereich Arbeitslastverwaltung des vSphere Client.