Sie können Arbeitslasten für künstliche Intelligenz und maschinelles Lernen auf Clustern bereitstellen, die von Tanzu Kubernetes Grid bereitgestellt werden. Die Bereitstellung von Arbeitslasten für künstliche Intelligenz und maschinelles Lernen erfordert die Ersteinrichtung durch Dienstanbieter sowie die Konfiguration durch Organisationsadministratoren und Mandantenbenutzer im Clustererstellungs-Workflow.

Um die VMware Cloud Director-Umgebung für die Bereitstellung von Clustern vorzubereiten, die Arbeitslasten für künstliche Intelligenz und maschinelles Lernen verarbeiten können, müssen Dienstanbieter eine vGPU-Richtlinie erstellen und einem Organisations-vDC eine vGPU-Richtlinie hinzufügen. Anweisungen zum Ausführen dieser Aufgaben finden Sie unter Erstellen und Verwalten von vGPU-Richtlinien. Sobald Dienstanbieter diese Schritte ausgeführt haben, können Mandantenbenutzer Arbeitslasten für künstliche Intelligenz und maschinelles Lernen in ihren Tanzu Kubernetes Grid-Clustern bereitstellen. Informationen zum Erstellen von Tanzu Kubernetes Grid-Clustern mit vGPU-Funktionalität finden Sie unter Erstellen eines Tanzu Kubernetes Grid-Clusters.

Hinweis: Die vGPU-Unterstützung wird nur auf Tanzu Kubernetes Grid 1.5 erweitert.

Einschränkungen der BIOS-Firmware

Tanzu Kubernetes Grid-Vorlagen für VMware Cloud Director Container Service Extension werden mit BIOS-Firmware erstellt und es ist nicht möglich, diese Firmwarekonfiguration zu ändern. Der BAR1-Arbeitsspeicher auf dieser Firmware darf 256 MB nicht überschreiten. NVIDIA Grid-Karten mit mehr als 256 MB BAR1-Arbeitsspeicher erfordern EFI-Firmware. Weitere Informationen zu Firmwareeinschränkungen finden Sie unter VMware vSphere: NVIDIA Virtual GPU Software Documentation.

Erstellen eines benutzerdefinierten Images mit EFI-Firmware

Um die Einschränkungen der BIOS-Firmware zu umgehen, die in Tanzu Kubernetes Grid-Vorlagen vorhanden sind, können Sie ein benutzerdefiniertes Image mit EFI-Firmware in vSphere erstellen. Anweisungen finden Sie unter Benutzerdefinierte Linux-Systemimages mit Tanzu Kubernetes Grid 1.5.

Um benutzerdefinierte Linux-Systemimages mit Tanzu Kubernetes Grid 1.5 erfolgreich auf einer GPU-Vorlage zu erstellen, müssen Sie während des Erstellungsvorgangs auch die folgenden Eingaben einschließen:
Eingaben Beschreibung
customizations.json Zum Erstellen eines Image für einen vGPU-fähigen Cluster für vSphere erstellen Sie eine Datei mit dem Namen customizations.json und fügen Folgendes hinzu:
{
"vmx_version": "17"
}
metadata.json VERSION muss mit einer eingerichteten Version einer Tanzu Kubernetes Grid-Vorlage übereinstimmen, da das UI-Plug-In Kubernetes Container Clusters die OVA-Datei nicht erkennt, wenn sich die Versionsnummer von der Versionsnummer der Vorlage unterscheidet.
Im folgenden Beispiel wird die empfohlene Dateibenennungskonvention beschrieben:
Vorlage und Version Metadaten
Kubernetes-Vorlage für TKG 1.5.4 ubuntu-2004-kube-v1.22.9+vmware.1-tkg.1-2182cbabee08edf480ee9bc5866d6933.ova
Version
v1.22.9+vmware.1-tkg.1-2182cbabee08edf480ee9bc5866d6933
build-node-ova-vsphere-ubuntu-2004-efi Verwenden Sie diesen Befehl, um den Image Builder für vGPU-fähige Cluster auszuführen. Dieser Befehl legt fest, dass das benutzerdefinierte Image mit EFI-Firmware erstellt wird.
Dienstanbieter müssen einen neuen Katalog in VMware Cloud Director für vGPU-Vorlagen einrichten und die Vorlagen in diesen Katalog hochladen. Wenn ein Benutzer einen vGPU-fähigen Cluster erstellen möchte, kann er diese Vorlage im Clustererstellungsprozess auswählen und diese nutzt dann die vGPUs in dem betreffenden Cluster. Weitere Informationen finden Sie unter Erstellen von Katalogen und Hochladen von OVA-Dateien.