Sie können Arbeitslasten für künstliche Intelligenz und maschinelles Lernen auf Clustern bereitstellen, die von Tanzu Kubernetes Grid bereitgestellt werden. Die Bereitstellung von Arbeitslasten für künstliche Intelligenz und maschinelles Lernen erfordert die Ersteinrichtung durch Dienstanbieter sowie die Konfiguration durch Organisationsadministratoren und Mandantenbenutzer im Clustererstellungs-Workflow.

Um die VMware Cloud Director-Umgebung für die Bereitstellung von Clustern vorzubereiten, die Arbeitslasten für künstliche Intelligenz und maschinelles Lernen verarbeiten können, müssen Dienstanbieter eine vGPU-Richtlinie erstellen und einem Organisations-vDC eine vGPU-Richtlinie hinzufügen. Anweisungen zum Ausführen dieser Aufgaben finden Sie unter Erstellen und Verwalten von vGPU-Richtlinien. Sobald Dienstanbieter diese Schritte ausgeführt haben, können Mandantenbenutzer Arbeitslasten für künstliche Intelligenz und maschinelles Lernen in ihren Tanzu Kubernetes Grid-Clustern bereitstellen.

Informationen zum Erstellen von Tanzu Kubernetes Grid-Clustern mit vGPU-Funktionalität finden Sie unter Erstellen eines Tanzu Kubernetes Grid-Clusters. Wenn Sie die Versionen Tanzu Kubernetes Grid 2.1 und höher verwenden, die mit VMware Cloud Director Container Service Extension kompatibel sind, gelten die folgenden Abschnitte nicht, und Sie können mit dem Workflow zur Clustererstellung fortfahren.

Hinweis: Die folgenden Abschnitte gelten nur für Tanzu Kubernetes Grid 1.6.1, das von VMware nicht mehr unterstützt wird. Um die vGPU-Funktionalität nutzen zu können, verwenden Sie Versionen Tanzu Kubernetes Grid 2.1 und höher, die mit VMware Cloud Director Container Service Extension kompatibel sind.

Einschränkungen der BIOS-Firmware

Tanzu Kubernetes Grid-Vorlagen für VMware Cloud Director Container Service Extension werden mit BIOS-Firmware erstellt und es ist nicht möglich, diese Firmwarekonfiguration zu ändern. Der BAR1-Arbeitsspeicher auf dieser Firmware darf 256 MB nicht überschreiten. NVIDIA Grid-Karten mit mehr als 256 MB BAR1-Arbeitsspeicher erfordern EFI-Firmware. Weitere Informationen zu Firmwareeinschränkungen finden Sie unter VMware vSphere: NVIDIA Virtual GPU Software Documentation.

Erstellen eines benutzerdefinierten Images mit EFI-Firmware

Um die Einschränkungen der BIOS-Firmware zu umgehen, die in Tanzu Kubernetes Grid-Vorlagen vorhanden sind, können Sie ein benutzerdefiniertes Image mit EFI-Firmware in vSphere erstellen. Anweisungen finden Sie in den Abschnitten unter Benutzerdefinierte Linux-Systemimages in der archivierten Dokumentation zu Tanzu Kubernetes Grid 1.6. Informationen zum Zugriff auf die archivierte Dokumentation finden Sie in der Dokumentation zu VMware Tanzu Kubernetes Grid > Nicht unterstützte Versionen.

Um benutzerdefinierte Linux-Systemimages mit Tanzu Kubernetes Grid 1.6 erfolgreich auf einer GPU-Vorlage zu erstellen, müssen Sie beim Erstellungsvorgang auch die folgenden Eingaben einschließen:
Eingaben Beschreibung
customizations.json Zum Erstellen eines Image für einen vGPU-fähigen Cluster für vSphere erstellen Sie eine Datei mit dem Namen customizations.json und fügen Folgendes hinzu:
{
"vmx_version": "17"
}
metadata.json VERSION muss mit einer eingerichteten Version einer Tanzu Kubernetes Grid-Vorlage übereinstimmen, da das UI-Plug-In Kubernetes Container Clusters die OVA-Datei nicht erkennt, wenn sich die Versionsnummer von der Versionsnummer der Vorlage unterscheidet.
Im folgenden Beispiel wird die empfohlene Dateibenennungskonvention beschrieben:
Vorlage und Version Metadaten
Kubernetes-Vorlage für TKG 1.6 ubuntu-2004-kube-v1.23.10+vmware.1-tkg.2-b53d41690f8742e7388f2c553fd9a181.ova
Version v1.23.10+vmware.1-tkg.2-b53d41690f8742e7388f2c553fd9a181
build-node-ova-vsphere-ubuntu-2004-efi Verwenden Sie diesen Befehl, um den Image Builder für vGPU-fähige Cluster auszuführen. Dieser Befehl legt fest, dass das benutzerdefinierte Image mit EFI-Firmware erstellt wird.
Dienstanbieter müssen einen neuen Katalog in VMware Cloud Director für vGPU-Vorlagen einrichten und die Vorlagen in diesen Katalog hochladen. Wenn ein Benutzer einen vGPU-fähigen Cluster erstellen möchte, kann er diese Vorlage im Clustererstellungsprozess auswählen und diese nutzt dann die vGPUs in dem betreffenden Cluster. Weitere Informationen finden Sie unter Erstellen von Katalogen und Hochladen von OVA-Dateien.