Puede implementar cargas de trabajo de inteligencia artificial y aprendizaje automático en clústeres aprovisionados por Tanzu Kubernetes Grid. Para implementar cargas de trabajo de inteligencia artificial y aprendizaje automático es necesario que se lleven a cabo en el flujo de trabajo de creación de clústeres algunas tareas de configuración inicial por parte de los proveedores de servicios, además de algunas configuraciones por parte de los administradores de organización y los usuarios de tenant.

Para preparar el entorno de VMware Cloud Director con el fin de aprovisionar clústeres que puedan controlar cargas de trabajo de inteligencia artificial y aprendizaje automático, los proveedores de servicios deben crear una directiva de vGPU y agregar una directiva de vGPU a un VDC de organización. Para obtener instrucciones sobre cómo realizar estas tareas, consulte Crear y administrar políticas de vGPU. Una vez que los proveedores de servicios realicen estos pasos, los usuarios de tenant podrán implementar cargas de trabajo de inteligencia artificial y aprendizaje automático en sus clústeres de Tanzu Kubernetes Grid. Para crear clústeres de Tanzu Kubernetes Grid con la funcionalidad vGPU, consulte Crear un clúster de Tanzu Kubernetes Grid.

Nota: La compatibilidad con vGPU solo se extiende a Tanzu Kubernetes Grid 1.5.

Limitaciones del firmware del BIOS

Las plantillas de Tanzu Kubernetes Grid para VMware Cloud Director Container Service Extension se compilan con el firmware de BIOS y no es posible cambiar esta configuración de firmware. La memoria de BAR1 en este firmware no puede superar los 256 MB. Las tarjetas NVIDIA GRID con más de 256 MB de memoria BAR1 requieren el firmware EFI. Para obtener más información sobre las limitaciones del firmware, consulte VMware vSphere: Documentación del software de GPU virtual NVIDIA.

Crear una imagen personalizada con firmware EFI

Para superar las limitaciones del firmware de BIOS que existen en las plantillas de Tanzu Kubernetes Grid, es posible crear una imagen personalizada con firmware EFI en vSphere. Para obtener instrucciones, consulte Imágenes de máquinas personalizadas de Linux con Tanzu Kubernetes Grid 1.5.

Para crear imágenes de máquinas personalizadas de Linux con Tanzu Kubernetes Grid 1.5 correctamente en una plantilla de GPU, también debe incluir las siguientes entradas al compilar la imagen personalizada:
Entradas Descripción
customizations.json Para compilar una imagen para un clúster habilitado para vGPU para vSphere, cree un archivo denominado customizations.json y agregue lo siguiente:
{
"vmx_version": "17"
}
metadata.json VERSION debe coincidir exactamente con una versión establecida de una plantilla de Tanzu Kubernetes Grid, ya que el complemento de interfaz de usuario de Kubernetes Container Clusters no reconoce el archivo OVA si el número de versión es diferente al de la plantilla.
En el siguiente ejemplo se describe la convención de nomenclatura de archivos recomendada:
Plantilla y versión Metadatos
Plantilla de Kubernetes para TKG 1.5.4 ubuntu-2004-kube-v1.22.9+vmware.1-tkg.1-2182cbabee08edf480ee9bc5866d6933.ova
Versión
v1.22.9+vmware.1-tkg.1-2182cbabee08edf480ee9bc5866d6933
build-node-ova-vsphere-ubuntu-2004-efi Utilice este comando para ejecutar Image Builder para clústeres habilitados para vGPU. Este comando especifica para compilar la imagen personalizada con firmware EFI.
Los proveedores de servicios deben configurar un catálogo nuevo en VMware Cloud Director para las plantillas de vGPU y cargar las plantillas en este catálogo. Cuando un usuario desee crear un clúster habilitado para vGPU, puede seleccionar esta plantilla en el proceso de creación del clúster y se beneficiará de las vGPU de ese clúster. Para obtener más información, consulte Crear catálogos y cargar archivos OVA.