Puede implementar cargas de trabajo de inteligencia artificial y aprendizaje automático en clústeres aprovisionados por Tanzu Kubernetes Grid. Para implementar cargas de trabajo de inteligencia artificial y aprendizaje automático es necesario que se lleven a cabo en el flujo de trabajo de creación de clústeres algunas tareas de configuración inicial por parte de los proveedores de servicios, además de algunas configuraciones por parte de los administradores de organización y los usuarios de tenant.

Para preparar el entorno de VMware Cloud Director con el fin de aprovisionar clústeres que puedan controlar cargas de trabajo de inteligencia artificial y aprendizaje automático, los proveedores de servicios deben crear una directiva de vGPU y agregar una directiva de vGPU a un VDC de organización. Para obtener instrucciones sobre cómo realizar estas tareas, consulte Crear y administrar políticas de vGPU. Una vez que los proveedores de servicios realicen estos pasos, los usuarios de tenant podrán implementar cargas de trabajo de inteligencia artificial y aprendizaje automático en sus clústeres de Tanzu Kubernetes Grid.

Para crear clústeres de Tanzu Kubernetes Grid con la funcionalidad vGPU, consulte Crear un clúster de Tanzu Kubernetes Grid. Si utiliza Tanzu Kubernetes Grid 2.1 y versiones posteriores que son interoperables con VMware Cloud Director Container Service Extension, las siguientes secciones no son aplicables y puede continuar con el flujo de trabajo de creación del clúster.

Nota: Las siguientes secciones solo se aplican a Tanzu Kubernetes Grid 1.6.1, puesto que ya no es compatible con VMware. Para aprovechar la funcionalidad de vGPU, utilice las versiones 2.1 y posteriores de Tanzu Kubernetes Grid que sean interoperables con VMware Cloud Director Container Service Extension.

Limitaciones del firmware del BIOS

Las plantillas de Tanzu Kubernetes Grid para VMware Cloud Director Container Service Extension se compilan con el firmware de BIOS y no es posible cambiar esta configuración de firmware. La memoria de BAR1 en este firmware no puede superar los 256 MB. Las tarjetas NVIDIA GRID con más de 256 MB de memoria BAR1 requieren el firmware EFI. Para obtener más información sobre las limitaciones del firmware, consulte VMware vSphere: Documentación del software de GPU virtual NVIDIA.

Crear una imagen personalizada con firmware EFI

Para superar las limitaciones del firmware de BIOS que existen en las plantillas de Tanzu Kubernetes Grid, es posible crear una imagen personalizada con firmware EFI en vSphere. Para obtener instrucciones, consulte las secciones de Imágenes de máquinas personalizadas de Linux de la documentación archivada de Tanzu Kubernetes Grid 1.6. Para acceder a la documentación archivada, consulte la documentación de VMware Tanzu Kubernetes Grid > Versiones no compatibles.

Para crear imágenes de máquinas personalizadas de Linux con Tanzu Kubernetes Grid 1.6 correctamente en una plantilla de GPU, también debe incluir las siguientes entradas al compilar la imagen personalizada:
Entradas Descripción
customizations.json Para compilar una imagen para un clúster habilitado para vGPU para vSphere, cree un archivo denominado customizations.json y agregue lo siguiente:
{
"vmx_version": "17"
}
metadata.json VERSION debe coincidir exactamente con una versión establecida de una plantilla de Tanzu Kubernetes Grid, ya que el complemento de interfaz de usuario de Kubernetes Container Clusters no reconoce el archivo OVA si el número de versión es diferente al de la plantilla.
En el siguiente ejemplo se describe la convención de nomenclatura de archivos recomendada:
Plantilla y versión Metadatos
Plantilla de Kubernetes para TKG 1.6 ubuntu-2004-kube-v1.23.10+vmware.1-tkg.2-b53d41690f8742e7388f2c553fd9a181.ova
Versión v1.23.10+vmware.1-tkg.2-b53d41690f8742e7388f2c553fd9a181
build-node-ova-vsphere-ubuntu-2004-efi Utilice este comando para ejecutar Image Builder para clústeres habilitados para vGPU. Este comando especifica para compilar la imagen personalizada con firmware EFI.
Los proveedores de servicios deben configurar un catálogo nuevo en VMware Cloud Director para las plantillas de vGPU y cargar las plantillas en este catálogo. Cuando un usuario desee crear un clúster habilitado para vGPU, puede seleccionar esta plantilla en el proceso de creación del clúster y se beneficiará de las vGPU de ese clúster. Para obtener más información, consulte Crear catálogos y cargar archivos OVA.