Você pode implantar cargas de trabalho de inteligência artificial e aprendizado de máquina em clusters provisionados pelo Tanzu Kubernetes Grid. A implantação dessas cargas de trabalho requer parte da configuração inicial por provedores de serviços e parte por administradores da organização e usuários de tenant no fluxo de trabalho de criação de cluster.

Para preparar um ambiente do VMware Cloud Director para provisionar clusters capazes de processar cargas de trabalho de inteligência artificial e aprendizado de máquina, os provedores de serviços devem criar e adicionar uma política de vGPU a um VDC de organização. Para obter instruções sobre como executar essas tarefas, consulte Criando e gerenciando políticas de vGPU. Quando os provedores de serviços realizarem essas etapas, os usuários de tenant poderão implantar as cargas de trabalho de inteligência artificial e aprendizado de máquina nos clusters do Tanzu Kubernetes Grid. Para criar clusters do Tanzu Kubernetes Grid com funcionalidade de vGPU, consulte Criar um cluster do Tanzu Kubernetes Grid.

Observação: O suporte a vGPU se estende apenas ao Tanzu Kubernetes Grid 1.5.

Limitações de firmware do BIOS

Os modelos do Tanzu Kubernetes Grid do VMware Cloud Director Container Service Extension são criados com firmware do BIOS, e não é possível alterar essa configuração de firmware. A memória BAR1 neste firmware não pode exceder 256 MB. As placas NVIDIA Grid com mais de 256 MB de memória BAR1 exigem firmware EFI. Para obter mais informações sobre as limitações de firmware, consulte VMware vSphere: documentação do software NVIDIA Virtual GPU.

Criar uma imagem personalizada com o firmware EFI

Para resolver as limitações de firmware do BIOS existentes nos modelos do Tanzu Kubernetes Grid, você pode criar uma imagem personalizada com o firmware EFI no vSphere. Para obter instruções, consulte Imagens de máquina personalizadas do Linux com o Tanzu Kubernetes Grid 1.5.

Para criar Imagens de máquina personalizadas do Linux com o Tanzu Kubernetes Grid 1.5 em um modelo de GPU, você também precisa incluir as seguintes entradas durante a criação:
Entradas Descrição
customizations.json Para gerar uma imagem de um cluster habilitado para vGPU do vSphere, crie um arquivo chamado customizations.json e adicione o seguinte:
{
"vmx_version": "17"
}
metadata.json VERSION deve ser exatamente igual a uma versão estabelecida de um modelo do Tanzu Kubernetes Grid, pois o plug-in da UI dos Kubernetes Container Clusters não reconhecerá o arquivo OVA se o número da versão for diferente do modelo.
O exemplo a seguir descreve a convenção de nomenclatura de arquivo recomendada:
Modelo e Versão Metadados
Modelo do Kubernetes para TKG 1.5.4 ubuntu-2004-kube-v1.22.9+vmware.1-tkg.1-2182cbabee08edf480ee9bc5866d6933.ova
Versão
v1.22.9+vmware.1-tkg.1-2182cbabee08edf480ee9bc5866d6933
build-node-ova-vsphere-ubuntu-2004-efi Use este comando para executar o criador de imagens para clusters habilitados para vGPU. Esse comando especifica a compilação da imagem personalizada com o firmware EFI.
Os provedores de serviços devem configurar um novo catálogo no VMware Cloud Director para modelos de vGPU e carregar os modelos nesse catálogo. Quando um usuário deseja criar um cluster habilitado para vGPU, ele pode selecionar esse modelo no processo de criação de cluster e ele aproveita as vGPUs nesse cluster. Para obter mais informações, consulte Criar catálogos e carregar arquivos OVA.