Você pode implantar cargas de trabalho de inteligência artificial e aprendizado de máquina em clusters provisionados pelo Tanzu Kubernetes Grid. A implantação dessas cargas de trabalho requer parte da configuração inicial por provedores de serviços e parte por administradores da organização e usuários de tenant no fluxo de trabalho de criação de cluster.

Para preparar um ambiente do VMware Cloud Director para provisionar clusters capazes de processar cargas de trabalho de inteligência artificial e aprendizado de máquina, os provedores de serviços devem criar e adicionar uma política de vGPU a um VDC de organização. Para obter instruções sobre como executar essas tarefas, consulte Criando e gerenciando políticas de vGPU. Quando os provedores de serviços realizarem essas etapas, os usuários de tenant poderão implantar as cargas de trabalho de inteligência artificial e aprendizado de máquina nos clusters do Tanzu Kubernetes Grid.

Para criar clusters do Tanzu Kubernetes Grid com funcionalidade de vGPU, consulte Criar um cluster do Tanzu Kubernetes Grid. Se você estiver usando o Tanzu Kubernetes Grid 2.1 e superior que são interoperáveis com o VMware Cloud Director Container Service Extension, as seções a seguir não serão aplicáveis e você poderá prosseguir para o fluxo de trabalho de criação de cluster.

Observação: As seções a seguir se aplicam somente ao Tanzu Kubernetes Grid 1.6.1, que não tem mais suporte pela VMware. Para aproveitar a funcionalidade do vGPU, use as versões Tanzu Kubernetes Grid 2.1 e superiores que são interoperáveis com o VMware Cloud Director Container Service Extension.

Limitações de firmware do BIOS

Os modelos do Tanzu Kubernetes Grid do VMware Cloud Director Container Service Extension são criados com firmware do BIOS, e não é possível alterar essa configuração de firmware. A memória BAR1 neste firmware não pode exceder 256 MB. As placas NVIDIA Grid com mais de 256 MB de memória BAR1 exigem firmware EFI. Para obter mais informações sobre as limitações de firmware, consulte VMware vSphere: documentação do software NVIDIA Virtual GPU.

Criar uma imagem personalizada com o firmware EFI

Para resolver as limitações de firmware do BIOS existentes nos modelos do Tanzu Kubernetes Grid, você pode criar uma imagem personalizada com o firmware EFI no vSphere. Para obter instruções, consulte as seções Imagens de Máquina Personalizada da Linux na documentação arquivada do Tanzu Kubernetes Grid 1.6. Para acessar a documentação arquivada, consulte a Documentação do VMware Tanzu Kubernetes Grid > Versões Sem Suporte.

Para criar imagens de máquina personalizada do Linux com o Tanzu Kubernetes Grid 1.6 com sucesso em um modelo de GPU, você também precisa incluir as seguintes entradas durante a criação da imagem personalizada:
Entradas Descrição
customizations.json Para gerar uma imagem de um cluster habilitado para vGPU do vSphere, crie um arquivo chamado customizations.json e adicione o seguinte:
{
"vmx_version": "17"
}
metadata.json VERSION deve ser exatamente igual a uma versão estabelecida de um modelo do Tanzu Kubernetes Grid, pois o plug-in da UI dos Kubernetes Container Clusters não reconhecerá o arquivo OVA se o número da versão for diferente do modelo.
O exemplo a seguir descreve a convenção de nomenclatura de arquivo recomendada:
Modelo e Versão Metadados
Modelo do Kubernetes para o TKG 1.6 ubuntu-2004-kube-v1.23.10+vmware.1-tkg.2-b53d41690f8742e7388f2c553fd9a181.ova
Versão v1.23.10+vmware.1-tkg.2-b53d41690f8742e7388f2c553fd9a181
build-node-ova-vsphere-ubuntu-2004-efi Use este comando para executar o criador de imagens para clusters habilitados para vGPU. Esse comando especifica a compilação da imagem personalizada com o firmware EFI.
Os provedores de serviços devem configurar um novo catálogo no VMware Cloud Director para modelos de vGPU e carregar os modelos nesse catálogo. Quando um usuário deseja criar um cluster habilitado para vGPU, ele pode selecionar esse modelo no processo de criação de cluster e ele aproveita as vGPUs nesse cluster. Para obter mais informações, consulte Criar catálogos e carregar arquivos OVA.