Quando um dispositivo do VMware Aria Automation em uma configuração de vários nós de alta disponibilidade (HA) apresenta uma falha, pode ser necessário substituir o nó com falha.
Se o suporte técnico determinar que é necessário substituir o nó, tome as seguintes medidas.
- No vCenter, faça snapshots de backup de cada dispositivo na configuração de HA.
Nos snapshots de backup, não inclua a memória da máquina virtual.
- Desligue o nó com falha.
- Anote o número de compilação de software do VMware Aria Automation do nó com falha e as configurações de rede.
Anote o FQDN, o endereço IP, o gateway, os servidores DNS e, especialmente, o endereço MAC. Mais tarde, você atribuirá os mesmos valores ao nó de substituição.
- Verifique o status do nó do banco de dados primário. Em uma linha de comando raiz em qualquer nó íntegro, execute o seguinte:
> kubectl get pod `vracli status | jq -r '.databaseNodes[] | select(.["Role"] == "primary") | .["Node name"]' | cut -d '.' -f 1` -n prelude -o wide --no-headers=true primary-db-node-name 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
Importante: O nó do banco de dados primário deve ser um dos nós íntegros.Se o nó do banco de dados primário estiver com falha, entre em contato com o suporte técnico em vez de prosseguir.
- Na linha de comando raiz do nó íntegro, remova o nó com falha.
vracli cluster remove faulty-node-FQDN
- Use o vCenter para implantar um nó novo de substituição do VMware Aria Automation.
Implante o mesmo número de compilação de software do VMware Aria Automation e aplique as configurações de rede do nó com falha. Inclua o FQDN, o endereço IP, o gateway, os servidores DNS e, especialmente, o endereço MAC que você anotou anteriormente.
- Ligue o nó de substituição.
- Faça login como raiz na linha de comando do nó de substituição.
- Verifique se a sequência de inicialização inicial foi concluída, executando o seguinte comando.
vracli status first-boot
Procure uma mensagem
First boot complete
. - No nó de substituição, ingresse o cluster do VMware Aria Automation.
Observação: Se a sua implantação do VMware Aria Automation for corrigida, consulte a solução alternativa na KB 96619.
vracli cluster join primary-DB-node-FQDN
- Faça login como raiz na linha de comando do nó de banco de dados primário.
- Implante o cluster reparado, executando o seguinte script:
/opt/scripts/deploy.sh