Quando um dispositivo do VMware Aria Automation em uma configuração de vários nós de alta disponibilidade (HA) apresenta uma falha, pode ser necessário substituir o nó com falha.

Cuidado: Antes de continuar, a VMware recomenda que você entre em contato com o suporte técnico para solucionar o problema de HA e verificar se o problema está isolado em um único nó.

Se o suporte técnico determinar que é necessário substituir o nó, tome as seguintes medidas.

  1. No vCenter, faça snapshots de backup de cada dispositivo na configuração de HA.

    Nos snapshots de backup, não inclua a memória da máquina virtual.

  2. Desligue o nó com falha.
  3. Anote o número de compilação de software do VMware Aria Automation do nó com falha e as configurações de rede.

    Anote o FQDN, o endereço IP, o gateway, os servidores DNS e, especialmente, o endereço MAC. Mais tarde, você atribuirá os mesmos valores ao nó de substituição.

  4. Verifique o status do nó do banco de dados primário. Em uma linha de comando raiz em qualquer nó íntegro, execute o seguinte:
    > kubectl get pod `vracli status | jq -r '.databaseNodes[] | select(.["Role"] == "primary") | .["Node name"]' | cut -d '.' -f 1` -n prelude -o wide --no-headers=true
    
    primary-db-node-name 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
    Importante: O nó do banco de dados primário deve ser um dos nós íntegros.

    Se o nó do banco de dados primário estiver com falha, entre em contato com o suporte técnico em vez de prosseguir.

  5. Na linha de comando raiz do nó íntegro, remova o nó com falha.

    vracli cluster remove faulty-node-FQDN

  6. Use o vCenter para implantar um nó novo de substituição do VMware Aria Automation.

    Implante o mesmo número de compilação de software do VMware Aria Automation e aplique as configurações de rede do nó com falha. Inclua o FQDN, o endereço IP, o gateway, os servidores DNS e, especialmente, o endereço MAC que você anotou anteriormente.

  7. Ligue o nó de substituição.
  8. Faça login como raiz na linha de comando do nó de substituição.
  9. Verifique se a sequência de inicialização inicial foi concluída, executando o seguinte comando.

    vracli status first-boot

    Procure uma mensagem First boot complete.

  10. No nó de substituição, ingresse o cluster do VMware Aria Automation.
    Observação: Se a sua implantação do VMware Aria Automation for corrigida, consulte a solução alternativa na KB 96619.

    vracli cluster join primary-DB-node-FQDN

  11. Faça login como raiz na linha de comando do nó de banco de dados primário.
  12. Implante o cluster reparado, executando o seguinte script:

    /opt/scripts/deploy.sh