Quando um dispositivo do vRealize Automation em uma configuração de vários nós de alta disponibilidade (HA) apresenta uma falha, pode ser necessário substituir o nó com falha.

Cuidado: Antes de continuar, a VMware recomenda que você entre em contato com o suporte técnico para solucionar o problema de HA e verificar se o problema está isolado em um único nó.

Se o suporte técnico determinar que é necessário substituir o nó, tome as seguintes medidas.

  1. No vCenter, faça snapshots de backup de cada dispositivo na configuração de HA.

    Nos snapshots de backup, não inclua a memória da máquina virtual.

  2. Desligue o nó com falha.
  3. Anote o número de compilação de software do vRealize Automation do nó com falha e as configurações de rede.

    Anote o FQDN, o endereço IP, o gateway, os servidores DNS e, especialmente, o endereço MAC. Mais tarde, você atribuirá os mesmos valores ao nó de substituição.

  4. O nó do banco de dados primário deve ser um dos nós íntegros. Siga estas etapas:
    1. Faça login como raiz na linha de comando de um nó íntegro.
    2. Encontre o nome do nó do banco de dados primário executando o seguinte comando.

      vracli status | grep primary -B 1

      O resultado deve ser semelhante a este exemplo, em que postgres-1 é o nó primário do banco de dados.

      "Conninfo":
      "host=postgres-1.postgres.prelude.svc.cluster.local
      dbname=repmgr-db user=repmgr-db passfile=/scratch/repmgr-db.cred
      connect_timeout=10",
      "Role": "primary",
    3. Verifique se o nó do banco de dados primário está íntegro, executando o comando a seguir.

      kubectl -n prelude get pods -o wide | grep postgres

      O resultado deve ser semelhante a este exemplo, em que postgres-1 está na lista como em execução e íntegro.

      postgres-1 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
      postgres-2 1/1 Running 0 39h 12.123.1.14 vc-vm-224-85.company.com <none> <none>
      Importante: Se o nó do banco de dados primário estiver com falha, entre em contato com o suporte técnico em vez de prosseguir.
  5. Na linha de comando raiz do nó íntegro, remova o nó com falha.

    vracli cluster remove faulty-node-FQDN

  6. Use o vCenter para implantar um nó novo de substituição do vRealize Automation.

    Implante o mesmo número de compilação de software do vRealize Automation e aplique as configurações de rede do nó com falha. Inclua o FQDN, o endereço IP, o gateway, os servidores DNS e, especialmente, o endereço MAC que você anotou anteriormente.

  7. Ligue o nó de substituição.
  8. Faça login como raiz na linha de comando do nó de substituição.
  9. Verifique se a sequência de inicialização inicial foi concluída, executando o seguinte comando.

    vracli status first-boot

    Procure uma mensagem First boot complete.

  10. No nó de substituição, ingresse o cluster do vRealize Automation.

    vracli cluster join primary-DB-node-FQDN

  11. Faça login como raiz na linha de comando do nó de banco de dados primário.
  12. Implante o cluster reparado, executando o seguinte script.

    /opt/scripts/deploy.sh