Wanneer een vRealize Automation-appliance in een configuratie met meerdere knooppunten en hoge beschikbaarheid (HA) is mislukt, moet u mogelijk het defecte knooppunt vervangen.

Voorzichtig: Voordat u doorgaat, raadt VMware u aan contact op te nemen met de technische ondersteuning om het HA-probleem op te lossen en te controleren of het probleem op één knooppunt is geïsoleerd.

Als de technische ondersteuning bepaalt dat het knooppunt moet worden vervangen, volgt u de volgende stappen.

  1. Maak in vCenter back-upmomentopnamen van elke appliance in de HA-configuratie.

    Neem geen geheugen voor de virtuele machine op in de back-upmomentopnamen.

  2. Sluit het defecte knooppunt af.
  3. Noteer het buildnummer van de vRealize Automation-software van het defecte knooppunt evenals de netwerkinstellingen.

    Noteer de FQDN, het IP-adres, de gateway, de DNS-servers en in het bijzonder het MAC-adres. Later wijst u dezelfde waarden toe aan het vervangende knooppunt.

  4. Het primaire databaseknooppunt moet een van de gezonde knooppunten zijn. Volg deze stappen:
    1. Meld u als root aan op de commandoregel van een gezond knooppunt.
    2. Zoek de naam van het primaire databaseknooppunt door het volgende commando uit te voeren.

      vracli status | grep primary -B 1

      Het resultaat moet lijken op dit voorbeeld, waarbij postgres-1 het primaire databaseknooppunt is.

      "Conninfo":
      "host=postgres-1.postgres.prelude.svc.cluster.local
      dbname=repmgr-db user=repmgr-db passfile=/scratch/repmgr-db.cred
      connect_timeout=10",
      "Role": "primary",
    3. Controleer of het primaire databaseknooppunt een gezonde status heeft door het volgende commando uit te voeren.

      kubectl -n prelude get pods -o wide | grep postgres

      Het resultaat moet lijken op dit voorbeeld, waarbij postgres-1 in de lijst wordt weergegeven als actief en gezond.

      postgres-1 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
      postgres-2 1/1 Running 0 39h 12.123.1.14 vc-vm-224-85.company.com <none> <none>
      Belangrijk: Als het primaire databaseknooppunt defect is, neemt u contact op met de technische ondersteuning in plaats van verder te gaan.
  5. Verwijder het defecte knooppunt vanuit de rootcommandoregel van het gezonde knooppunt.

    vracli cluster remove faulty-node-FQDN

  6. Gebruik vCenter om een nieuw, vervangend vRealize Automation-knooppunt te implementeren.

    Implementeer hetzelfde buildnummer van de vRealize Automation-software en pas de netwerkinstellingen van het defecte knooppunt toe. Voeg de FQDN, het IP-adres, de gateway, de DNS-servers en in het bijzonder het MAC-adres toe.

  7. Schakel het vervangende knooppunt in.
  8. Meld u als root aan op de commandoregel van het vervangende knooppunt.
  9. Controleer of de initiële opstartvolgorde is voltooid door het volgende commando uit te voeren.

    vracli status first-boot

    Zoek naar het bericht First boot complete.

  10. Neem vanaf het vervangende knooppunt deel aan het vRealize Automation-cluster.

    vracli cluster join primary-DB-node-FQDN

  11. Meld u als root aan op de commandoregel van het primaire databaseknooppunt.
  12. Implementeer de herstelde cluster door het volgende script uit te voeren.

    /opt/scripts/deploy.sh