Wenn eine VMware Aria Automation-Appliance in einer Hochverfügbarkeitskonfiguration (HA) mit mehreren Knoten fehlgeschlagen ist, müssen Sie den fehlerhaften Knoten unter Umständen ersetzen.

Vorsicht: Bevor Sie fortfahren, sollten Sie sich gemäß der Empfehlungen von VMware an den technischen Support wenden, um das HA-Problem zu beheben und sicherzustellen, dass das Problem auf einen Knoten begrenzt ist.

Wenn der technische Support feststellt, dass der Knoten ersetzt werden muss, gehen Sie wie folgt vor.

  1. Erstellen Sie in vCenter Backup-Snapshots von jeder Appliance in der HA-Konfiguration.

    In den Backup-Snapshots sollte kein VM-Arbeitsspeicher enthalten sein.

  2. Fahren Sie den fehlerhaften Knoten herunter.
  3. Notieren Sie sich die Build-Nummer der VMware Aria Automation-Software des fehlerhaften Knotens und die Netzwerkeinstellungen.

    Notieren Sie sich den FQDN, die IP-Adresse, das Gateway, die DNS-Server und insbesondere die MAC-Adresse. Diese Werte werden dem Ersatzknoten zu einem späteren Zeitpunkt zugewiesen.

  4. Überprüfen Sie den Status des primären Datenbankknotens. Führen Sie über eine Root-Befehlszeile auf einem beliebigen fehlerfreien Knoten Folgendes aus:
    > kubectl get pod `vracli status | jq -r '.databaseNodes[] | select(.["Role"] == "primary") | .["Node name"]' | cut -d '.' -f 1` -n prelude -o wide --no-headers=true
    
    primary-db-node-name 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
    Wichtig: Der primäre Datenbankknoten muss einer der fehlerfreien Knoten sein.

    Wenden Sie sich bei einem fehlerhaften primären Datenbankknoten an den technischen Support, anstatt den Vorgang fortzusetzen.

  5. Entfernen Sie den fehlerhaften Knoten aus der Root-Befehlszeile des fehlerfreien Knotens.

    vracli cluster remove faulty-node-FQDN

  6. Verwenden Sie vCenter zum Bereitstellen eines neuen VMware Aria Automation-Ersatzknotens.

    Stellen Sie die Build-Nummer derselben VMware Aria Automation-Software bereit und wenden Sie die Netzwerkeinstellungen des fehlerhaften Knotens an. Geben Sie den FQDN, die IP-Adresse, das Gateway, die DNS-Server und insbesondere die MAC-Adresse an, die Sie zuvor notiert haben.

  7. Schalten Sie den Ersatzknoten ein.
  8. Melden Sie sich als Root-Benutzer bei der Befehlszeile des Ersatzknotens an.
  9. Stellen Sie sicher, dass die anfängliche Startsequenz abgeschlossen ist, indem Sie folgenden Befehl ausführen.

    vracli status first-boot

    Suchen Sie nach einer Meldung vom Typ First boot complete.

  10. Treten Sie dem VMware Aria Automation-Cluster über den Ersatzknoten bei.
    Hinweis: Wenn Ihre VMware Aria Automation-Bereitstellung gepatcht ist, finden Sie weitere Informationen zur Problemumgehung im KB-Artikel 96619.

    vracli cluster join primary-DB-node-FQDN

  11. Melden Sie sich als Root-Benutzer bei der Befehlszeile des primären Datenbankknotens an.
  12. Stellen Sie den reparierten Cluster durch Ausführen des folgenden Skripts bereit:

    /opt/scripts/deploy.sh