Quando un'appliance VMware Aria Automation in una configurazione a più nodi con alta disponibilità (HA) non riesce, potrebbe essere necessario sostituire il nodo in cui si è verificato il problema.

Attenzione: Prima di procedere, VMware consiglia di contattare il supporto tecnico per risolvere il problema relativo all'alta disponibilità e verificare che il problema sia isolato in un solo nodo.

Se il supporto tecnico stabilisce che è necessario sostituire il nodo, eseguire i passaggi seguenti.

  1. In vCenter, creare snapshot di backup di ogni appliance nella configurazione HA.

    Negli snapshot di backup, non includere la memoria della macchina virtuale.

  2. Arrestare il nodo in cui si è verificato il problema.
  3. Prendere nota delle impostazioni di rete e del numero di build del software VMware Aria Automation del nodo in cui si è verificato il problema.

    Prendere nota del nome di dominio completo, dell'indirizzo IP, del gateway, dei server DNS e in particolare dell'indirizzo MAC. Più tardi sarà necessario assegnare gli stessi valori al nodo sostitutivo.

  4. Controllare lo stato del nodo primario del database. Da una riga di comando root su qualsiasi nodo integro, eseguire quanto segue:
    > kubectl get pod `vracli status | jq -r '.databaseNodes[] | select(.["Role"] == "primary") | .["Node name"]' | cut -d '.' -f 1` -n prelude -o wide --no-headers=true
    
    primary-db-node-name 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
    Importante: Il nodo primario del database deve essere uno dei nodi integri.

    Se è presente un problema nel nodo primario del database, contattare il supporto tecnico anziché procedere.

  5. Dalla riga di comando root del nodo integro, rimuovere il nodo in cui si è verificato il problema.

    vracli cluster remove faulty-node-FQDN

  6. Utilizzare vCenter per distribuire un nuovo nodo di VMware Aria Automation sostitutivo.

    Distribuire lo stesso numero di build del software VMware Aria Automation e applicare le impostazioni di rete del nodo in cui si è verificato il problema. Includere il nome di dominio completo, l'indirizzo IP, il gateway, i server DNS e in particolare l'indirizzo MAC di cui si è preso nota in precedenza.

  7. Accendere il nodo sostitutivo.
  8. Accedere come root alla riga di comando del nodo sostitutivo.
  9. Verificare che la sequenza di avvio iniziale sia terminata eseguendo il comando seguente.

    vracli status first-boot

    Cercare un messaggio First boot complete.

  10. Dal nodo sostitutivo, aggiungere il cluster di VMware Aria Automation.

    vracli cluster join primary-DB-node-FQDN

  11. Accedere come root alla riga di comando del nodo primario del database.
  12. Distribuire il cluster riparato eseguendo lo script seguente.

    /opt/scripts/deploy.sh