Cuando se produce un error en un dispositivo de VMware Aria Automation en una configuración de alta disponibilidad (HA) de varios nodos, es posible que deba reemplazar el nodo defectuoso.

Precaución: Antes de continuar, VMware recomienda ponerse en contacto con el equipo de soporte técnico para solucionar el problema de HA y comprobar que el problema esté aislado en un nodo.

Si el soporte técnico determina que necesita reemplazar el nodo, siga estos pasos.

  1. En vCenter, realice instantáneas de copia de seguridad de cada dispositivo en la configuración de HA.

    En las instantáneas de copia de seguridad, no incluya la memoria de la máquina virtual.

  2. Apague el nodo defectuoso.
  3. Tome nota del número de compilación de software de VMware Aria Automation y la configuración de red del nodo defectuoso.

    Anote el FQDN, la dirección IP, la puerta de enlace, los servidores DNS y, especialmente, la dirección MAC. Posteriormente, asigne los mismos valores al nodo de reemplazo.

  4. Compruebe el estado del nodo de base de datos principal. Desde una línea de comandos raíz en cualquier nodo en buen estado, ejecute lo siguiente:
    > kubectl get pod `vracli status | jq -r '.databaseNodes[] | select(.["Role"] == "primary") | .["Node name"]' | cut -d '.' -f 1` -n prelude -o wide --no-headers=true
    
    primary-db-node-name 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
    Importante: El nodo de base de datos principal debe ser uno de los nodos en buen estado.

    Si el nodo de base de datos principal es defectuoso, póngase en contacto con el soporte técnico en lugar de continuar.

  5. En la línea de comandos raíz del nodo en buen estado, elimine el nodo defectuoso.

    vracli cluster remove faulty-node-FQDN

  6. Utilice vCenter para implementar un nuevo nodo de VMware Aria Automation de reemplazo.

    Implemente el mismo número de compilación de software de VMware Aria Automation y aplique la configuración de red del nodo defectuoso. Incluya el FQDN, la dirección IP, la puerta de enlace, los servidores DNS y, especialmente, la dirección MAC que anotó anteriormente.

  7. Encienda el nodo de reemplazo.
  8. Inicie sesión como raíz en la línea de comandos del nodo de reemplazo.
  9. Compruebe que la secuencia de arranque inicial haya finalizado mediante la ejecución del siguiente comando.

    vracli status first-boot

    Busque un mensaje de First boot complete nuevo.

  10. Desde el nodo de reemplazo, únase al clúster de VMware Aria Automation de reemplazo.

    vracli cluster join primary-DB-node-FQDN

  11. Inicie sesión como raíz en la línea de comandos del nodo de base de datos principal.
  12. Implemente el clúster reparado mediante la ejecución del siguiente script.

    /opt/scripts/deploy.sh