Cuando se produce un error en un dispositivo de VMware Aria Automation en una configuración de alta disponibilidad (HA) de varios nodos, es posible que deba reemplazar el nodo defectuoso.
Si el soporte técnico determina que necesita reemplazar el nodo, siga estos pasos.
- En vCenter, realice instantáneas de copia de seguridad de cada dispositivo en la configuración de HA.
En las instantáneas de copia de seguridad, no incluya la memoria de la máquina virtual.
- Apague el nodo defectuoso.
- Tome nota del número de compilación de software de VMware Aria Automation y la configuración de red del nodo defectuoso.
Anote el FQDN, la dirección IP, la puerta de enlace, los servidores DNS y, especialmente, la dirección MAC. Posteriormente, asigne los mismos valores al nodo de reemplazo.
- Compruebe el estado del nodo de base de datos principal. Desde una línea de comandos raíz en cualquier nodo en buen estado, ejecute lo siguiente:
> kubectl get pod `vracli status | jq -r '.databaseNodes[] | select(.["Role"] == "primary") | .["Node name"]' | cut -d '.' -f 1` -n prelude -o wide --no-headers=true primary-db-node-name 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
Importante: El nodo de base de datos principal debe ser uno de los nodos en buen estado.Si el nodo de base de datos principal es defectuoso, póngase en contacto con el soporte técnico en lugar de continuar.
- En la línea de comandos raíz del nodo en buen estado, elimine el nodo defectuoso.
vracli cluster remove faulty-node-FQDN
- Utilice vCenter para implementar un nuevo nodo de VMware Aria Automation de reemplazo.
Implemente el mismo número de compilación de software de VMware Aria Automation y aplique la configuración de red del nodo defectuoso. Incluya el FQDN, la dirección IP, la puerta de enlace, los servidores DNS y, especialmente, la dirección MAC que anotó anteriormente.
- Encienda el nodo de reemplazo.
- Inicie sesión como raíz en la línea de comandos del nodo de reemplazo.
- Compruebe que la secuencia de arranque inicial haya finalizado mediante la ejecución del siguiente comando.
vracli status first-boot
Busque un mensaje de
First boot complete
nuevo. - Desde el nodo de reemplazo, únase al clúster de VMware Aria Automation de reemplazo.
vracli cluster join primary-DB-node-FQDN
- Inicie sesión como raíz en la línea de comandos del nodo de base de datos principal.
- Implemente el clúster reparado mediante la ejecución del siguiente script.
/opt/scripts/deploy.sh