Apagar y reiniciar manualmente el clúster de vSAN

Puede apagar manualmente todo el clúster de vSAN para realizar tareas de mantenimiento o solucionar problemas.

Utilice el asistente Apagar clúster a no ser que el flujo de trabajo requiera un apagado manual. Cuando apague manualmente el clúster de vSAN, no deshabilite vSAN en el clúster.

Nota: Si tiene un entorno de vSphere with Tanzu, debe seguir el orden especificado al apagar o iniciar los componentes. Para obtener más información, consulte "Apagar e iniciar VMware Cloud Foundation" en la Guía de operaciones de VMware Cloud Foundation.

Procedimiento

Apague el clúster de vSAN.
1. Compruebe el servicio de estado de vSAN para confirmar que el clúster está en buen estado.
2. Apague todas las máquinas virtuales que se ejecutan en el clúster de vSAN si vCenter Server no está alojado en el clúster. Si vCenter Server está alojado en el clúster de vSAN, no apague la máquina virtual de vCenter Server.
3. Haga clic en la pestaña Configurar y desactive HA. Como resultado, el clúster no registrará apagados de hosts como errores.
  
  Para vSphere 7.0 U1 y versiones posteriores, habilite el modo de retirada de vCLS. Para obtener más información, consulte el artículo de la base de conocimientos de VMware en https://kb.vmware.com/s/article/80472.
4. Compruebe que todas las tareas de resincronización se hayan completado.
  Haga clic en la pestaña Supervisar y seleccione vSAN > Resincronización de objetos.
5. Si vCenter Server está alojado en el clúster de vSAN, apague la máquina virtual de vCenter Server.
  Tome nota del host que ejecuta la máquina virtual vCenter Server. Es el host en el que se debe reiniciar la máquina virtual de vCenter Server.
6. Deshabilite las actualizaciones de los miembros del clúster desde vCenter Server ejecutando el siguiente comando en los hosts de ESXi del clúster. Asegúrese de ejecutar el siguiente comando en todos los hosts.
```
esxcfg-advcfg -s 1 /VSAN/IgnoreClusterMemberListUpdates
```
7. Inicie sesión en cualquier host del clúster que no sea el host testigo.
8. Ejecute el siguiente comando solo en ese host. Si ejecuta el comando en varios hosts a la vez, puede provocar que una condición de carrera cause resultados inesperados.
```
python /usr/lib/vmware/vsan/bin/reboot_helper.py prepare
```
  El comando devuelve e imprime lo siguiente:
  Se realizó la preparación del clúster.
  Nota:
  - El clúster está totalmente particionado después de que el comando se haya completado correctamente.
  - Si se produce un error, solucione el problema en función del mensaje de error y vuelva a habilitar el modo de retirada de vCLS.
  - Si hay hosts desconectados o en mal estado en el clúster, elimine los hosts y vuelva a intentar ejecutar el comando.
9. Coloque todos los hosts en modo de mantenimiento con Sin acción. Si vCenter Server está apagado, use el siguiente comando para colocar los hosts de ESXi en el modo de mantenimiento con Sin acción.
```
esxcli system maintenanceMode set -e true -m noAction
```
  Realice este paso en todos los hosts.
  
  Para evitar el riesgo de falta de disponibilidad de datos al utilizar Sin acción al mismo tiempo en varios hosts, y después de reiniciar varios hosts, consulte este artículo de la base de conocimientos de VMware: https://kb.vmware.com/s/article/60424. Para realizar un reinicio simultáneo de todos los hosts del clúster mediante una herramienta integrada, consulte este artículo de la base de conocimientos de VMware: https://kb.vmware.com/s/article/70650.
10. Después de que todos los hosts hayan entrado correctamente en el modo de mantenimiento, realice las tareas de mantenimiento necesarias y apague los hosts.
Reinicie el clúster de vSAN.
1. Encienda los hosts ESXi.
  Encienda el cuadro físico en el que está instalado ESXi. El host de ESXi se inicia, busca las máquinas virtuales correspondientes y funciona con normalidad.
  
  Si algún host no se reinician, deberá recuperarlo de forma manual o moverlo fuera del clúster de vSAN.
2. Cuando todos los hosts vuelvan a encenderse, salga del modo de mantenimiento en todos los hosts. Si vCenter Server está apagado, use el siguiente comando en los hosts de ESXi para salir del modo de mantenimiento.
```
esxcli system maintenanceMode set -e false
```
  Realice este paso en todos los hosts.
3. Inicie sesión en uno de los hosts del clúster que no sean el host testigo.
4. Ejecute el siguiente comando solo en ese host. Si ejecuta el comando en varios hosts a la vez, puede provocar que una condición de carrera cause resultados inesperados.
```
python /usr/lib/vmware/vsan/bin/reboot_helper.py recover
```
  El comando devuelve e imprime lo siguiente:
  El reinicio o encendido del clúster se completó correctamente.
5. Compruebe que todos los hosts estén disponibles en el clúster ejecutando el siguiente comando en cada host.
```
esxcli vsan cluster get
```
6. Habilite las actualizaciones de miembros del clúster desde vCenter Server ejecutando el siguiente comando en los hosts de ESXi del clúster. Asegúrese de ejecutar el siguiente comando en todos los hosts.
```
esxcfg-advcfg -s 0 /VSAN/IgnoreClusterMemberListUpdates
```
7. Reinicie la máquina virtual de vCenter Server si está apagada. Espere a que la máquina virtual de vCenter Server se encienda y se ejecute. Para deshabilitar el modo de retirada de vCLS, consulte el artículo de la base de conocimiento de VMware en https://kb.vmware.com/s/article/80472.
8. Compruebe que todos los hosts estén disponibles en el clúster de vSAN ejecutando el siguiente comando en cada host.
```
esxcli vsan cluster get
```
9. Reinicie las máquinas virtuales restantes a través de vCenter Server.
10. Compruebe el servicio de estado de vSAN y resuelva los problemas pendientes.
11. (Opcional) Si el clúster de vSAN tiene habilitada Disponibilidad de vSphere, debe reiniciar manualmente Disponibilidad de vSphere para evitar el siguiente error: No se puede encontrar el agente principal de vSphere HA.
  Para reiniciar de forma manual Disponibilidad de vSphere, seleccione el clúster de vSAN y acceda a:
  1. Configurar > Servicios > Disponibilidad de vSphere > EDITAR > Deshabilitar vSphere HA
  2. Configurar > Servicios > Disponibilidad de vSphere > EDITAR > Habilitar vSphere HA
Si hay hosts desconectados o en mal estado en el clúster, recupere o elimine los hosts del clúster de vSAN. Vuelva a intentar los comandos anteriores solo después de que el servicio de estado de vSAN muestre todos los hosts disponibles en estado verde.
Si tiene un clúster de vSAN de tres nodos, el comando reboot_helper.py recover no puede funcionar en una situación de error de un host. Como administrador, haga lo siguiente:
1. Elimine temporalmente la información del host de error de la lista de agentes de unidifusión.
2. Agregue el host después de ejecutar el siguiente comando.
```
reboot_helper.py recover
```
A continuación, se muestran los comandos para eliminar y agregar el host a un clúster de vSAN:
```
#esxcli vsan cluster unicastagent remove -a <IP Address> -t node -u <NodeUuid>
```
```
#esxcli vsan cluster unicastagent add -t node -u <NodeUuid> -U true -a <IP Address> -p 12321
```