Apagar y reiniciar manualmente el clúster de vSAN

Puede apagar manualmente todo el clúster de vSAN para realizar tareas de mantenimiento o solucionar problemas.

Utilice el asistente Apagar clúster a no ser que el flujo de trabajo requiera un apagado manual. Cuando apague manualmente el clúster de vSAN, no desactive vSAN en el clúster.

Nota: Si tiene un entorno de vSphere with Tanzu, debe seguir el orden especificado al apagar o iniciar los componentes. Para obtener más información, consulte "Apagar e iniciar VMware Cloud Foundation" en la Guía de operaciones de VMware Cloud Foundation.

Procedimiento

Apague el clúster de vSAN.
1. Compruebe vSAN Skyline Health para confirmar que el clúster está en buen estado.
2. Apague todas las máquinas virtuales que se ejecutan en el clúster de vSAN si vCenter Server no está alojado en el clúster. Si vCenter Server está alojado en el clúster de vSAN, no apague la máquina virtual de vCenter Server ni las máquinas virtuales de servicio (como DNS o Active Directory) que utiliza vCenter Server.
3. Si el servicio de archivos de vSAN está habilitado en el clúster de vSAN, deberá desactivarlo. Al desactivar el servicio de archivos de vSAN, se eliminará el dominio del servicio de archivos vacío. Si desea conservar el dominio del servicio de archivos vacío después de reiniciar el clúster de vSAN, debe crear un recurso compartido de archivos NFS o SMB antes de desactivar el servicio de archivos de vSAN.
4. Haga clic en la pestaña Configurar y desactive HA. Como resultado, el clúster no registrará apagados de hosts como errores.
  
  Para vSphere 7.0 U1 y versiones posteriores, habilite el modo de retirada de vCLS. Para obtener más información, consulte el artículo de la base de conocimientos de VMware en https://kb.vmware.com/s/article/80472.
5. Compruebe que todas las tareas de resincronización se hayan completado.
  Haga clic en la pestaña Supervisar y seleccione vSAN > Resincronización de objetos.
6. Si vCenter Server está alojado en el clúster de vSAN, apague la máquina virtual de vCenter Server.
  Tome nota del host que ejecuta la máquina virtual vCenter Server. Es el host en el que se debe reiniciar la máquina virtual de vCenter Server.
7. Desactive las actualizaciones de miembros del clúster desde vCenter Server ejecutando el siguiente comando en los hosts de ESXi del clúster. Asegúrese de ejecutar el siguiente comando en todos los hosts.
```
esxcfg-advcfg -s 1 /VSAN/IgnoreClusterMemberListUpdates
```
8. Inicie sesión en cualquier host del clúster que no sea el host testigo.
9. Ejecute el siguiente comando solo en ese host. Si ejecuta el comando en varios hosts a la vez, puede provocar que una condición de carrera cause resultados inesperados.
```
python /usr/lib/vmware/vsan/bin/reboot_helper.py prepare
```
  El comando devuelve e imprime lo siguiente:
  Se realizó la preparación del clúster.
  Nota:
  - El clúster está totalmente particionado después de que el comando se haya completado correctamente.
  - Si se produce un error, solucione el problema en función del mensaje de error y vuelva a habilitar el modo de retirada de vCLS.
  - Si hay hosts desconectados o en mal estado en el clúster, quite los hosts y vuelva a intentar ejecutar el comando.
10. Coloque todos los hosts en modo de mantenimiento con Sin acción. Si vCenter Server está apagado, use el siguiente comando para colocar los hosts de ESXi en el modo de mantenimiento con Sin acción.
```
esxcli system maintenanceMode set -e true -m noAction
```
  Realice este paso en todos los hosts.
  
  Para evitar el riesgo de falta de disponibilidad de datos al utilizar Sin acción al mismo tiempo en varios hosts, y después de reiniciar varios hosts, consulte este artículo de la base de conocimientos de VMware: https://kb.vmware.com/s/article/60424. Para realizar un reinicio simultáneo de todos los hosts del clúster mediante una herramienta integrada, consulte este artículo de la base de conocimientos de VMware: https://kb.vmware.com/s/article/70650.
11. Después de que todos los hosts hayan entrado correctamente en el modo de mantenimiento, realice las tareas de mantenimiento necesarias y apague los hosts.
Reinicie el clúster de vSAN.
1. Encienda los hosts ESXi.
  Encienda el cuadro físico en el que está instalado ESXi. El host de ESXi se inicia, busca las máquinas virtuales correspondientes y funciona con normalidad.
  
  Si algún host no se reinician, deberá recuperarlo de forma manual o moverlo fuera del clúster de vSAN.
2. Cuando todos los hosts vuelvan a encenderse, salga del modo de mantenimiento en todos los hosts. Si vCenter Server está apagado, use el siguiente comando en los hosts de ESXi para salir del modo de mantenimiento.
```
esxcli system maintenanceMode set -e false
```
  Realice este paso en todos los hosts.
3. Inicie sesión en uno de los hosts del clúster que no sean el host testigo.
4. Ejecute el siguiente comando solo en ese host. Si ejecuta el comando en varios hosts a la vez, puede provocar que una condición de carrera cause resultados inesperados.
```
python /usr/lib/vmware/vsan/bin/reboot_helper.py recover
```
  El comando devuelve e imprime lo siguiente:
  El reinicio o encendido del clúster se completó correctamente.
5. Compruebe que todos los hosts estén disponibles en el clúster ejecutando el siguiente comando en cada host.
```
esxcli vsan cluster get
```
6. Habilite las actualizaciones de miembros del clúster desde vCenter Server ejecutando el siguiente comando en los hosts de ESXi del clúster. Asegúrese de ejecutar el siguiente comando en todos los hosts.
```
esxcfg-advcfg -s 0 /VSAN/IgnoreClusterMemberListUpdates
```
7. Reinicie la máquina virtual de vCenter Server si está apagada. Espere a que la máquina virtual de vCenter Server se encienda y se ejecute. Para desactivar el modo de retirada de vCLS, consulte el artículo de la base de conocimiento de VMware en https://kb.vmware.com/s/article/80472.
8. Compruebe que todos los hosts estén disponibles en el clúster de vSAN ejecutando el siguiente comando en cada host.
```
esxcli vsan cluster get
```
9. Reinicie las máquinas virtuales restantes a través de vCenter Server.
10. Compruebe vSAN Skyline Health y resuelva los problemas pendientes.
11. (Opcional) Habilite el servicio de archivos de vSAN.
12. (Opcional) Si el clúster de vSAN tiene habilitada Disponibilidad de vSphere, debe reiniciar manualmente Disponibilidad de vSphere para evitar el siguiente error: No se puede encontrar el agente principal de vSphere HA.
  Para reiniciar de forma manual Disponibilidad de vSphere, seleccione el clúster de vSAN y acceda a:
  1. Configurar > Servicios > Disponibilidad de vSphere > EDITAR > Deshabilitar vSphere HA
  2. Configurar > Servicios > Disponibilidad de vSphere > EDITAR > Habilitar vSphere HA
Si hay hosts desconectados o en mal estado en el clúster, recupere o quite los hosts del clúster de vSAN. Si vCenter Server utiliza máquinas virtuales de servicio como DNS o Active Directory, márquelas como máquinas virtuales excepcionales en el asistente Apagar clúster.
Vuelva a intentar los comandos anteriores solo después de que vSAN Skyline Health muestre todos los hosts disponibles en estado verde.
Si tiene un clúster de vSAN de tres nodos, el comando reboot_helper.py recover no puede funcionar en una situación de error de un host. Como administrador, haga lo siguiente:
1. Quite temporalmente la información del host de error de la lista de agentes de unidifusión.
2. Agregue el host después de ejecutar el siguiente comando.
```
reboot_helper.py recover
```
A continuación, se muestran los comandos para quitar y agregar el host a un clúster de vSAN:
```
#esxcli vsan cluster unicastagent remove -a <IP Address> -t node -u <NodeUuid>
```
```
#esxcli vsan cluster unicastagent add -t node -u <NodeUuid> -U true -a <IP Address> -p 12321
```

Qué hacer a continuación

Reinicie el clúster de vSAN. Consulte Reiniciar el clúster de vSAN.