Arresto e riavvio manuali del cluster vSAN

È possibile arrestare manualmente l'intero cluster vSAN per eseguire operazioni di manutenzione o risoluzione dei problemi.

Utilizzare la procedura guidata Arresta cluster, a meno che il workflow non richieda un arresto manuale. Quando si arresta manualmente il cluster di vSAN, non disattivare vSAN nel cluster.

Nota: Se si dispone di un ambiente di vSphere with Tanzu, è necessario seguire l'ordine specificato quando si arresta o si avviano i componenti. Per ulteriori informazioni, vedere "Arresto e avvio di VMware Cloud Foundation" nella guida operativa di VMware Cloud Foundation.

Procedura

Arrestare il cluster vSAN.
1. Controllare vSAN Skyline Health per verificare che il cluster sia integro.
2. Spegnere tutte le macchine virtuali in esecuzione nel cluster di vSAN se vCenter Server non è ospitato nel cluster. Se vCenter Server è ospitato nel cluster di vSAN, non spegnere la macchina virtuale di vCenter Server o le macchine virtuali dei servizi (ad esempio DNS, Active Directory) utilizzate da vCenter Server.
3. Se il servizio file di vSAN è abilitato nel cluster vSAN, è necessario disattivarlo. Se si disattiva il servizio file di vSAN, viene rimosso il dominio del servizio file vuoto. Se si desidera che il dominio del servizio file vuoto rimanga dopo il riavvio del cluster vSAN, è necessario creare una condivisione file NFS o SMB prima di disattivare il servizio file di vSAN.
4. Fare clic sulla scheda Configura e disattivare HA. In questo modo, il cluster non registra gli arresti degli host come errori.
  
  Per vSphere 7.0 U1 e versioni successive, abilitare la modalità di ritiro di vCLS. Per ulteriori informazioni, consultare l'articolo della Knowledge Base di VMware all'indirizzo https://kb.vmware.com/s/article/80472.
5. Verificare che tutte le attività di risincronizzazione siano state completate.
  Fare clic sulla scheda Monitora e selezionare vSAN > Risincronizzazione degli oggetti.
6. Se vCenter Server è ospitato nel cluster vSAN, spegnere la macchina virtuale di vCenter Server.
  Prendere nota dell'host che esegue la macchina virtuale di vCenter Server. Si tratta dell'host in cui è necessario riavviare la macchina virtuale di vCenter Server.
7. Disattivare gli aggiornamenti dei membri del cluster da vCenter Server eseguendo il comando seguente negli host ESXi del cluster. Assicurarsi di eseguire il comando seguente in tutti gli host.
```
esxcfg-advcfg -s 1 /VSAN/IgnoreClusterMemberListUpdates
```
8. Accedere a un host qualsiasi nel cluster che non sia l'host witness.
9. Eseguire il comando seguente solo in tale host. Se il comando viene eseguito in più host contemporaneamente, può causare una race condition che genera risultati imprevisti.
```
python /usr/lib/vmware/vsan/bin/reboot_helper.py prepare
```
  Il comando restituisce e stampa quanto segue:
  Preparazione del cluster completata.
  Nota:
  - Dopo il completamento del comando, il cluster è completamente partizionato.
  - Se si verifica un errore, risolvere il problema in base al messaggio di errore e provare ad abilitare nuovamente la modalità di ritiro di vCLS.
  - Se nel cluster sono presenti host non integri o disconnessi, rimuoverli e riprovare il comando.
10. Attivare la modalità di manutenzione per tutti gli host con Nessuna azione. Se vCenter Server è spento, utilizzare il comando seguente per attivare la modalità di manutenzione degli host ESXi con Nessuna azione.
```
esxcli system maintenanceMode set -e true -m noAction
```
  Eseguire questo passaggio in tutti gli host.
  
  Per evitare il rischio di indisponibilità dei dati quando si utilizza l'opzione Nessuna azione contemporaneamente in più host, seguita da un riavvio di più host, vedere l'articolo della knowledge Base di VMware all'indirizzo https://kb.vmware.com/s/article/60424. Per eseguire il riavvio simultaneo di tutti gli host del cluster utilizzando uno strumento integrato, vedere l'articolo della Knowledge Base di VMware all'indirizzo https://kb.vmware.com/s/article/70650.
11. Dopo l'attivazione della modalità di manutenzione per tutti gli host, eseguire le attività di manutenzione necessarie e spegnere gli host.
Riavviare il cluster vSAN.
1. Accendere gli host ESXi.
  Accendere la casella fisica in cui è installato ESXi. L'host ESXi viene avviato, individua le macchine virtuali e funziona normalmente.
  
  Se qualche host non viene riavviato, è necessario ripristinarlo manualmente o spostarlo di fuori del cluster vSAN.
2. Quando tutti gli host sono di nuovo attivi dopo l'accensione, disattivare la modalità di manutenzione per tutti gli host. Se vCenter Server è spento, utilizzare il comando seguente negli host ESXi per uscire dalla modalità di manutenzione.
```
esxcli system maintenanceMode set -e false
```
  Eseguire questo passaggio in tutti gli host.
3. Accedere a uno degli host nel cluster che non sia l'host witness.
4. Eseguire il comando seguente solo in tale host. Se il comando viene eseguito in più host contemporaneamente, può causare una race condition che genera risultati imprevisti.
```
python /usr/lib/vmware/vsan/bin/reboot_helper.py recover
```
  Il comando restituisce e stampa quanto segue:
  Riavvio/accensione del cluster completato correttamente.
5. Verificare che tutti gli host siano disponibili nel cluster eseguendo il comando seguente in ogni host.
```
esxcli vsan cluster get
```
6. Abilitare gli aggiornamenti dei membri del cluster da vCenter Server eseguendo il comando seguente negli host ESXi del cluster. Assicurarsi di eseguire il comando seguente in tutti gli host.
```
esxcfg-advcfg -s 0 /VSAN/IgnoreClusterMemberListUpdates
```
7. Riavviare la macchina virtuale di vCenter Server se è spenta. Attendere che la macchina virtuale di vCenter Server sia accesa e in esecuzione. Per disattivare la modalità di ritiro di vCLS, vedere l'articolo della Knowledge Base di VMware all'indirizzo https://kb.vmware.com/s/article/80472.
8. Verificare nuovamente che tutti gli host facciano parte del cluster vSAN eseguendo il comando seguente in ogni host.
```
esxcli vsan cluster get
```
9. Riavviare le macchine virtuali rimanenti tramite vCenter Server.
10. Controllare vSAN Skyline Health e risolvere eventuali problemi in sospeso.
11. (Facoltativo) Abilitare il servizio file di vSAN.
12. (Facoltativo) Se nel cluster vSAN è abilitata l'opzione Disponibilità vSphere, è necessario riavviare manualmente Disponibilità vSphere per evitare il seguente errore: Impossibile trovare l'agente master vSphere HA.
  Per riavviare manualmente Disponibilità vSphere, selezionare il cluster vSAN e passare a:
  1. Configura > Servizi > Disponibilità vSphere > MODIFICA > Disabilita vSphere HA
  2. Configura > Servizi > Disponibilità vSphere > MODIFICA > Abilita vSphere HA
Se nel cluster sono presenti host non integri o disconnessi, ripristinarli o rimuoverli dal cluster vSAN. vCenter Server utilizza macchine virtuali di servizio come DNS o Active Directory. Si tenga presente che si tratta di macchine virtuali eccezionali nella procedura guidata di arresto del cluster.
Provare a eseguire nuovamente i comandi precedenti solo dopo che in vSAN Skyline Health tutti gli host disponibili sono visualizzati con lo stato verde.
Se si dispone di un cluster vSAN a tre nodi, il comando reboot_helper.py recover non può funzionare se si verifica un errore in un host. In qualità di amministratore, eseguire le operazioni seguenti:
1. Rimuovere temporaneamente le informazioni dell'host con l'errore dall'elenco di agenti unicast.
2. Aggiungere l'host dopo aver eseguito il comando seguente.
```
reboot_helper.py recover
```
I comandi seguenti consentono di rimuovere e aggiungere l'host in un cluster vSAN:
```
#esxcli vsan cluster unicastagent remove -a <IP Address> -t node -u <NodeUuid>
```
```
#esxcli vsan cluster unicastagent add -t node -u <NodeUuid> -U true -a <IP Address> -p 12321
```

Operazioni successive

Riavviare il cluster di vSAN. Vedere Riavvio del cluster vSAN.