Você pode encerrar manualmente todo o cluster vSAN para realizar manutenção ou solução de problemas.
Use o assistente Desligar Cluster, a menos que seu fluxo de trabalho exija um desligamento manual. Ao encerrar manualmente o cluster vSAN, não desative o vSAN no cluster.
Observação: Se você tiver um ambiente vSphere with Tanzu, deverá seguir a ordem especificada ao encerrar ou inicializar os componentes. Para obter mais informações, consulte "Encerramento e inicialização de VMware Cloud Foundation" no
VMware Cloud FoundationGuia de Operações.
Procedimento
- Encerre o cluster vSAN.
- Verifique a integridade do vSAN Skyline para confirmar se o cluster está íntegro.
- Desligue todas as máquinas virtuais (VMs) em execução no cluster vSAN, se vCenter Server não estiver hospedado no cluster. Se vCenter Server estiver hospedado no cluster vSAN, não desligue a VM vCenter Server ou as VMs de serviço (como DNS, Active Directory) usadas por vCenter Server. Se o serviço de arquivos estiver ativado no cluster vSAN, não desligue a VM "vSAN Nó de Serviço de Arquivo (x)".
- Clique na guia Configurar (Configure) e desative o HA. Como resultado, o cluster não registra desligamentos do host como falhas.
Para o vSphere 7.0 U1 e posterior, ative o modo de retirada do vCLS. Para obter mais informações, consulte o artigo da base de conhecimento VMware em https://kb.vmware.com/s/article/80472.
- Verifique se todas as tarefas de ressincronização foram concluídas.
Clique na guia Monitor e selecione vSAN > Ressincronizando objetos (Resyncing Objects).
- Se vCenter Server estiver hospedado no cluster vSAN, desligue a VM vCenter Server.
Anote o host que executa a VM vCenter Server. É o host em que você deve reiniciar a VM vCenter Server.
- Desative as atualizações de membros do cluster de vCenter Server executando o seguinte comando nos hosts ESXi no cluster. Certifique-se de executar o seguinte comando em todos os hosts.
esxcfg-advcfg -s 1 /VSAN/IgnoreClusterMemberListUpdates
- Faça login em qualquer host no cluster que não seja o host testemunha.
- Execute o seguinte comando somente nesse host. Se você executar o comando em vários hosts simultaneamente, isso poderá causar uma condição de corrida, causando resultados inesperados.
python /usr/lib/vmware/vsan/bin/reboot_helper.py prepare
O comando retorna e imprime o seguinte:
A preparação do cluster foi concluída.Observação:- O cluster é totalmente particionado após a conclusão bem-sucedida do comando.
- Se você encontrar um erro, resolva o problema com base na mensagem de erro e tente ativar o modo de retirada do vCLS novamente.
- Se houver hosts não íntegros ou desconectados no cluster, remova os hosts e repita o comando.
- Coloque todos os hosts no modo de manutenção com Sem ação (No Action). Se o vCenter Server estiver desligado, use o seguinte comando para colocar os hosts ESXi no modo de manutenção com Sem ação (No Action).
esxcli system maintenanceMode set -e true -m noAction
Execute esta etapa em todos os hosts.Para evitar o risco de indisponibilidade de dados ao usar Sem ação (No Action) ao mesmo tempo em vários hosts, seguido por uma reinicialização de vários hosts, consulte o artigo da base de conhecimento VMware em https://kb .vmware.com/s/article/60424. Para executar a reinicialização simultânea de todos os hosts no cluster usando uma ferramenta integrada, consulte o VMware artigo da base de conhecimento em https://kb.vmware.com/s/article/70650. - Depois que todos os hosts tiverem entrado no modo de manutenção com êxito, realize as tarefas de manutenção necessárias e desligue os hosts.
- Reinicie o cluster vSAN.
- Ligue os hosts ESXi.
Ligue a caixa física em que o ESXi está instalado. O host ESXi é iniciado, localiza as VMs e funciona normalmente.Se algum host falhar ao reiniciar, você deverá recuperá-los manualmente ou mover os hosts defeituosos para fora do cluster vSAN.
- Quando todos os hosts estiverem novamente após a ativação, saia de todos os hosts do modo de manutenção. Se o vCenter Server estiver desligado, use o seguinte comando nos hosts ESXi para sair do modo de manutenção.
esxcli system maintenanceMode set -e false
Execute esta etapa em todos os hosts. - Faça login em um dos hosts no cluster que não seja o host testemunha.
- Execute o seguinte comando somente nesse host. Se você executar o comando em vários hosts simultaneamente, isso poderá causar uma condição de corrida, causando resultados inesperados.
python /usr/lib/vmware/vsan/bin/reboot_helper.py recover
O comando retorna e imprime o seguinte:
A reinicialização/ligação do cluster foi concluída com êxito! - Verifique se todos os hosts estão disponíveis no cluster executando o seguinte comando em cada host.
esxcli vsan cluster get
- Habilite as atualizações de membros de cluster de vCenter Server executando o seguinte comando nos hosts ESXi no cluster. Certifique-se de executar o seguinte comando em todos os hosts.
esxcfg-advcfg -s 0 /VSAN/IgnoreClusterMemberListUpdates
- Reinicie a VM vCenter Server se ela estiver desligada. Aguarde até que a VM vCenter Server seja ligada e em execução. Para desativar o modo de retirada do vCLS, consulte o artigo da base de conhecimento VMware em https://kb.vmware.com/s/article/80472.
- Verifique novamente se todos os hosts estão participando do cluster vSAN executando o seguinte comando em cada host.
esxcli vsan cluster get
- Reinicie as VMs restantes por meio de vCenter Server.
- Verifique a integridade do vSAN Skyline e resolva quaisquer problemas pendentes.
- (Opcional) Se o cluster vSAN tiver o vSphere Availability ativado, você deverá reiniciar manualmente o vSphere Availability para evitar o seguinte erro: Cannot find vSphere HA master agent.
Para reiniciar manualmente o vSphere Availability, selecione o cluster vSAN e navegue até:
- Configurar (Configure) > Serviços (Services) > vSphere Disponibilidade > EDITAR (EDIT) > Desativar vSphere HA
- Configurar (Configure) > Serviços (Services) > vSphere Disponibilidade > EDITAR (EDIT) > Ativar vSphere HA
- Ligue os hosts ESXi.
- Se houver hosts não íntegros ou desconectados no cluster, recupere ou remova os hosts do cluster vSAN. Se vCenter Server usar VMs de serviço, como DNS ou Active Directory, anote-as como VMs excepcionais no assistente de encerramento do cluster.
Repita os comandos acima somente depois que o vSAN Skyline Health mostrar todos os hosts disponíveis no estado verde.Se você tiver um cluster vSAN de três nós, o comando reboot_helper.py recover não poderá funcionar em uma situação de falha de um host. Como administrador, faça o seguinte:
- Remova temporariamente as informações do host com falha da lista de agentes de unicast.
- Adicione o host depois de executar o seguinte comando.
reboot_helper.py recover
A seguir estão os comandos para remover e adicionar o host a um cluster vSAN:#esxcli vsan cluster unicastagent remove -a <IP Address> -t node -u <NodeUuid>
#esxcli vsan cluster unicastagent add -t node -u <NodeUuid> -U true -a <IP Address> -p 12321