Recuperar-se de uma falha de célula primária do dispositivo do VMware Cloud Director em um cluster de alta disponibilidade

Se a célula primária não estiver funcionando corretamente, para recuperar o banco de dados do VMware Cloud Director, uma das células em espera deverá se tornar a nova célula primária e você deverá implantar uma nova em espera. Dependendo do modo de falha, o dispositivo do VMware Cloud Director promove automaticamente uma célula em espera como a nova primária ou você deve promovê-la manualmente.

Dependendo do modo de failover do dispositivo VMware Cloud Director, existem dois fluxos de trabalho diferentes para a recuperação de uma falha de célula primária. Você pode usar esses fluxos de trabalho para reutilizar os endereços IP e o nome do host da célula primária com falha ao implantar a nova célula em espera.

Fluxo de trabalho de recuperação para o modo de failover manual

Se a célula primária estiver no estado Not reachable ou Failed, e as duas células em espera estiverem no estado Running, você poderá se recuperar da falha usando a interface de usuário HTML5 do dispositivo e a API do dispositivo VMware Cloud Director.

Para exibir o estado das células no cluster, consulte Visualizar a integridade do cluster e o modo de failover do seu dispositivo do VMware Cloud Director.

Se possível, usando a ferramenta de gerenciamento de células, encerre o processo VMware Cloud Director. Na célula primária com falha, execute o seguinte comando
```
/opt/vmware/vcloud-director/bin/cell-management-tool  -u <sysadmin user> cell --shutdown
```
Desligue a VM primária com falha.
Promova uma célula em espera para se tornar a nova primária.
1. Faça login como raiz na UI de gerenciamento de dispositivos de uma célula em espera em execução, https://standby_ip_address:5480.
2. Na coluna Função para a célula em espera que você deseja que se torne a nova célula primária, clique em Promover.
A UI de gerenciamento mostra duas células com a função primária. A primária original tem um status com falha e a nova primária tem um status em execução. A integridade do cluster é Degradado.
Em qualquer célula diferente da primária com falha, usando o método Unregister da API do dispositivo, remova o dispositivo primário com falha do cluster de alta disponibilidade repmgr. Consulte a documentação da API do dispositivo do VMware Cloud Director.
Remova o dispositivo principal com falha do grupo de servidores do VMware Cloud Director.
1. Faça login como administrador no Service Provider Admin Portal.
2. No painel de navegação esquerdo primário, selecione Recursos e, na barra de navegação superior da página, selecione Recursos de Nuvem.
3. No painel de navegação esquerdo secundário, clique em Células da Nuvem.
4. Selecione a célula inativa e clique em Cancelar registro.
Se quiser reutilizar o endereço IP e o nome de host da célula primária com falha, certifique-se de que o dispositivo primário com falha permaneça desligado ou use o vSphere Client para excluí-lo.
Implante um novo appliance em espera. Você pode implantar o dispositivo do usando o vSphere Client ou pode implantar o dispositivo usando a VMware OVF Tool.
Após a implantação da nova célula em espera, o estado do cluster deve ser Íntegro.
Se o modo FIPS do dispositivo VMware Cloud Director estava ativo antes da restauração, você deve defini-lo novamente usando a API do dispositivo VMware Cloud Director.
O modo FIPS da célula é restaurado automaticamente.

Fluxo de trabalho de recuperação para o modo de failover automático

Se a primária estiver no estado Failed, o VMware Cloud Director promoverá automaticamente uma célula em espera como a nova primária em execução, mas o cluster estará no estado Degradado, pois há apenas uma célula em espera em execução. Você poderá se recuperar da falha usando a interface de usuário do HTML5 e a API do dispositivo do VMware Cloud Director.

Para exibir o estado das células no cluster, consulte Visualizar a integridade do cluster e o modo de failover do seu dispositivo do VMware Cloud Director.

Se possível, usando a ferramenta de gerenciamento de células, encerre o processo VMware Cloud Director. Na célula primária com falha, execute o seguinte comando
```
/opt/vmware/vcloud-director/bin/cell-management-tool  -u <sysadmin user> cell --shutdown
```
Desligue a VM primária com falha.
A UI de gerenciamento mostra duas células com a função primária. A primária original tem um status com falha e a nova primária tem um status em execução. A integridade do cluster é Degradado.
Em qualquer célula diferente da primária com falha, usando o método Unregister da API do dispositivo, remova o dispositivo primário com falha do cluster de alta disponibilidade repmgr. Consulte a documentação da API do dispositivo do VMware Cloud Director.
Remova o dispositivo principal com falha do grupo de servidores do VMware Cloud Director.
1. Faça login como administrador no Service Provider Admin Portal.
2. No painel de navegação esquerdo primário, selecione Recursos e, na barra de navegação superior da página, selecione Recursos de Nuvem.
3. No painel de navegação esquerdo secundário, clique em Células da Nuvem.
4. Selecione a célula inativa e clique em Cancelar registro.
Se quiser reutilizar o endereço IP e o nome de host da célula primária com falha, certifique-se de que o dispositivo primário com falha esteja desligado ou use o vSphere Client para excluí-lo.
Implante um novo appliance em espera. Você pode implantar o dispositivo do usando o vSphere Client ou pode implantar o dispositivo usando a VMware OVF Tool. Após a implantação da nova célula em espera, o estado do cluster deve ser Íntegro.
Em qualquer célula diferente da célula primária com falha, use o método Failover da API do dispositivo para redefinir o modo de failover do cluster como Automatic. Consulte a documentação da API do dispositivo do VMware Cloud Director.
Se o modo FIPS do dispositivo VMware Cloud Director estava ativo antes da restauração, você deve defini-lo novamente usando a API do dispositivo VMware Cloud Director.
O modo FIPS da célula é restaurado automaticamente.