Uma VM primária ou secundária pode fazer failover, mesmo que seu host ESXi não tenha falhado. Nesses casos, a execução da máquina virtual não é interrompida, mas a redundância é perdida temporariamente. Para evitar esse tipo de failover, esteja ciente de algumas das situações em que ele pode ocorrer e tome medidas para evitá-las.
Falha parcial de hardware relacionada ao armazenamento
Esse problema pode surgir quando o acesso ao armazenamento está lento ou inativo para um dos hosts. Quando isso ocorre, há muitos erros de armazenamento listados no log do VMkernel. Para resolver esse problema, você deve solucionar os problemas relacionados ao armazenamento.
Falha parcial de hardware relacionada à rede
Se a NIC de log não estiver funcionando ou as conexões com outros hosts por meio dessa NIC estiverem inativas, isso poderá acionar o failover de uma máquina virtual tolerante a falhas para que a redundância possa ser restabelecida. Para evitar esse problema, dedique uma NIC separada para cada tráfego de log do vMotion e do FT e realize migrações do vMotion somente quando as máquinas virtuais estiverem menos ativas.
Largura de banda insuficiente na rede NIC de log
Isso pode acontecer devido ao excesso de máquinas virtuais tolerantes a falhas em um host. Para resolver esse problema, distribua de forma mais ampla os pares de máquinas virtuais tolerantes a falhas entre diferentes hosts.
Use uma rede de log de 10 Gbit para FT e verifique se a rede tem baixa latência.
Falhas do vMotion devido ao nível de atividade da máquina virtual
Se a migração do vMotion de uma máquina virtual tolerante a falhas falhar, talvez seja necessário fazer failover da máquina virtual. Normalmente, isso ocorre quando a máquina virtual está muito ativa para que a migração seja concluída com o mínimo de interrupção da atividade. Para evitar esse problema, realize migrações do vMotion somente quando as máquinas virtuais estiverem menos ativas.
Muita atividade no volume VMFS pode levar a failovers de máquina virtual
Quando ocorrem várias operações de bloqueio do sistema de arquivos, ligações, desligamentos ou migrações do vMotion de máquinas virtuais em um único volume VMFS, isso pode acionar o failover de máquinas virtuais tolerantes a falhas. Um sintoma de que isso pode estar ocorrendo é o recebimento de muitos avisos sobre reservas SCSI no log do VMkernel. Para resolver esse problema, reduza o número de operações do sistema de arquivos ou certifique-se de que a máquina virtual tolerante a falhas esteja em um volume VMFS que não tenha muitas outras máquinas virtuais que estão sendo ligadas, desligadas ou migradas regularmente usando vMotion.
A falta de espaço no sistema de arquivos impede a inicialização da VM secundária
Verifique se os sistemas de arquivos /(root) ou /vmfs/datasource têm espaço disponível. Esses sistemas de arquivos podem ficar cheios por vários motivos, e a falta de espaço pode impedir que você possa iniciar uma nova VM secundária.