Failover de Máquina Virtual Tolerante a Falhas

Uma VM primária ou secundária pode falhar mesmo que seu host ESXi não tenha travado. Nesses casos, a execução da máquina virtual não é interrompida, mas a redundância é temporariamente perdida. Para evitar esse tipo de failover, esteja ciente de algumas das situações em que ele pode ocorrer e tome medidas para evitá-las.

Falha parcial de hardware relacionada ao armazenamento

Esse problema pode surgir quando o acesso ao armazenamento é lento ou inativo para um dos hosts. Quando isso ocorre, há muitos erros de armazenamento listados no log do VMkernel. Para resolver esse problema, você deve resolver seus problemas relacionados ao armazenamento.

Falha parcial de hardware relacionada à rede

Se a NIC de registro em log não estiver funcionando ou as conexões com outros hosts através dessa NIC estiverem inativas, isso pode disparar uma máquina virtual tolerante a falhas para que a redundância possa ser restabelecida. Para evitar esse problema, dedique um NIC separado para o tráfego de log do vMotion e do FT e realize migrações do vMotion somente quando as máquinas virtuais estiverem menos ativas.

Largura de banda insuficiente na rede NIC de registro em log

Isso pode acontecer devido ao excesso de máquinas virtuais tolerantes a falhas em um host. Para resolver esse problema, distribua mais amplamente pares de máquinas virtuais tolerantes a falhas em diferentes hosts.

Use uma rede de log de 10 Gbit para FT e verifique se a rede é de baixa latência.

Falhas do vMotion devido ao nível de atividade da máquina virtual

Se a migração do vMotion de uma máquina virtual tolerante a falhas falhar, talvez seja necessário fazer o failover da máquina virtual. Normalmente, isso ocorre quando a máquina virtual está muito ativa para que a migração seja concluída com apenas uma interrupção mínima da atividade. Para evitar esse problema, realize migrações do vMotion somente quando as máquinas virtuais estiverem menos ativas.

Excesso de atividade no volume VMFS pode levar a failovers da máquina virtual

Quando uma série de operações de bloqueio do sistema de arquivos, inicialização, desligamento da máquina virtual ou migrações do vMotion ocorrem em um único volume VMFS, isso pode acionar o failover de máquinas virtuais tolerantes a falhas. Um sintoma de que isso pode estar ocorrendo é o recebimento de muitos avisos sobre reservas de SCSI no log do VMkernel. Para resolver esse problema, reduza o número de operações do sistema de arquivos ou garanta que a máquina virtual tolerante a falhas esteja em um volume VMFS que não tenha muitas outras máquinas virtuais sendo regularmente ligadas, desligadas ou migradas usando o vMotion.

A falta de espaço no sistema de arquivos impede a inicialização da VM secundária

Verifique se os sistemas de arquivos / (root) ou / vmfs / datasource têm espaço disponível. Esses sistemas de arquivos podem ficar cheios por vários motivos, e a falta de espaço pode impedir que você seja capaz de iniciar uma nova VM Secundária.