O host primário de um cluster do VMware vSphere® High Availability é responsável por detectar a falha de hosts secundários. Dependendo do tipo de falha detectada, pode ser necessário fazer failover das máquinas virtuais em execução nos hosts.

Em um cluster vSphere HA, três tipos de falha de host são detectados:

  • Falha. Um host para de funcionar.
  • Isolamento. Um host torna-se isolado da rede.
  • Partição. Um host perde a conectividade de rede com o host primário.

O host primário monitora a atividade dos hosts secundários no cluster. Essa comunicação acontece por meio da troca de pulsações de rede a cada segundo. Quando o host primário para de receber essas pulsações de um host secundário, ele verifica a atividade do host antes de declarar que o host falhou. A verificação de ativação que o host primário executa é para determinar se o host secundário está trocando pulsações com um dos repositórios de dados. Consulte Pulsação do armazenamento de dados. Além disso, o host primário verifica se o host responde aos pings ICMP enviados para seus endereços IP de gerenciamento.

Se um host primário não puder se comunicar diretamente com o agente em um host secundário, o host secundário não responderá aos pings ICMP. Se o agente não estiver emitindo pulsações, ele será visto como com falha. As máquinas virtuais do host são reiniciadas em hosts alternativos. Se esse host secundário estiver trocando pulsações com um armazenamento de dados, o host primário assumirá que o host secundário está em uma partição de rede ou isolado da rede. Portanto, o host primário continua a monitorar o host e suas máquinas virtuais. Consulte Partições de rede.

O isolamento da rede do host ocorre quando um host ainda está em execução, mas não pode mais observar o tráfego de vSphere HA agentes na rede de gerenciamento. Se um host parar de observar esse tráfego, ele tentará executar ping nos endereços de isolamento do cluster. Se esse ping também falhar, o host declara que está isolado da rede.

O host primário monitora as máquinas virtuais que estão sendo executadas em um host isolado. Se o host primário observar que as VMs foram desligadas e o host primário for responsável pelas VMs, ele as reiniciará.

Observação: Se você garantir que a infraestrutura de rede seja suficientemente redundante e que pelo menos um caminho de rede esteja sempre disponível, é menos provável que ocorra o isolamento da rede do host.

Falhas de alta disponibilidade proativas

Uma falha de HA proativo ocorre quando um componente do host falha, o que resulta em perda de redundância ou em uma falha não catastrófica. No entanto, o comportamento funcional das VMs que residem no host ainda não é afetado. Por exemplo, se uma fonte de alimentação no host falhar, mas outras fontes de alimentação estiverem disponíveis, isso será uma falha de alta disponibilidade proativa.

Se ocorrer uma falha de alta disponibilidade proativa, você poderá automatizar a ação de correção realizada na seção vSphere Disponibilidade do vSphere Client. As VMs no host afetado podem ser evacuadas para outros hosts e o host é colocado no modo de Quarentena ou no modo de Manutenção.

Observação: Seu cluster deve usar vSphere DRS para que o monitoramento de falhas de alta disponibilidade proativo funcione.