Os clusters estendidos estendem o cluster vSAN de um único site de dados para dois sites para um nível mais rápido de disponibilidade e balanceamento de carga entre sites. Os clusters estendidos normalmente são implantados em ambientes em que a distância entre os centros de dados é limitada, como ambientes metropolitanos ou de campus.

Você pode usar clusters estendidos para gerenciar a manutenção planejada e evitar cenários de desastre, pois a manutenção ou a perda de um site não afeta a operação geral do cluster. Em uma configuração de cluster estendido, os dois sites de dados são sites ativos. Se um dos sites falhar, vSAN usará o armazenamento no outro site. vSphere HA reinicia qualquer VM que deva ser reiniciada no site ativo restante.

Você deve designar um site como o site preferencial. O outro site torna-se um site secundário ou não preferencial. Se a conexão de rede entre os dois sites ativos for perdida, vSAN continuará a operação com o site preferencial. O site designado como preferencial normalmente é aquele que permanece em operação, a menos que esteja ressincronizando ou tenha outro problema. O site que leva à disponibilidade máxima de dados é aquele que permanece em operação.

Um cluster estendido vSAN pode tolerar uma falha de link por vez sem que os dados fiquem indisponíveis. Uma falha de link é uma perda de conexão de rede entre os dois sites ou entre um site e o host testemunha. Durante uma falha de site ou perda de conexão de rede, o vSAN alterna automaticamente para sites totalmente funcionais.

vSAN 7.0 Update 3 e os clusters estendidos posteriores podem tolerar uma falha de host testemunha quando um site não está disponível. Configure a política de armazenamento Regra de tolerância a desastres do site como Espelhamento de site - cluster estendido. Se um site estiver inativo devido a manutenção ou falha e o host testemunha falhar, os objetos se tornarão incompatíveis, mas permanecerão acessíveis.

Para obter mais informações sobre como trabalhar com clusters estendidos, consulte o vSANGuia do cluster estendido.

Anfitrião da Testemunha

Cada cluster estendido consiste em dois sites de dados e um host testemunha. O host de testemunha reside em um terceiro site e contém os componentes de testemunha de objetos de máquina virtual. O host testemunha não armazena dados do cliente, apenas metadados, como o tamanho e o UUID do objeto e dos componentes vSAN.

O host testemunha serve como um desempatador quando uma decisão deve ser tomada com relação à disponibilidade dos componentes do armazenamento de dados quando a conexão de rede entre os dois sites é perdida. Nesse caso, o host testemunha normalmente forma um cluster vSAN com o site preferencial. Mas se o site preferencial ficar isolado do site secundário e da testemunha, o host testemunha formará um cluster usando o site secundário. Quando o site preferencial estiver online novamente, os dados serão ressincronizados para garantir que ambos os sites tenham as cópias mais recentes de todos os dados.

Se o host testemunha falhar, todos os objetos correspondentes se tornarão incompatíveis, mas estarão totalmente acessíveis.

O host de testemunha tem as seguintes características:

  • O host testemunha pode usar links de baixa largura de banda/alta latência.
  • O host testemunha não pode executar VMs.
  • Um único host de testemunha pode oferecer suporte a apenas um cluster estendido vSAN. Clusters vSAN de dois nós podem compartilhar um único host testemunha.
  • O host testemunha deve ter um adaptador VMkernel com o tráfego vSAN habilitado, com conexões a todos os hosts no cluster. O host testemunha usa um adaptador VMkernel para gerenciamento e um adaptador VMkernel para tráfego de dados vSAN. O host testemunha pode ter apenas um adaptador VMkernel dedicado a vSAN.
  • O host de testemunha deve ser um host autônomo dedicado ao cluster estendido. Ele não pode ser adicionado a nenhum outro cluster ou movido no inventário por meio de vCenter Server.

O host testemunha pode ser um host físico ou um host ESXi em execução dentro de uma VM. O host de testemunha de VM não fornece outros tipos de funcionalidade, como armazenar ou executar VMs. Vários hosts testemunhas podem ser executados como VMs em um único servidor físico. Para aplicação de patches e configuração básica de rede e monitoramento, o host de testemunha da VM funciona da mesma maneira que um host ESXi típico. Você pode gerenciá-lo com vCenter Server, corrigi-lo e atualizá-lo usando esxcli ou vSphere Lifecycle Manager e monitorá-lo com ferramentas padrão que interagem com hosts ESXi.

Você pode usar um dispositivo virtual testemunha como o host testemunha em um cluster estendido. O dispositivo virtual testemunha é um host ESXi em uma VM, empacotado como um OVF ou OVA. O appliance do está disponível em diferentes opções, com base no tamanho da implantação. Você pode usar um dispositivo virtual testemunha como o host testemunha em um cluster estendido. O dispositivo virtual testemunha é um host ESXi em uma VM, empacotado como um OVF ou OVA. Diferentes dispositivos e opções estão disponíveis, com base na arquitetura vSAN e no tamanho da implantação.

Clusters estendidos e domínios de falha

Os clusters estendidos usam domínios de falha para fornecer redundância e proteção contra falhas nos sites. Cada site em um cluster estendido reside em um domínio de falha separado.

Um cluster estendido requer três domínios de falha: o site preferencial, o site secundário e um host testemunha. Cada domínio de falha representa um site separado. Quando o host testemunha falha ou entra no modo de manutenção, vSAN considera isso uma falha do site.

No vSAN 6.6 e em versões posteriores, você pode fornecer um nível extra de proteção contra falhas local para objetos de máquina virtual em clusters estendidos. Quando você configura um cluster estendido, as seguintes regras de política estão disponíveis para objetos no cluster:
  • Tolerância a desastres do site (Site disaster tolerance). Para clusters estendidos, essa regra define o método de tolerância a falhas. Selecione Espelhamento de site - cluster estendido (Site mirroring - stretched cluster).
  • Falhas de tolerância (FTT). Para clusters estendidos, o FTT define o número de falhas de host adicionais que um objeto de máquina virtual pode tolerar.
  • Nenhum (None). Você pode definir essa regra de localidade de dados como Nenhum, Preferencial ou Secundário. Essa regra permite que você restrinja objetos de máquina virtual a um site selecionado no cluster estendido.d

Em um cluster estendido com proteção contra falhas local, mesmo quando um site não está disponível, o cluster pode realizar reparos em componentes ausentes ou quebrados no site disponível.

vSAN A versão 7.0 e posterior continuará a servir E/S se algum disco ou disco em um site atingir 96% da capacidade total ou 5 GB de capacidade livre (o que for menor), enquanto os discos no outro site tiverem espaço livre disponível. Os componentes no site afetado são marcados como ausentes e vSAN continua a executar E/S para cópias de objetos íntegros no outro site. Quando os discos no disco do site afetado atingem 94 por cento da capacidade ou 10 GB (o que for menor), os componentes ausentes ficam disponíveis. vSAN ressincroniza os componentes disponíveis e todos os objetos se tornam compatíveis com a política.

Considerações sobre o projeto de cluster estendido

Considere estas diretrizes ao trabalhar com um cluster estendido vSAN.

  • Defina as configurações de DRS para o cluster estendido.
    • DRS deve estar ativado no cluster. Se você colocar DRS no modo parcialmente automatizado, poderá controlar quais VMs migrar para cada site. O vSAN 7.0 Update 2 permite que você opere o DRS no modo automático e recupere normalmente de partições de rede.
    • Crie dois grupos de hosts, um para o site preferencial e outro para o site secundário.
    • Crie dois grupos de VMs, um para manter as VMs no site preferido e outro para manter as VMs no site secundário.
    • Crie duas regras de afinidade de Host da VM que mapeiam grupos de VMs para host e especifique quais VMs e hosts residem no site preferencial e quais VMs e hosts residem no site secundário.
    • Configure as regras de afinidade do Host da VM para executar o posicionamento inicial das VMs no cluster.
  • Defina as configurações de alta disponibilidade para o cluster estendido.
    • As configurações de regra de alta disponibilidade devem respeitar as regras de afinidade do Host da VM durante o failover.
    • Desabilite as pulsações do datastore de alta disponibilidade.
    • Use alta disponibilidade com monitoramento de falha de host, controle de admissão e defina FTT como o número de hosts em cada site.
  • Os clusters estendidos exigem o formato em disco 2.0 ou posterior. Se necessário, atualize o formato em disco antes de configurar um cluster estendido. Consulte "Atualizar o formato de disco do vSAN" em Administração do VMware vSAN.
  • Configure o FTT como 1 para clusters estendidos.
  • Os clusters estendidos do vSAN oferecem suporte à ativação de VMs de tolerância a falhas de multiprocessamento simétrico (SMP-FT) quando FTT está definido como Nenhum (None ) com Preferencial ou Secundário. vSAN não é compatível com VMs SMP-FT em um cluster estendido com FTT definido como 1 ou mais.
  • Quando um host está desconectado ou não está respondendo, você não pode adicionar ou remover o host testemunha. Essa limitação garante que vSAN colete informações suficientes de todos os hosts antes de iniciar as operações de reconfiguração.
  • O uso de esxcli para adicionar ou remover hosts não é compatível com clusters estendidos.
  • Não crie snapshots do host testemunha nem faça backup do host testemunha. Se o host testemunha falhar, altere o host testemunha.

Práticas recomendadas para trabalhar com clusters estendidos

Ao trabalhar com vSAN clusters estendidos, siga estas recomendações para obter o desempenho adequado.

  • Se um dos sites (domínios de falha) em um cluster estendido estiver inacessível, novas VMs ainda poderão ser provisionadas no subcluster que contém os outros dois sites. Essas novas VMs são provisionadas à força implicitamente e não são compatíveis até que o site particionado seja reingressado no cluster. Esse provisionamento de força implícito é executado somente quando dois dos três sites estão disponíveis. Um site aqui se refere a um site de dados ou ao host testemunha.
  • Se um site inteiro ficar offline devido a uma queda de energia ou perda de conexão de rede, reinicie o site imediatamente, sem muita demora. Em vez de reiniciar os hosts vSAN um por um, coloque todos os hosts online aproximadamente ao mesmo tempo, de preferência dentro de um intervalo de 10 minutos. Ao seguir esse processo, você evita a ressincronização de uma grande quantidade de dados nos sites.
  • Se um host estiver permanentemente indisponível, remova-o do cluster antes de executar qualquer tarefa de reconfiguração.
  • Se você quiser clonar um host de testemunha de VM para dar suporte a vários clusters estendidos, não configure a VM como um host de testemunha antes de cloná-la. Primeiro, implante a VM do OVF, depois clone a VM e configure cada clone como um host de testemunha para um cluster diferente. Ou você pode implantar quantas VMs precisar do OVF e configurar cada uma como um host de testemunha para um cluster diferente.

Projeto de rede de clusters estendidos

Todos os três sites em um cluster estendido se comunicam pela rede de gerenciamento e pela rede vSAN. As VMs nos dois sites de dados se comunicam por meio de uma rede de máquina virtual comum.

Um cluster estendido vSAN deve atender a determinados requisitos básicos de rede.
  • A rede de gerenciamento requer conectividade entre todos os três locais, usando uma rede estendida de Camada 2 ou uma rede de Camada 3.
  • A rede vSAN requer conectividade entre todos os três sites. Ele deve ter roteamento e conectividade independentes entre os sites de dados e o host testemunha. vSAN é compatível com a Camada 2 e a Camada 3 entre os dois sites de dados, e a Camada 3 entre os sites de dados e o host testemunha.
  • A rede de VMs requer conectividade entre os sites de dados, mas não o host testemunha. Use uma rede estendida de Camada 2 ou uma rede de Camada 3 entre os sites de dados. Em caso de falha, as VMs não exigem um novo endereço IP para funcionar no site remoto.
  • A rede do vMotion requer conectividade entre os sites de dados, mas não o host testemunha. Use uma rede de Camada 2 estendida ou de Camada 3 entre sites de dados.
Observação: vSAN sobre RDMA não é compatível com clusters vSAN estendidos ou de dois nós.

Usando rotas estáticas em hosts ESXi

Se você usar um único gateway padrão em hosts ESXi, cada host ESXi conterá uma pilha TCP/IP padrão que tem um único gateway padrão. A rota padrão normalmente está associada à pilha TCP/IP da rede de gerenciamento.

A rede de gerenciamento e a rede vSAN podem estar isoladas uma da outra. Por exemplo, a rede de gerenciamento pode usar vmk0 na NIC física 0, enquanto a rede vSAN usa vmk2 na NIC física 1 (adaptadores de rede separados para duas pilhas TCP/IP distintas). Essa configuração implica que a rede vSAN não tem gateway padrão.

No vSAN 7.0 e posterior, você pode substituir o gateway padrão para o adaptador VMkernel vSAN em cada host e configurar um endereço de gateway para a rede vSAN.

Você também pode usar rotas estáticas para se comunicar entre redes. Considere uma rede vSAN que é estendida por dois sites de dados em um domínio de transmissão de Camada 2 (por exemplo, 172.10.0.0) e o host testemunha está em outro domínio de transmissão (por exemplo, 172.30.0.0). Se os adaptadores VMkernel em um site de dados tentarem se conectar à rede vSAN no host testemunha, a conexão falhará porque o gateway padrão no host ESXi está associado à rede de gerenciamento. Não há rota da rede de gerenciamento para a rede vSAN.

Defina uma nova entrada de roteamento que indique qual caminho seguir para alcançar uma rede específica. Para uma rede vSAN em um cluster estendido, você pode adicionar rotas estáticas para garantir a comunicação adequada entre todos os hosts.

Por exemplo, você pode adicionar uma rota estática aos hosts em cada site de dados, para que as solicitações para acessar a rede de testemunha 172.30.0.0 sejam roteadas por meio da interface 172.10.0.0. Adicione também uma rota estática ao host testemunha para que as solicitações para acessar a rede 172.10.0.0 para os sites de dados sejam roteadas por meio da interface 172.30.0.0.

Observação: Se você usar rotas estáticas, deverá adicionar manualmente as rotas estáticas para os novos hosts ESXi adicionados a qualquer um dos sites antes que esses hosts possam se comunicar no cluster. Se você substituir o host de testemunha, deverá atualizar a configuração da rota estática.

Use o comando esxcli network ip route para adicionar rotas estáticas.