Présentation des clusters étendus

Les clusters étendus étendent le cluster vSAN d'un site unique à deux sites pour offrir un niveau plus élevé de disponibilité et un équilibrage de charge entre sites. Les clusters étendus sont généralement déployés dans des environnements dans lesquels la distance entre les centres de données est limitée, par exemple les environnements métropolitains ou campus.

Vous pouvez utiliser les clusters étendus pour gérer la maintenance planifiée et éviter les scénarios catastrophes, car la maintenance ou la perte d'un site n'affecte pas le fonctionnement global du cluster. Dans une configuration de cluster étendu, les deux sites sont des sites actifs. Si l'un ou l'autre tombe en panne, vSAN utilise le stockage sur l'autre site. vSphere HA redémarre toute machine virtuelle devant être redémarrée sur le site actif restant.

Vous devez désigner un site comme site préféré. L'autre site devient un site secondaire ou non préféré. Le système utilise le site préféré uniquement en cas de perte de connexion réseau entre les deux sites actifs, afin que celui désigné comme site préféré soit celui qui reste opérationnel.

Un cluster étendu vSAN peut tolérer une panne de liaison sans perte de disponibilité de données. Une panne de liaison est une perte de connexion réseau entre les deux sites ou entre un site et l'hôte témoin. Pendant la panne d'un site ou une perte de connexion réseau, vSAN passe automatiquement aux sites entièrement fonctionnels.

Pour plus d'informations sur l'utilisation de clusters étendus, reportez-vous au guide vSAN Stretched Cluster Guide.

Hôte témoin

Chaque cluster étendu se compose de deux sites et d'un hôte témoin. L'hôte témoin réside sur un troisième site et contient les composants témoins d'objets de machine virtuelle. Il contient uniquement des métadonnées et ne participe pas aux opérations de stockage.

L'hôte témoin sert d'arbitre lorsqu'une décision doit être prise concernant la disponibilité de composants de banque de données lorsque la connexion réseau entre les deux sites est perdue. Dans ce cas, le témoin forme généralement un cluster vSAN avec le site préféré. Mais si le site préféré devient isolé du site secondaire, l'hôte témoin forme un cluster en utilisant le site secondaire. Lorsque le site préféré est de nouveau en ligne, les données sont resynchronisées pour garantir que les deux sites disposent des dernières copies de toutes les données.

Si l'hôte témoin tombe en panne, tous les objets correspondants deviennent non conformes mais sont entièrement accessibles.

L'hôte témoin a les caractéristiques suivantes :

L'hôte témoin peut utiliser des liaisons à faible bande passante/latence élevée.
L'hôte témoin ne peut pas exécuter de machines virtuelles.
Un seul hôte témoin ne peut prendre en charge qu'un seul cluster étendu vSAN.
L'hôte témoin doit disposer d'un adaptateur VMkernel sur lequel le trafic vSAN est activé, avec des connexions à tous les hôtes du cluster. L'hôte témoin utilise un adaptateur VMkernel pour la gestion et un adaptateur VMkernel pour le trafic de données vSAN. L'hôte témoin ne peut avoir qu'un seul adaptateur VMkernel dédié à vSAN.
L'hôte témoin doit être un hôte autonome dédié au cluster étendu. Il ne peut pas être ajouté à un cluster ou déplacé en inventaire par le biais de vCenter Server.

L'hôte témoin peut être un hôte physique ou un hôte ESXi exécuté à l'intérieur d'une machine virtuelle. L'hôte témoin de machine virtuelle ne fournit pas d'autres types de fonctionnalités, telles que le stockage ou l'exécution de machines virtuelles. Plusieurs hôtes témoins peuvent s'exécuter sous forme de machines virtuelles sur un serveur physique unique. Pour la correction et la configuration de base de mise en réseau et de surveillance, l'hôte témoin de machine virtuelle fonctionne de la même manière qu'un hôte ESXi type. Vous pouvez le gérer avec vCenter Server, le corriger et le mettre à jour à l'aide de esxcli ou vSphere Update Manager, et le surveiller avec des outils standard en interaction avec les hôtes ESXi.

Vous pouvez utiliser un dispositif virtuel témoin comme hôte témoin dans un cluster étendu. Le dispositif virtuel témoin est un hôte ESXi dans une machine virtuelle, conditionné comme un OVF ou un OVA. Le dispositif est disponible dans différentes options, en fonction de la taille du déploiement.

Clusters étendus et domaines de pannes

Les clusters étendus fournissent la redondance et la protection contre les pannes entre plusieurs centres de données dans deux lieux géographiques. Les domaines de pannes fournissent la protection contre les pannes de niveau rack à l'intérieur du même site. Chaque site dans un cluster étendu réside dans un domaine de panne distinct.

Un cluster étendu nécessite trois domaines de pannes : le site préféré, le site secondaire et un hôte témoin.

Dans vSAN 6.6 et versions ultérieures, vous pouvez fournir un niveau supplémentaire de protection locale contre les pannes pour les objets de machine virtuelle dans des clusters étendus. Lorsque vous configurez un cluster étendu comportant quatre hôtes ou plus dans chaque site, les règles de stratégie suivantes sont disponibles pour les objets dans le cluster :

Niveau primaire de pannes à tolérer (PFTT). Cette règle définit le nombre de pannes d'hôte et de périphérique qu'un objet de machine virtuelle peut tolérer au sein des deux sites. La valeur par défaut est 1 et la valeur maximale est 3.
Niveau secondaire de pannes à tolérer. Définit le nombre de pannes d'hôte et d'objet qu'un objet de machine virtuelle peut tolérer au sein d'un seul site. La valeur par défaut est 0 et la valeur maximale est 3.
Affinité. Cette règle est uniquement disponible si le Niveau primaire de pannes à tolérer est défini sur 0. Vous pouvez définir la règle d'affinité sur Aucun, Préféré ou Secondaire. Cette règle vous permet de limiter les objets de machine virtuelle à un site sélectionné dans le cluster étendu. La valeur par défaut est Aucun.

Remarque :

Lorsque vous configurez le Niveau secondaire de pannes à tolérer pour le cluster étendu, la règle Méthode de tolérance de panne s'applique au Niveau secondaire de pannes à tolérer. La méthode de tolérance de panne utilisée pour le Niveau primaire de pannes à tolérer (PFTT) est par défaut définie sur RAID 1.

Dans un cluster étendu disposant d'une protection locale contre les pannes, même lorsqu'un site n'est pas disponible, le cluster peut effectuer des réparations sur des composants manquants ou endommagés dans le site disponible.