High Availability (HA) garantit que les services fournis par les dispositifs NSX Edge sont disponibles même lorsqu'une défaillance matérielle ou logicielle rend un dispositif non disponible. NSX Edge HA limite le temps d'interruption de basculement au lieu de n'en fournir aucun, car le basculement entre les dispositifs peut nécessiter le redémarrage de certains services.
Par exemple, NSX Edge HA synchronise le dispositif de suivi de connexion du pare-feu avec état ou les informations avec état détenues par l'équilibrage de charge. Le temps requis pour la sauvegarde de tous les services n'est pas nul. Des exemples d'impacts connus de redémarrage de service incluent un temps d'interruption non nul avec un routage dynamique lorsqu'un dispositif NSX Edge fonctionne en tant que routeur.
Parfois, les deux dispositifs NSX Edge HA ne peuvent pas communiquer et ils décident unilatéralement de s'activer. Ce comportement est censé maintenir la disponibilité des services NSX Edge actifs si le dispositif NSX Edge en veille n'est pas disponible. Si l'autre dispositif existe toujours, lorsque la communication est rétablie, les deux dispositifs NSX Edge HA renégocient l'état actif et en veille. Si cette négociation ne se termine pas et si les deux dispositifs déclarent qu'ils sont actifs lorsque la connectivité est rétablie, un comportement inattendu est observé. Cette condition, connue sous le nom Split-brain, est observée en raison des conditions environnementales suivantes :
- Problèmes de connectivité du réseau physique, notamment une partition de réseau.
- Contention de CPU ou de mémoire sur le dispositif NSX Edge.
- Problèmes de stockage éphémères pouvant entraîner la non-disponibilité d'au moins une VM NSX Edge HA.
Par exemple, une amélioration de la stabilité de NSX Edge HA et des performances est observée lorsque les VM sont déplacées à partir d'un stockage surprovisionné. En particulier, lors d'importantes sauvegardes nocturnes, de grands pics dans la latence de stockage peuvent affecter la stabilité de NSX Edge HA.
- Congestion sur l'adaptateur réseau physique ou virtuel impliqué dans l'échange de paquets.
En plus des problèmes environnementaux, une condition Split-brain est observée lorsque le moteur de configuration HA passe dans un mauvais état ou lorsque le démon HA échoue.
Haute disponibilité avec état
Le dispositif NSX Edge principal est dans l'état actif et le dispositif secondaire est dans l'état de veille. NSX Manager réplique la configuration du dispositif principal pour le dispositif en veille ou vous pouvez ajouter manuellement deux dispositifs. Créez le dispositif principal et le dispositif secondaire sur des banques de données et des pools de ressources distincts. Si vous créez le dispositif principal et le dispositif secondaire sur la même banque de données, celle-ci doit être partagée entre tous les hôtes du cluster pour que la paire de dispositifs HA soit déployée sur des hôtes ESXi différents. Si la banque de données est un stockage local, les deux machines virtuelles sont déployées sur le même hôte.
Tous les services NSX Edge s'exécutent sur le dispositif actif. Le dispositif principal maintient un signal de pulsation avec le dispositif en veille et envoie les mises à jour du service via une interface interne.
Si le dispositif principal n'émet pas de signal de pulsation dans l'intervalle de temps spécifié (la valeur par défaut est 15 secondes), le dispositif principal est déclaré inactif. Le dispositif en veille passe à l'état actif, reprend la configuration d'interface du dispositif principal et démarre les services NSX Edge qui étaient en cours d'exécution sur le dispositif principal. Au moment de la commutation, un événement système s'affiche dans l'onglet Événements système (System Events) de la fenêtre Paramètres et rapports. Étant donné que les services Équilibrage de charge et VPN doivent rétablir la connexion TCP avec NSX Edge, le service est brièvement perturbé. Les connexions de commutateur logique et les sessions de pare-feu sont synchronisées entre les dispositifs principaux et en veille. Toutefois, le service est interrompu au moment du basculement lorsque le dispositif en veille s'active et prend le relais.
Si le dispositif NSX Edge échoue et si un mauvais état est signalé, HA force la synchronisation du dispositif qui a échoué pour le relancer. Une fois celui-ci relancé, HA se charge de configurer le dispositif désormais actif et reste à l'état de veille. Si le dispositif NSX Edge est inactif, vous devez le supprimer et en ajouter un nouveau.
NSX Edge fait en sorte que les deux machines virtuelles NSX Edge HA ne se trouvent pas sur le même hôte ESXi, même après que vous avez utilisé DRS et vMotion (sauf si vous les migrez manuellement avec vMotion sur le même hôte). Deux machines virtuelles sont déployées sur vCenter dans le même pool de ressources et la même banque de données que le dispositif que vous avez configuré. Des adresses IP de liens locaux sont attribuées aux machines virtuelles HA dans NSX Edge HA pour que ces dernières puissent communiquer. Vous pouvez indiquer des adresses IP de gestion pour remplacer les liens locaux.
Si des serveurs Syslog sont configurés, les journaux sur le dispositif actif sont envoyés aux serveurs Syslog.
Haute disponibilité dans un environnement cross-vCenter NSX
Si vous activez la haute disponibilité sur un dispositif NSX Edge dans un environnement cross-vCenter NSX, les dispositifs NSX Edge Appliance actifs et en veille doivent résider sur le même serveur vCenter Server. Si vous migrez un des dispositifs d'une paire NSX Edge HA vers un serveur vCenter Server différent, les deux dispositifs HA ne fonctionnent plus comme une paire HA, et vous pouvez rencontrer une interruption du trafic.
vSphere High Availability
NSX Edge HA est compatible avec vSphere HA. Si l'hôte exécutant une instance de NSX Edge devient inactif, le dispositif NSX Edge est relancé sur l'hôte en veille, garantissant ainsi la disponibilité de la paire NSX Edge HA pour permettre un autre basculement.
Si vSphere HA n'est pas activé, la paire NSX Edge HA en veille active survivra à un basculement. Cependant, si un autre basculement se produit avant la restauration de la seconde paire HA, la disponibilité de NSX Edge peut être compromise.
Pour plus d'informations sur vSphere HA, reportez-vous à Disponibilité vSphere.