VMware Aria Operations prend en charge la haute disponibilité (HA). La haute disponibilité (HA) crée un nœud de réplica pour le nœud principal VMware Aria Operations et protège le cluster d'analyse contre la perte d'un nœud.
Avec la haute disponibilité (HA), les données stockées sur le nœud principal sont toujours sauvegardées à 100 % sur le nœud de réplica. Pour activer la haute disponibilité, vous devez avoir au moins un nœud de données déployé, en plus du nœud principal. Si vous disposez de plusieurs nœuds de données, les données stockées dans le nœud principal peuvent être stockées et répliquées dans n'importe quel autre nœud. Toutefois, si le nœud principal échoue, seul le nœud de réplica peut fonctionner en remplacement du nœud principal.
- HA n'est pas un mécanisme de récupération d'urgence. HA protège le cluster d'analyse contre la perte d'un seul nœud. De ce fait, vous ne pouvez pas étendre les nœuds à travers les clusters vSphere pour tenter d'isoler les nœuds ou construire des zones de défaillance.
- Lorsque la haute disponibilité est activée, le réplica peut prendre le relais de toutes les fonctions assurées par le nœud principal, en cas d'échec de ce dernier. Si le nœud principal échoue, le basculement vers le réplica est automatique et ne nécessite que de deux à trois minutes d'interruption de service de VMware Aria Operations pour reprendre les opérations et redémarrer la collecte de données.
Lorsqu'un nœud principal provoque un basculement, le nœud de réplica devient le nœud principal, et le cluster fonctionne en mode dégradé. Pour sortir du mode dégradé, appliquez l'une des procédures suivantes.
- Revenez au mode HA en corrigeant le problème du nœud principal. Lorsqu'un nœud principal quitte un cluster avec la haute disponibilité activée, sa reconnexion nécessite une intervention manuelle. Par conséquent, vous devez redémarrer le processus VMware Aria Operations Analytics sur le nœud déconnecté. Ainsi, vous pourrez faire passer son rôle à réplica pour qu'il puisse rejoindre le cluster.
- Supprimez le nœud principal ayant échoué, puis réactivez la haute disponibilité en convertissant un nœud de données en réplica. Il est impossible de réparer les nœuds principaux supprimés, puis de les ajouter de nouveau à VMware Aria Operations.
- Supprimez l'ancien nœud principal ayant échoué, puis passez à l'opération non-haute disponibilité en désactivant la HA. Il est impossible de réparer les nœuds principaux supprimés, puis de les ajouter de nouveau à VMware Aria Operations.
- Dans l'interface d'administration, dès qu'un nœud de réplica HA prend le relais et devient le nouveau nœud principal, vous ne pouvez pas supprimer du cluster le nœud principal précédent hors ligne. De plus, le nœud précédent continue à être répertorié en tant que nœud principal. Pour actualiser l'affichage et activer la suppression du nœud, actualisez le navigateur.
- Lorsque la haute disponibilité est activée, le cluster peut surmonter la perte d'un nœud de données sans perdre de données. Toutefois, HA assure la protection contre la perte d'un seul nœud à la fois, quel qu'il soit. En conséquence, la perte simultanée des données et des nœuds principaux/de réplica, ou de deux nœuds de données ou plus, n'est pas prise en charge. Par contre, VMware Aria Operations HA offre une protection supplémentaire des données au niveau des applications pour assurer la disponibilité des applications.
- Lorsque la haute disponibilité est activée, celle-ci diminue de moitié les capacités et les traitements de VMware Aria Operations en créant une copie redondante des données sur l'ensemble du cluster, ainsi qu'une sauvegarde du réplica du nœud principal. Prenez en compte votre utilisation potentielle de HA lors de la planification du nombre et de la taille de vos nœuds de cluster VMware Aria Operations. Reportez-vous à Dimensionnement du cluster VMware Aria Operations.
- Lorsque la haute disponibilité est activée, déployez les nœuds de cluster d'analyse sur des hôtes distincts pour des raisons de redondance et d'isolement. Une possibilité consiste à appliquer des règles d'antiaffanité pour conserver les nœuds sur des hôtes spécifiques sur le cluster vSphere.
Si vous ne pouvez pas conserver des nœuds distincts, vous ne devez pas activer la haute disponibilité. Une défaillance d'un hôte entraînerait la perte de plusieurs nœuds, situation qui n'est pas prise en charge, et VMware Aria Operations deviendrait totalement indisponible.
L'inverse est également vrai. Sans la haute disponibilité, vous pourriez conserver les nœuds sur le même hôte, et il n'y aurait aucune différence. Dans ce cas, la perte d'un seul nœud rendrait VMware Aria Operations totalement indisponible.
- Lorsque le nœud de données est mis hors tension et que les paramètres réseau de la machine virtuelle sont modifiés, cela affecte l'adresse IP du nœud de données. À ce stade, le cluster HA n'est plus accessible et tous les nœuds sont dans l'état « En attente du service d'analyse ». Vérifiez que vous avez utilisé une adresse IP statique.
- Lorsque vous supprimez un nœud ayant un ou plusieurs adaptateurs vCenter configurés pour collecter des données à partir d'un cluster avec haute disponibilité activée, un ou plusieurs de ces adaptateurs cessent de collecter des données. Avant de supprimer le nœud, vous devez donc modifier la configuration des adaptateurs afin de les relier à un autre nœud.
- L'interface utilisateur d'administration affiche le nombre de caches de ressources, qui sont créés uniquement pour les objets actifs, mais l'inventaire affiche tous les objets. Ainsi, lorsque vous supprimez un nœud d'un cluster avec haute disponibilité activée qui permet la collecte de données par des adaptateurs vCenter et que vous rééquilibrez chaque nœud, l'inventaire affiche une quantité d'objets différente de celle indiquée dans l'interface utilisateur d'administration.