L'hôte principal d'un cluster VMware vSphere® High Availability est responsable de la détection des pannes des hôtes subordonnés. Selon le type de panne détecté, les machines virtuelles exécutées sur les hôtes peuvent nécessiter un basculement.

Dans un cluster vSphere HA, trois types de pannes d'hôtes sont détectés :

  • Panne : un hôte cesse de fonctionner.

  • Isolation : un hôte se retrouve isolé sur le réseau.

  • Partition : un hôte perd sa connectivité réseau avec l'hôte principal.

L'hôte principal surveille la réactivité des hôtes subordonnés du cluster. Cette communication s'effectue par l'échange, toutes les secondes, de signaux de pulsation réseau. Lorsqu'un hôte principal cesse de recevoir des signaux de pulsation d'un hôte subordonné, il vérifie la réactivité de l'hôte avant de le déclarer défaillant. Le contrôle de réactivité effectué par l'hôte principal permet de déterminer si l'hôte subordonné échange des signaux de pulsation avec une des banques de données. Reportez-vous à Signal de pulsation de banque de données. Par ailleurs, l'hôte principal vérifie si l'hôte répond aux pings ICMP envoyés à ses adresses IP de gestion.

Si un hôte principal ne peut pas communiquer directement avec l'agent sur un hôte subordonné, celui-ci ne répond pas aux commandes ping ICMP. Si l'agent n'émet pas de pulsations, il est considéré comme défaillant. Les machines virtuelles des hôtes sont redémarrées sur d'autres hôtes. Si cet hôte subordonné échange des signaux de pulsation avec une banque de données, l'hôte principal suppose que l'hôte subordonné se trouve dans une partition du réseau ou est isolé du réseau. L'hôte principal continue donc à surveiller l'hôte et ses machines virtuelles. Reportez-vous à Partitions de réseau.

L'isolation du réseau de l'hôte survient lorsqu'un hôte, toujours en cours d'exécution, ne parvient plus à observer le trafic provenant des agents vSphere HA sur le réseau de gestion. Si un hôte cesse d'observer ce trafic, il tente d'envoyer un ping aux adresses d'isolation du cluster. Si cette commande ping échoue également, l'hôte déclare qu'il est isolé du réseau.

L'hôte principal surveille les machines virtuelles qui s'exécutent sur un hôte isolé. Si l'hôte principal remarque que les machines virtuelles se mettent hors tension et qu'il en est responsable, il les redémarre.

Remarque :

Si vous vous assurez que l'infrastructure réseau est suffisamment redondante et qu'au moins un chemin d'accès au réseau est toujours disponible, l'isolation du réseau de l'hôte est moins susceptible de se produire.

Pannes de Proactive HA

Une panne de Proactive HA se produit lorsqu'un composant hôte est défaillant, ce qui entraîne une perte de redondance ou une panne non grave. Cependant, le comportement de fonctionnement des machines virtuelles qui résident sur l'hôte n'est pas affecté. Par exemple, si une alimentation électrique sur l'hôte tombe en panne, mais que les autres alimentations sont disponibles, il s'agit d'une panne de Proactive HA.

En cas de panne de Proactive HA, vous pouvez automatiser la mesure corrective prise dans la section Disponibilité vSphere de vSphere Web Client. Les machines virtuelles sur l'hôte concerné peuvent être évacuées vers d'autres hôtes et l'hôte est mis en mode de quarantaine ou de maintenance.

Remarque :

Pour que la surveillance des pannes de Proactive HA fonctionne, votre cluster doit utiliser vSphere DRS.