L'hôte principal d'un cluster vSphere HA est responsable de la détection des pannes des hôtes secondaires. Selon le type de panne détecté, les machines virtuelles exécutées sur les hôtes peuvent nécessiter un basculement.

Dans un cluster vSphere HA, trois types de pannes d'hôtes sont détectés :

  • Un hôte cesse de fonctionner (autrement dit, il est défaillant).

  • Un hôte est réseau isolé.

  • Un hôte perd sa connexion réseau avec l'hôte principal.

L'hôte principal surveille la réactivité des hôtes secondaires du cluster. Cette communication s'effectue par l'échange, toutes les secondes, de signaux de pulsation réseau. Lorsqu'un hôte principal cesse de recevoir des signaux de pulsation d'un hôte secondaire ou esclave, il vérifie la réactivité de l'hôte avant de le déclarer défaillant. Le contrôle de réactivité effectué par l'hôte principal permet de déterminer si l'hôte secondaire échange des signaux de pulsation avec une des banques de données. Reportez-vous à la section Signal de pulsation de banque de données. Par ailleurs, l'hôte principal vérifie si l'hôte répond aux pings ICMP envoyés à ses adresses IP de gestion.

Si un hôte principal est incapable de communiquer directement avec l'agent présent sur un hôte secondaire, si l'hôte secondaire ne répond pas aux pings ICMP, et si l'agent n'émet pas de signaux de pulsation, il est considéré comme défaillant. Les machines virtuelles des hôtes sont redémarrées sur d'autres hôtes. Si un tel hôte secondaire échange des signaux de pulsation avec une banque de données, l'hôte principal considère qu'il se trouve dans une partition de réseau ou qu'il est réseau isolé, et continue donc de surveiller l'hôte et ses machines virtuelles. Reportez-vous à la section Partitions de réseau.

L'isolation du réseau de l'hôte survient lorsqu'un hôte, toujours en cours d'exécution, ne parvient plus à observer le trafic provenant des agents vSphere HA sur le réseau de gestion. Si un hôte cesse d'observer ce trafic, il tente d'envoyer un ping aux adresses d'isolation du cluster. Si cela échoue aussi, l'hôte se déclare isolé du réseau.

L'hôte principal surveille les machines virtuelles exécutées sur un hôte isolé. S'il constate qu'elles s'arrêtent, et s'il est responsable de ces machines virtuelles, il les redémarre.

Remarque :

Si vous vous assurez que l'infrastructure réseau est suffisamment redondante et qu'un chemin d'accès au réseau est disponible en permanence, l'isolation du réseau de l'hôte devrait se produire très rarement.