Der Master-Host eines VMware vSphere® High Availability-Clusters ist verantwortlich für das Erkennen des Ausfalls eines untergeordneten Hosts. Je nach Art des erkannten Ausfalls muss für die auf den Hosts ausgeführten virtuellen Maschinen möglicherweise ein Failover durchgeführt werden.

Es werden drei Typen von Hostausfällen in einem vSphere HA-Cluster erkannt:

  • Fehler – ein Host funktioniert nicht mehr.

  • Isolierung – ein Host wird netzwerkisoliert.

  • Partition – die Netzwerkkonnektivität zwischen dem Host und dem Master-Host wird unterbrochen.

Der Master-Host überwacht, ob die untergeordneten Hosts im Cluster noch aktiv sind. Die Kommunikation erfolgt über den Austausch von Netzwerktaktsignalen im Sekundentakt. Wenn der Master-Host keine Taktsignale von einem untergeordneten Host empfängt, überprüft er, ob der Host noch aktiv ist, bevor er den Host als ausgefallen betrachtet. Beim Überprüfen, ob der untergeordnete Host noch aktiv ist, ermittelt der Master-Host, ob der untergeordnete Host Taktsignale mit einem der Datenspeicher austauscht. Weitere Informationen hierzu finden Sie unter Datenspeicher-Taktsignale. Der Master-Host überprüft zudem, ob der Host auf ICMP-Pings reagiert, die an seine Management-IP-Adressen gesendet werden.

Wenn ein Master-Host nicht direkt mit dem Agent auf einem untergeordneten Host kommunizieren kann, reagiert der untergeordnete Host nicht auf ICMP-Pings. Stellt der Agent keine Taktsignale aus, wird er als fehlgeschlagen eingestuft. Die virtuellen Maschinen des Hosts werden auf alternativen Hosts neu gestartet. Wenn ein solcher untergeordneter Host Taktsignale mit einem Datenspeicher austauscht, geht der Master-Host davon aus, dass sich der untergeordnete Host in einer Netzwerkpartition befindet oder netzwerkisoliert ist. Der Master-Host setzt dann die Überwachung des Hosts und dessen virtueller Maschinen fort. Weitere Informationen hierzu finden Sie unter Netzwerkpartitionen.

Eine Hostnetzwerkisolierung liegt vor, wenn ein Host noch ausgeführt wird, jedoch keinen Datenverkehr von den vSphere HA-Agenten im Verwaltungsnetzwerk beobachten kann. Wenn dieser Datenverkehr vom Host nicht mehr beobachtet wird, versucht der Host, die Cluster-Isolierungsadressen anzupingen. Schlägt der Ping-Befehl ebenfalls fehl, erklärt sich der Host als vom Netzwerk isoliert.

Der Master-Host überwacht die virtuellen Maschinen, die auf einem isolierten Host ausgeführt werden. Wenn der Master-Host feststellt, dass die VMs ausgeschaltet werden, und der Master-Host für die VMs verantwortlich ist, startet er sie neu.

Anmerkung:

Wenn Sie sicherstellen, dass die Netzwerkinfrastruktur ausreichend redundant ist, sodass mindestens ein Netzwerkpfad stets zur Verfügung steht, ist die Wahrscheinlichkeit einer Hostnetzwerkisolierung geringer.

Proactive HA-Fehler

Ein Proactive HA-Fehler tritt beim Ausfall einer Hostkomponente auf, was zum Redundanzverlust oder zu einem nicht schwerwiegenden Fehler führt. Das funktionale Verhalten der auf dem Host vorhandenen VMs ist jedoch noch nicht davon betroffen. Wenn beispielsweise ein Netzteil auf dem Host ausfällt, aber andere Netzteile verfügbar sind, handelt es sich hierbei um einen Proactive HA-Fehler.

Bei einem Proactive HA-Fehler können Sie die Problembehebungsaktion im vSphere Availability-Abschnitt des vSphere Web Client automatisieren. Die VMs auf dem betroffenen Host können auf andere Hosts evakuiert werden. Der Host wird dann entweder in den Quarantänemodus oder in den Wartungsmodus versetzt.

Anmerkung:

In Ihrem Cluster muss vSphere DRS verwendet werden, damit die Überwachung auf Proactive HA-Fehler funktioniert.