Der primäre Host eines VMware vSphere® High Availability-Clusters ist verantwortlich für das Erkennen des Ausfalls eines sekundären Hosts. Je nach Art des erkannten Ausfalls muss für die auf den Hosts ausgeführten virtuellen Maschinen möglicherweise ein Failover durchgeführt werden.
Es werden drei Typen von Hostausfällen in einem vSphere HA-Cluster erkannt:
- Fehler – ein Host funktioniert nicht mehr.
- Isolierung – ein Host wird netzwerkisoliert.
- Partition. Die Netzwerkkonnektivität zwischen dem Host und dem primären Host wird unterbrochen.
Der primäre Host überwacht, ob die sekundären Hosts im Cluster noch aktiv sind. Die Kommunikation erfolgt über den Austausch von Netzwerktaktsignalen im Sekundentakt. Wenn der primäre Host keine Taktsignale von einem sekundären Host empfängt, überprüft er, ob der Host noch aktiv ist, bevor er den Host als ausgefallen betrachtet. Die vom primären Host durchgeführte Überprüfung auf Aktivität dient der Feststellung, ob der sekundäre Host Taktsignale mit einem der Datenspeicher austauscht. Weitere Informationen hierzu finden Sie unter Datenspeicher-Taktsignale. Der primäre Host überprüft zudem, ob der Host auf ICMP-Pings reagiert, die an seine Verwaltungs-IP-Adressen gesendet werden.
Wenn ein primärer Host nicht direkt mit dem Agent auf einem sekundären Host kommunizieren kann, reagiert der sekundäre Host nicht auf ICMP-Pings. Stellt der Agent keine Taktsignale aus, wird er als fehlgeschlagen eingestuft. Die virtuellen Maschinen des Hosts werden auf alternativen Hosts neu gestartet. Wenn ein solcher sekundärer Host Taktsignale mit einem Datenspeicher austauscht, geht der primäre Host davon aus, dass sich der sekundäre Host in einer Netzwerkpartition befindet oder vom Netzwerk isoliert ist. Der primäre Host setzt dann die Überwachung des Hosts und dessen virtueller Maschinen fort. Weitere Informationen hierzu finden Sie unter Netzwerkpartitionen.
Eine Hostnetzwerkisolierung liegt vor, wenn ein Host noch ausgeführt wird, jedoch keinen Datenverkehr von den vSphere HA-Agenten im Verwaltungsnetzwerk beobachten kann. Wenn dieser Datenverkehr vom Host nicht mehr beobachtet wird, versucht der Host, die Cluster-Isolierungsadressen anzupingen. Schlägt der Ping-Befehl ebenfalls fehl, erklärt sich der Host als vom Netzwerk isoliert.
Der primäre Host überwacht die virtuellen Maschinen, die auf einem isolierten Host ausgeführt werden. Wenn der primäre Host feststellt, dass die VMs ausgeschaltet werden, und der primäre Host für die VMs verantwortlich ist, startet er sie neu.
Proactive HA-Fehler
Ein Proactive HA-Fehler tritt beim Ausfall einer Hostkomponente auf, was zum Redundanzverlust oder zu einem nicht schwerwiegenden Fehler führt. Das funktionale Verhalten der auf dem Host vorhandenen VMs ist jedoch noch nicht davon betroffen. Wenn beispielsweise ein Netzteil auf dem Host ausfällt, aber andere Netzteile verfügbar sind, handelt es sich hierbei um einen Proactive HA-Fehler.
Bei einem Proactive HA-Fehler können Sie die Problembehebungsaktion im vSphere Availability-Abschnitt des vSphere Client automatisieren. Die VMs auf dem betroffenen Host können auf andere Hosts evakuiert werden. Der Host wird dann entweder in den Quarantänemodus oder in den Wartungsmodus versetzt.