Die „High Availability“ (HA, Hochverfügbarkeit) stellt sicher, dass die von NSX Edge-Appliances bereitgestellten Dienste auch dann verfügbar sind, wenn eine einzelne Appliance durch einen Hardware- oder Softwarefehler nicht mehr verfügbar ist. Mithilfe der NSX Edge-HA wird die Failover-Ausfallzeit nur minimiert, d. h., sie beträgt nicht null, da wegen des Failover zwischen Appliances eventuell einige Dienste neu gestartet werden müssen.

Beispielsweise synchronisiert die NSX Edge-HA die Verbindungsermittlung der statusorientierten Firewall oder die statusorientierten Informationen des Load Balancer. Für die erneute Aktivierung der gesamten Dienste ist ein bestimmter Zeitaufwand erforderlich. Beispielsweise kann ein Neustart der Dienste zu einer gewissen Ausfallzeit beim dynamischen Routing führen, wenn ein NSX Edge als Router dient.

Manchmal können die beiden NSX Edge-HA-Appliances nicht miteinander kommunizieren und nicht einseitig aktiviert werden. Mit diesem Verhalten soll die Verfügbarkeit der aktiven NSX Edge-Dienste sichergestellt werden, wenn das Standby-NSX Edge nicht verfügbar ist. Ist nach der erneuten Einrichtung der Kommunikation die andere Appliance weiterhin vorhanden, handeln die beiden NSX Edge-HA-Appliances den aktiven und den Standby-Status neu aus. Wird diese Aushandlung nicht abgeschlossen und werden beide Appliances als aktiv erklärt, nachdem die Konnektivität erneut eingerichtet wurde, kommt es zu einem unvorhergesehenen Verhalten. Dieses Szenario, auch als „Split Brain“ bezeichnet, kann bei folgenden Umgebungsbedingungen auftreten:

  • Probleme der Konnektivität des physischen Netzwerks, inklusive einer Netzwerkpartition.

  • CPU- oder Arbeitsspeicherkonflikt beim NSX Edge.

  • Vorübergehende Speicherprobleme, die zum Ausfall von mindestens einer NSX Edge-HA-VM führen können.

    Beispielsweise kann es zu einer Verbesserung der NSX Edge-HA-Stabilität und -Leistung kommen, wenn die VMs aus einem überbeanspruchten Speicher entfernt werden. Insbesondere können bei umfangreichen Sicherungen über Nacht große Spitzen der Speicherlatenz die NSX Edge-HA-Stabilität beeinflussen.

  • Überlastung des physischen oder virtuellen Netzwerkadapters im Zusammenhang mit dem Austausch von Paketen.

Über Umgebungsprobleme hinaus kommt es zu einem „Split Brain“, wenn sich die HA-Konfigurations-Engine in einem fehlerhaften Zustand befindet oder wenn der HA-Daemon fehlschlägt.

Statusbehaftete High Availability

Die primäre NSX Edge-Appliance befindet sich im aktiven und die sekundäre Appliance im Standby-Zustand. NSX Edge repliziert die Konfiguration der primären Appliance für die Standby-Appliance. Sie können auch manuell zwei Appliances hinzufügen. Es wird empfohlen, die primäre und die sekundäre Appliance in getrennten Ressourcenpools und Datenspeichern anzulegen. Wenn Sie die primäre und sekundäre Appliance im selben Datenspeicher erstellen, muss der Datenspeicher von allen Hosts im Cluster gemeinsam genutzt werden, damit das HA-Appliance-Paar auf verschiedenen ESX-Hosts bereitgestellt wird. Wenn der Datenspeicher ein lokaler Speicher ist, werden beide virtuelle Maschinen auf demselben Host bereitgestellt.

Alle NSX Edge-Dienste werden auf der aktiven Appliance ausgeführt. Die primäre Appliance hält ein Taktsignal mit der Standby-Appliance aufrecht und sendet Dienst-Updates über eine interne Schnittstelle.

Wenn die Standby-Appliance im festgelegten Zeitintervall (der Standardwert ist 15 Sekunden) kein Taktsignal von der primären Appliance empfängt, gilt die primäre Appliance als ausgefallen. Die Standby-Appliance wechselt in den aktiven Zustand, übernimmt die Schnittstellenkonfiguration der primären Appliance und startet die NSX Edge-Dienste, die auf der primären Appliance ausgeführt wurden. Bei der Durchführung des Wechsels wird auf der Registerkarte Systemereignisse (System Events) ein Systemereignis unter „Einstellungen und Berichte“ angezeigt. Der Load Balancer und der VPN-Dienst müssen die TCP-Verbindung mit NSX Edge wiederherstellen, wodurch der Dienst kurz unterbrochen wird. Logische Switch-Verbindungen und Firewall-Sitzungen zwischen der primären und der Standby-Appliance werden synchronisiert, sodass es während des Wechsels keine Dienstunterbrechung gibt.

Wenn die NSX Edge-Appliance ausfällt und ein fehlerhafter Zustand gemeldet wird, erzwingt HA die Synchronisierung der ausgefallenen Appliance, um sie wiederherzustellen. Nach der Wiederherstellung der Appliance übernimmt diese die Konfiguration der derzeit aktiven Appliance und bleibt im Standby-Modus. Wenn die NSX Edge-Appliance ausgefallen ist, müssen Sie sie löschen und eine neue Appliance hinzufügen.

NSX Edge stellt sicher, dass sich die zwei virtuellen HA NSX Edge-Maschinen auch dann nicht auf demselben ESX-Host befinden, wenn Sie DRS und vMotion verwendet haben (es sei denn, Sie migrieren sie per vMotion manuell auf denselben Host). Zwei virtuelle Maschinen werden auf vCenter in demselben Ressourcenpool und Datenspeicher wie die von Ihnen konfigurierte Appliance bereitgestellt. Die IP-Adressen von lokalen Links werden virtuellen HA-Maschinen in der NSX Edge-HA zugewiesen, damit sie kommunizieren können. Sie können Verwaltungs-IP-Adressen angeben, um die lokalen Links zu überschreiben.

Wenn Syslog-Server konfiguriert sind, werden die Protokolle auf der aktiven Appliance an die Syslog-Server gesendet.

vSphere High Availability

NSX Edge HA ist zu vSphere HA kompatibel. Wenn der Host, auf dem die NSX Edge-Instanz ausgeführt wird, ausfällt, wird NSX Edge auf dem Standby-Host neu gestartet. Hierdurch wird sichergestellt, dass das NSX Edge HA-Paar ein weiteres Failover verarbeiten kann.

Wenn vSphere HA nicht genutzt wird, übersteht das NSX Edge HA-Aktiv-Standby-Paar ein Failover. Falls jedoch ein weiteres Failover auftritt, bevor das zweite HA-Paar wiederhergestellt wurde, kann dies die Verfügbarkeit von NSX Edge beeinträchtigen.

Weitere Informationen zu vSphere HA finden Sie unter vSphere-Verfügbarkeit.