vRealize Operations Manager unterstützt kontinuierliche Verfügbarkeit (Continuous Availability; CA). CA trennt den vRealize Operations Manager-Cluster in zwei Fehlerdomänen, die sich über vSphere-Cluster erstrecken, und schützt den Analyse-Cluster vor dem Verlust einer gesamten Fehlerdomäne.
Sie können den Analyse-Cluster mit kontinuierlicher Verfügbarkeit konfigurieren. Auf diese Weise können die Clusterknoten auf zwei Fehlerdomänen ausgedehnt werden. Eine Fehlerdomäne besteht aus einem oder mehreren Analyseknoten, die gemäß ihrem physischen Standort im Datencenter gruppiert sind. Mit CA kann vRealize Operations Manager dank der beiden Fehlerdomänen Ausfälle eines gesamten physischen Standorts und von Ressourcen, die für eine einzelne Fehlerdomäne reserviert sind, tolerieren.
Um die kontinuierliche Verfügbarkeit innerhalb von vRealize Operations Manager zu aktivieren, muss der Zeugenknoten im Cluster bereitgestellt werden. Der Zeugenknoten erfasst und speichert keine Daten. Wenn die Netzwerkkonnektivität der beiden Fehlerdomänen verloren geht, befindet sich der Cluster in einer „Split Brain“-Situation. Diese Situation wird vom Zeugenknoten erkannt, und eine der Fehlerdomänen wird offline geschaltet, um Dateninkonsistenzprobleme zu vermeiden. Auf der Admin-Benutzeroberfläche der Knoten, die vom Zeugenknoten in den Offline-Zustand versetzt wurden, wird die Schaltfläche Online schalten angezeigt. Bevor Sie diese Option verwenden, um die Fehlerdomäne wieder in den Online-Zustand zu versetzen, stellen Sie sicher, dass die Netzwerkkonnektivität zwischen den Knoten in den beiden Fehlerdomänen wiederhergestellt und stabil ist. Sobald dies bestätigt ist, können Sie die Fehlerdomäne online schalten.
Bei CA sind die Daten, die im Primär-Knoten und den gruppierten Datenknoten in Fehlerdomäne 1 gespeichert sind, immer zu 100 % mit dem Replikatknoten und den zugewiesenen Datenknoten in Fehlerdomäne 2 synchron. Um CA zu aktivieren, muss zusätzlich zum Primär-Knoten mindestens ein Datenknoten bereitgestellt sein. Wenn Sie mehr als einen Datenknoten haben, muss eine gerade Anzahl von Datenknoten vorhanden sein, einschließlich des Primär-Knotens. Der Cluster muss beispielsweise über 2, 4, 6, 8, 10, 12, 14 oder 16 Knoten verfügen, die auf den entsprechenden Größenanforderungen basieren. Die im Primär-Knoten in Fehlerdomäne 1 gespeicherten Daten werden im Replikatknoten in Fehlerdomäne 2 gespeichert und repliziert. Die in den Datenknoten in Fehlerdomäne 1 gespeicherten Daten werden in den zugewiesenen Datenknoten in Fehlerdomäne 2 gespeichert und repliziert. Wenn jedoch der Primär-Knoten ausfällt, kann nur der Replikatknoten als Ersatz für den Primär-Knoten fungieren.
- CA schützt den Analyse-Cluster vor dem Verlust der Hälfte der Analyseknoten für eine Fehlerdomäne. Sie können Knoten über vSphere-Cluster verteilen, um Knoten zu isolieren oder Fehlerzonen zu erstellen.
- Wenn CA aktiviert ist, kann der Replikatknoten bei einem Ausfall des Primär-Knotens alle Funktionen übernehmen, die der Primär-Knoten bereitstellt. Das Failover auf das Replikat findet automatisch statt, und vRealize Operations Manager fällt nur drei Minuten lang aus, bevor der Betrieb wieder aufgenommen und die Datenerfassung neu gestartet wird.
Hinweis: Bei einem Ausfall des Primär-Knotens wird der Replikatknoten zum Primär-Knoten, und der Cluster läuft im heruntergestuften Modus. Um dies zu beheben, führen Sie eine der folgenden Aktionen aus.
- Beheben Sie den Ausfall des Primär-Knotens manuell.
- Kehren Sie zum CA-Modus zurück, indem Sie den Primär-Knoten ersetzen. Ersatzknoten reparieren den Knotenausfall nicht. Stattdessen übernimmt ein neuer Knoten die Rolle des Primär-Knotens.
- Nachdem ein CA-Replikatknoten übernommen hat und zum neuen Primär-Knoten wird, können Sie in der Verwaltungsschnittstelle den vorherigen Offline-Primär-Knoten nicht aus dem Cluster entfernen. Außerdem wird der vorherige Knoten weiterhin als ein Primär-Knoten aufgeführt. Aktualisieren Sie den Browser, um die Anzeige zu aktualisieren und das Entfernen des Knotens zu aktivieren.
- Wenn CA aktiviert ist, kann der Cluster den Verlust der Hälfte der Datenknoten (alle in einer Fehlerdomäne) überstehen, ohne dass Daten verloren gehen. CA schützt vor dem Verlust von jeweils nur einer Fehlerdomäne. Ein gleichzeitiger Ausfall der Daten- und des Primär-/Replikatknotens oder von zwei oder mehr Datenknoten in beiden Fehlerdomänen ist nicht abgedeckt.
- Ein CA-fähiger Cluster ist nicht funktionsfähig, wenn Sie den Primär-Knoten oder den primären Replikatknoten ausschalten, während eine der Fehlerdomänen ausgefallen ist.
- Wenn CA aktiviert ist, werden vRealize Operations Manager-Kapazität und -Verarbeitung halbiert, weil CA eine redundante Kopie der Daten im Cluster sowie die Replikatsicherung des Primär-Knotens erstellt. Berücksichtigen Sie die mögliche Verwendung von CA, wenn Sie die Anzahl und Größe Ihrer vRealize Operations Manager-Cluster-Knoten planen. Siehe Größenbestimmung des vRealize Operations Manager-Clusters.
- Wenn CA aktiviert ist, stellen Sie Analyse-Cluster-Knoten in jeder Fehlerdomäne auf separaten Hosts bereit, um Redundanz und Isolation zu erreichen. Sie können auch Anti-Affinitätsregeln verwenden, die Knoten auf bestimmten Hosts in den vSphere-Clustern aufbewahren.
- Wenn Sie die Knoten nicht in jeder Fehlerdomäne trennen können, können Sie CA dennoch aktivieren. Ein Hostausfall führt möglicherweise zum Verlust der Datenknoten in der Fehlerdomäne, und vRealize Operations Manager ist möglicherweise weiterhin in der anderen Fehlerdomäne verfügbar.
- Wenn Sie die Datenknoten nicht in verschiedene vSphere-Cluster aufteilen können, aktivieren Sie die CA nicht. Ein Clusterausfall kann den Verlust von mehr als der Hälfte der Datenknoten verursachen, was nicht abgedeckt ist, und der gesamte vSphere ist u. U. nicht verfügbar.
- Ohne CA können Sie Knoten auf demselben Host im selben vSphere beibehalten. Ohne CA wird der gesamte vRealize Operations Manager durch den Verlust eines Knotens u. U. nicht verfügbar.
- Wenn Sie Datenknoten in beiden Fehlerdomänen ausschalten und die Netzwerkeinstellungen der VMs ändern, wirkt sich dies auf die IP-Adresse der Datenknoten aus. Nach diesem Zeitpunkt ist der CA-Cluster nicht mehr zugänglich, und der Status aller Knoten wird zu
"Waiting for analytics"
geändert. Stellen Sie sicher, dass eine statische IP-Adresse verwendet wurde. - Wenn Sie einen Knoten entfernen, bei dem ein oder mehrere vCenter-Adapter so konfiguriert sind, dass sie von einem CA-fähigen Cluster Daten erfassen, stellen ein oder mehrere vCenter-Adapter, die diesem Knoten zugeordnet sind, ihren Dienst zur Datenerfassung ein. Bevor Sie den Knoten entfernen, müssen Sie die Adapterkonfiguration so ändern, dass sie auf einen anderen Knoten zugreifen.
- Die Verwaltungsschnittstelle zeigt den Ressourcen-Cache-Zähler, der nur für aktive Objekte erstellt wird, aber in der Bestandsliste werden alle Objekte angezeigt. Wenn Sie daher einen Knoten aus einem CA-fähigen Cluster entfernen, in dem die vCenter-Adapter Daten erfassen können, und dann die Last der einzelnen Knoten neu verteilen, zeigt die Bestandsliste eine andere Anzahl an Objekten als die Verwaltungsschnittstelle an.