NSX Manager ist ausgefallen oder nicht verfügbar, wenn die Mehrheit der Knoten im Cluster ausgefallen ist.
Problem
Lösung
- Melden Sie sich über SSH bei jedem der betroffenen NSX Manager-Knoten an und führen Sie die folgenden Befehle aus:
- Führen Sie get file-system-stats aus und stellen Sie sicher, dass „/config“ und „/image“ nicht zu 100 % voll sind.
- Führen Sie get core-dumps aus, um sicherzustellen, dass keine Kerne in NSX Manager generiert wurden.
- Stellen Sie sicher, dass kein Datenspeicherausfall vorliegt. Siehe NSX Manager-Clusterstatus Herabgestuft, da datenspeicherbezogene Komponenten inaktiv sind.
- Überprüfen Sie die Protokolle auf Fehler wegen nicht genügend Arbeitsspeicher. Siehe /var/log/proton/proton-tomcat-wrapper.log
- Um das Clustering und die Benutzeroberfläche wiederherzustellen, sollten zwei Knoten in einem Cluster mit drei Knoten aktiv sein. Wenn Sie keinen ausgefallenen Knoten wieder aktivieren können, aber ein fehlerfreier Knoten verfügbar ist, führen Sie einen der folgenden Schritte aus, um das Clustering wiederherzustellen:
- Stellen Sie einen neuen Manager-Knoten (als 4. Mitgliedsknoten) bereit, treten Sie dem vorhandenen Cluster bei und trennen Sie dann einen der fehlgeschlagenen Knoten mithilfe des CLI-Befehls detach node <node-uuid> oder der API POST /api/v1/cluster/<node-uuid>?action=remove_node. Die Befehle sollten von einem der fehlerfreien Knoten aus ausgeführt werden. Alternativ können Sie dem nächsten Punkt folgen, um den Cluster zu deaktivieren.
- (Optional) Führen Sie den Befehl deactivate cluster auf dem aktiven Knoten aus, sodass Sie einen Einzelknoten-Cluster haben. Fügen Sie nun die neuen zusätzlichen Knoten hinzu, um einen 3-Mitglieder-NSX Manager-Cluster zu erstellen.
Hinweis: Aus dem Cluster entfernte NSX Manager-Knoten sollten ausgeschaltet und gelöscht werden.