Problem
Die NSX Edge MPA-Konnektivität ist aufgrund eines Absturzes des Infrastrukturdiensts inaktiv.
Ursache
NSX Edge Volle Knotenfestplatten oder Memory Leaks können dazu führen, dass bestimmte Prozesse abstürzen und diesen Fehler auslösen. Die Admin-CLI get managers gibt möglicherweise einen aktiven Manager-Knoten zurück (wenn nach erfolgreicher Manager-Registrierung ein Absturz aufgetreten ist), und die Admin-CLI get controller gibt den Fehler Fehler beim Abrufen der Controller-Liste (Failed to get controller list) zurück.
Lösung
- Führen Sie die Admin-CLI get diagnosis config oder
GET API /api/v1/transport-nodes/{transport-node-id}/node/diagnosis
aus, um Fehler im Zusammenhang mit der Integrität von NSX Edge-Knoten zu diagnostizieren, die beim Ausfall von Diensten verursacht werden. - Führen Sie die Admin-CLI get cores-dumps aus, um festzustellen, ob aufgrund eines Dienstabsturzes Kerne generiert wurden (in /var/core oder /image/core). Wenn ein Core-Dump angezeigt wird, führen Sie im Stamm den Befehl top -o %MEM aus, um zu sehen, welcher NSX-Prozess zu viel Arbeitsspeicher beansprucht. Führen Sie die Admin-CLI get filesystem-status aus, um sicherzustellen, dass die von NSX verwendeten Partitionen nicht voll oder nahezu voll sind.
- Führen Sie die Stamm-CLI /etc/init.d/nsx-proxy | nsx-nestdb status aus, um den Status der laufenden Infrastrukturdienste auf dem NSX Edge-Knoten abzurufen.
- Bereinigen Sie den Festplattenspeicher und starten Sie dann die angehaltenen Infrastrukturdienste auf dem Host, indem Sie den Befehl /etc/init.d/<service-name> start ausgeben (als temporäre Problemumgehung). Öffnen Sie einen Support-Fall bei VMware, wenn Kerne angezeigt werden.