Problem

Die NSX Edge MPA-Konnektivität ist aufgrund eines Absturzes des Infrastrukturdiensts inaktiv.

Ursache

NSX Edge Volle Knotenfestplatten oder Memory Leaks können dazu führen, dass bestimmte Prozesse abstürzen und diesen Fehler auslösen. Die Admin-CLI get managers gibt möglicherweise einen aktiven Manager-Knoten zurück (wenn nach erfolgreicher Manager-Registrierung ein Absturz aufgetreten ist), und die Admin-CLI get controller gibt den Fehler Fehler beim Abrufen der Controller-Liste (Failed to get controller list) zurück.

Lösung

  1. Führen Sie die Admin-CLI get diagnosis config oder GET API /api/v1/transport-nodes/{transport-node-id}/node/diagnosis aus, um Fehler im Zusammenhang mit der Integrität von NSX Edge-Knoten zu diagnostizieren, die beim Ausfall von Diensten verursacht werden.
  2. Führen Sie die Admin-CLI get cores-dumps aus, um festzustellen, ob aufgrund eines Dienstabsturzes Kerne generiert wurden (in /var/core oder /image/core). Wenn ein Core-Dump angezeigt wird, führen Sie im Stamm den Befehl top -o %MEM aus, um zu sehen, welcher NSX-Prozess zu viel Arbeitsspeicher beansprucht. Führen Sie die Admin-CLI get filesystem-status aus, um sicherzustellen, dass die von NSX verwendeten Partitionen nicht voll oder nahezu voll sind.
  3. Führen Sie die Stamm-CLI /etc/init.d/nsx-proxy | nsx-nestdb status aus, um den Status der laufenden Infrastrukturdienste auf dem NSX Edge-Knoten abzurufen.
  4. Bereinigen Sie den Festplattenspeicher und starten Sie dann die angehaltenen Infrastrukturdienste auf dem Host, indem Sie den Befehl /etc/init.d/<service-name> start ausgeben (als temporäre Problemumgehung). Öffnen Sie einen Support-Fall bei VMware, wenn Kerne angezeigt werden.