Wenn die NSX Intelligence-Appliance nicht mehr reagiert, überprüfen Sie den Status der NSX Intelligence-Dienste.
Problem
Die NSX Intelligence-Appliance reagiert nicht mehr oder Sie erhalten eine Fehlermeldung, die angibt, dass die Appliance nicht wie erwartet funktioniert.
Ursache
Es ist möglich, dass einer oder mehrere der zugrunde liegenden NSX Intelligence-Dienste angehalten wurde oder sich nicht in einem fehlerfreien Zustand befindet.
Lösung
- Melden Sie sich unter Verwendung eines Kontos mit der Rolle „Enterprise-Administrator“ beim CLI-Host der NSX Intelligence-Appliance an.
- Überprüfen Sie den Status der NSX Intelligence-Dienste mit dem Befehl get services.
Wenn alle NSX Intelligence-Dienste ordnungsgemäß funktionieren, wird eine Ausgabe ähnlich dem folgenden Beispiel angezeigt.
my_nsx-intel> get services Service name: druid Service state: running Coordinator health: good Broker health: good Historical health: good Overlord health: good MiddleManager health: good Service name: http Service state: running Session timeout: 1800 Connection timeout: 30 Redirect host: (not configured) Client API rate limit: 100 requests/sec Client API concurrency limit: 40 Global API concurrency limit: 199 Service name: kafka Service state: running Service health: good Service name: liagent Service state: stopped Service name: mgmt-plane-bus Service state: stopped Service name: node-mgmt Service state: running Service name: nsx-config Service state: running Service name: nsx-message-bus Service state: stopped Service name: nsx-upgrade-agent Service state: running Service name: ntp Service state: running Start on boot: True Service name: pace-server Service state: running Service name: postgres Service state: running Service health: good Service name: processing Service state: running Service name: snmp Service state: stopped Start on boot: False Service name: spark Service state: running Service health: good Service name: spark-job-scheduler Service state: running Service name: ssh Service state: running Start on boot: True Service name: syslog Service state: running Service name: ui-service Service state: running Service name: zookeeper Service state: running Service health: good my_nsx-intel>
Ein Dienst kann den Zustand Wird ausgeführt oder Gestoppt besitzen. Die Integrität eines Diensts kann gut oder herabgestuft sein.
- Sie können auch die syslog-Datei anzeigen und nach der Ausgabe des Skripts pace-monitor.sh zur Integritätsprüfung suchen, das die Integrität der NSX Intelligence-Dienste in der syslog-Datei protokolliert.
Wenn alle Dienste wie erwartet funktionieren, wird nach Ausführen des Befehls get log-file syslog | find pace-monitor eine Ausgabe ähnlich wie im folgenden Beispiel angezeigt.
my_nsx-intel> get log-file syslog | find pace-monitor <13>1 2019-08-30T03:19:20.409899+00:00 my_nsx-intel pace-monitor.sh - - - "_self": { <13>1 2019-08-30T03:19:20.410253+00:00 my_nsx-intel pace-monitor.sh - - - "href": "/node/pace/appliance-health", <13>1 2019-08-30T03:19:20.410623+00:00 my_nsx-intel pace-monitor.sh - - - "rel": "self" <13>1 2019-08-30T03:19:20.410908+00:00 my_nsx-intel pace-monitor.sh - - - }, <13>1 2019-08-30T03:19:20.411162+00:00 my_nsx-intel pace-monitor.sh - - - "appliance-health": { <13>1 2019-08-30T03:19:20.411416+00:00 my_nsx-intel pace-monitor.sh - - - "status": "Following NSX Intelligence first boot services are either PENDING or FAILED - Token-Registration", <13>1 2019-08-30T03:19:20.411668+00:00 my_nsx-intel pace-monitor.sh - - - "sub-system-status": { <13>1 2019-08-30T03:19:20.411923+00:00 my_nsx-intel pace-monitor.sh - - - "app-services": { <13>1 2019-08-30T03:19:20.412280+00:00 my_nsx-intel pace-monitor.sh - - - "services": [], <13>1 2019-08-30T03:19:20.412528+00:00 my_nsx-intel pace-monitor.sh - - - "status": "" <13>1 2019-08-30T03:19:20.412807+00:00 my_nsx-intel pace-monitor.sh - - - }, <13>1 2019-08-30T03:19:20.413075+00:00 my_nsx-intel pace-monitor.sh - - - "base-infra-services": { <13>1 2019-08-30T03:19:20.413303+00:00 my_nsx-intel pace-monitor.sh - - - "services": [ <13>1 2019-08-30T03:19:20.413613+00:00 my_nsx-intel pace-monitor.sh - - - { <13>1 2019-08-30T03:19:20.413848+00:00 my_nsx-intel pace-monitor.sh - - - "druid-health": { <13>1 2019-08-30T03:19:20.414146+00:00 my_nsx-intel pace-monitor.sh - - - "broker": "good", <13>1 2019-08-30T03:19:20.414473+00:00 my_nsx-intel pace-monitor.sh - - - "coordinator": "good", <13>1 2019-08-30T03:19:20.414717+00:00 my_nsx-intel pace-monitor.sh - - - "historical": "good", <13>1 2019-08-30T03:19:20.414979+00:00 my_nsx-intel pace-monitor.sh - - - "middlemanager": "good", <13>1 2019-08-30T03:19:20.415295+00:00 my_nsx-intel pace-monitor.sh - - - "overlord": "good" <13>1 2019-08-30T03:19:20.415533+00:00 my_nsx-intel pace-monitor.sh - - - }, <13>1 2019-08-30T03:19:20.415762+00:00 my_nsx-intel pace-monitor.sh - - - "service-name": "druid" <13>1 2019-08-30T03:19:20.415982+00:00 my_nsx-intel pace-monitor.sh - - - }, <13>1 2019-08-30T03:19:20.416269+00:00 my_nsx-intel pace-monitor.sh - - - { <13>1 2019-08-30T03:19:20.416539+00:00 my_nsx-intel pace-monitor.sh - - - "health": "good", <13>1 2019-08-30T03:19:20.416772+00:00 my_nsx-intel pace-monitor.sh - - - "service-name": "kafka" <13>1 2019-08-30T03:19:20.416991+00:00 my_nsx-intel pace-monitor.sh - - - }, <13>1 2019-08-30T03:19:20.417204+00:00 my_nsx-intel pace-monitor.sh - - - { <13>1 2019-08-30T03:19:20.417510+00:00 my_nsx-intel pace-monitor.sh - - - "health": "good", <13>1 2019-08-30T03:19:20.417745+00:00 my_nsx-intel pace-monitor.sh - - - "service-name": "postgres" <13>1 2019-08-30T03:19:20.418133+00:00 my_nsx-intel pace-monitor.sh - - - }, <13>1 2019-08-30T03:19:20.418389+00:00 my_nsx-intel pace-monitor.sh - - - { <13>1 2019-08-30T03:19:20.418626+00:00 my_nsx-intel pace-monitor.sh - - - "health": "good", <13>1 2019-08-30T03:19:20.418855+00:00 my_nsx-intel pace-monitor.sh - - - "service-name": "spark" <13>1 2019-08-30T03:19:20.419157+00:00 my_nsx-intel pace-monitor.sh - - - }, <13>1 2019-08-30T03:19:20.419435+00:00 my_nsx-intel pace-monitor.sh - - - { <13>1 2019-08-30T03:19:20.419684+00:00 my_nsx-intel pace-monitor.sh - - - "health": "good", <13>1 2019-08-30T03:19:20.419928+00:00 my_nsx-intel pace-monitor.sh - - - "service-name": "zookeeper" <13>1 2019-08-30T03:19:20.420165+00:00 my_nsx-intel pace-monitor.sh - - - } <13>1 2019-08-30T03:19:20.420496+00:00 my_nsx-intel pace-monitor.sh - - - ], <13>1 2019-08-30T03:19:20.420786+00:00 my_nsx-intel pace-monitor.sh - - - "status": "" <13>1 2019-08-30T03:19:20.421022+00:00 my_nsx-intel pace-monitor.sh - - - }, <13>1 2019-08-30T03:19:20.421255+00:00 my_nsx-intel pace-monitor.sh - - - "first-boot-services": { <13>1 2019-08-30T03:19:20.421539+00:00 my_nsx-intel pace-monitor.sh - - - "services": [ <13>1 2019-08-30T03:19:20.421777+00:00 my_nsx-intel pace-monitor.sh - - - { <13>1 2019-08-30T03:19:20.422010+00:00 my_nsx-intel pace-monitor.sh - - - "health": "degraded", <13>1 2019-08-30T03:19:20.422277+00:00 my_nsx-intel pace-monitor.sh - - - "service-name": "token-registration" <13>1 2019-08-30T03:19:20.422512+00:00 my_nsx-intel pace-monitor.sh - - - } <13>1 2019-08-30T03:19:20.422770+00:00 my_nsx-intel pace-monitor.sh - - - ], <13>1 2019-08-30T03:19:20.423012+00:00 my_nsx-intel pace-monitor.sh - - - "status": "Following NSX Intelligence first boot, services are either PENDING or FAILED - Token-Registration" <13>1 2019-08-30T03:19:20.423354+00:00 my_nsx-intel pace-monitor.sh - - - } <13>1 2019-08-30T03:19:20.423601+00:00 my_nsx-intel pace-monitor.sh - - - } <13>1 2019-08-30T03:19:20.423882+00:00 my_nsx-intel pace-monitor.sh - - - } <13>1 2019-08-30T03:19:20.424339+00:00 my_nsx-intel pace-monitor.sh - - - } <13>1 2019-08-30T03:19:20.972629+00:00 my_nsx-intel pace-monitor.sh - - - NSX Intelligence health OK. <30>1 2019-08-30T03:19:20.973076+00:00 my_nsx-intel pace-monitor 20804 - - <13>Aug 30 03:19:19 pace-monitor.sh: NSX Intelligence health OK. <182>1 2019-08-30T03:23:23.857Z my_nsx-intel NSX 21752 - [nsx@6876 comp="nsx-cli" subcomp="node-mgmt" username="admin" level="INFO"] CMD: get log-file syslog | find pace-monitor
Wenn ein Problem mit einem der Dienste vorliegt, wird nach dem Ausführen von get log-file syslog | find pace-monitor möglicherweise die folgende Zeile angezeigt.NSX Intelligence health DEGRADED. Return code not HTTP OK.
- Wenn Sie eine der folgenden Ausgaben erhalten, starten Sie den Dienst mit dem Befehl
restart service Dienstname
neu.- Nach dem Ausführen des Befehls get services wird für einen der Dienste Dienststatus: Gestoppt oder Dienstintegrität: herabgestuft angezeigt.
- Nach dem Ausführen des Befehls get log-file syslog | find pace-monitor wird in der Ausgabe die folgende oder eine ähnliche Meldung angezeigt: PACE-Integrität HERABGESTUFT. Rückgabecode nicht HTTP OK..
Wenn z. B. der Zustand des postgres-Diensts gestoppt oder Wird ausgeführt lautet, die Dienstintegrität jedoch herabgestuft ist, führen Sie den folgenden Befehl aus.restart service postgres
Wichtig: Sie müssen den Befehlrestart service service-name
verwenden, um NSX Intelligence-Dienste neu zu starten. Wenn Sie sich stattdessen für die Verwendung der Befehlestop service service-name
undstart service service-name
entscheiden, müssen Sie auch jeden der Dienste manuell neu starten, die von service-name abhängig sind. Die folgende Liste zeigt die Abhängigkeitsreihenfolge, in der die NSX Intelligence-Dienste neu gestartet werden müssen.zookeeper > druid > kafka > spark > spark-job-scheduler > nsx-config > processing > pace-server
Wenn beispielsweise der nsx-config-Dienst angehalten und dann mit dem Befehlstop|start service service-name
gestartet wird, müssen Sie auch den Befehlrestart service service-name
verwenden, um die processing- pace-server-Dienste neu zu starten.Wenn ein Dienst neu gestartet wird, können andere Dienste, die von diesem Dienst abhängen, kurzzeitig in einen herabgestuften Zustand versetzt werden. Wenn keine Fehler auftreten, kehren diese herabgestuften Dienste zu einem stabilen Zustand zurück.