Dieses Thema bietet Informationen zur Erkennung von Ursachen für NSX Controller-Fehler und zur NSX Controller-Fehlerbehebung.

Problem

  • Fehler bei der Bereitstellung von NSX Controller(n).

  • Beitritt des NSX Controller zum Cluster schlägt fehl.

  • Mit dem Befehl show control-cluster status wird das Majority status-Flapping zwischen Connected to cluster majority und Interrupted connection to cluster majority angezeigt.

Probleme mit dem Controller-Clustering

Informationen finden Sie unter Bereitstellen von NSX Controllern.

Host-Verbindungsprobleme

Mit den folgenden Befehlen können Sie Host-Verbindungsprobleme erkennen. Führen Sie diese Befehle auf jedem Controller-Knoten durch.

  • Prüfen Sie mit dem Befehl show log cloudnet/cloudnet_java-vnet-controller*.log filtered-by host_IP, ob abnormale Fehlerstatistiken vorliegen.

  • Überprüfen Sie mit den folgenden Befehlen die Nachrichtenstatistiken des logischen Switches/Routers oder die hohe Nachrichtenrate:

    • show control-cluster core stats: allgemeine Statistiken

    • show control-cluster core stats-sample: neueste Statistiken (Auszüge)

    • show control-cluster core connection-stats ip: Statistiken je Verbindung

    • show control-cluster logical-switches stats

    • show control-cluster logical-routers stats

    • show control-cluster logical-switches stats-sample

    • show control-cluster logical-routers stats-sample

    • show control-cluster logical-switches vni-stats vni

    • show control-cluster logical-switches vni-stats-sample vni

    • show control-cluster logical-switches connection-stats ip

    • show control-cluster logical-routers connection-stats ip

  • Mit dem Befehl show host hostID health-status können Sie den Systemzustand von Hosts in Ihren vorbereiteten Clustern überprüfen. Für die Controller-Fehlerbehebung werden folgende Systemzustandsprüfungen unterstützt:

    • Überprüfung, ob die net-config-by-vsm.xml mit der Controller-Liste synchronisiert ist.

    • Überprüfung, ob eine Socket-Verbindung zum Controller besteht.

    • Überprüfung, ob die VNI erstellt wurde und die Konfiguration korrekt ist.

    • Überprüfung, ob die VNI eine Verbindung zu den Master-Controllern herstellt (falls die Kontrollebene aktiviert ist).

Installations- und Bereitstellungsprobleme

  • Stellen Sie sicher, dass mindestens drei Controller-Knoten in einem Cluster bereitgestellt werden. VMware empfiehlt, mit Hilfe der nativen Anti-Affinitätsregeln von vSphere die Bereitstellung von mehr als einem Controller-Knoten auf demselben ESXi-Host zu verhindern.

  • Überprüfen Sie, dass alle NSX Controllers den Status Connected aufweisen. Wenn einer der Controller-Knoten den Status Disconnected aufweist, stellen Sie sicher, dass die nachfolgenden Informationen konsistent sind. Führen Sie dazu den Befehl show control-cluster status auf allen Controller-Knoten aus:

Typ

Status

Join status (Beitrittsstatus)

Join complete (Beitritt abgeschlossen)

Majority status (Mehrheitsstatus)

Connected to cluster majority (Mit Clustermehrheit verbunden)

Cluster-ID

Dieselben Informationen auf allen Controller-Knoten

  • Stellen Sie sicher, dass alle Rollen auf allen Controller-Knoten konsistent sind:

    Rolle

    Konfigurierter Status

    Aktiver Status

    api_provider

    aktiviert

    aktiviert

    persistence_server

    aktiviert

    aktiviert

    switch_manager

    aktiviert

    aktiviert

    logical_manager

    aktiviert

    aktiviert

    directory_server

    aktiviert

    aktiviert

  • Überprüfen Sie, ob der vnet-controller-Vorgang ausgeführt wird. Führen Sie den Befehl show process auf allen Controller-Knoten durch, um sicherzustellen, dass der Dienst java-dir-server ausgeführt wird.

  • Überprüfen Sie den Clusterverlauf, und stellen Sie sicher, dass es keine Anzeichen für Host-Verbindungs-Flapping, VNI-Beitrittsfehler und abnormale Änderungen bei den Clustermitgliedschaften gibt. Um dies zu überprüfen, führen Sie den Befehl show control-cluster history aus. Dieser Befehl zeigt auch an, ob der Knoten häufig neu gestartet wird. Stellen Sie sicher, dass es nur wenige Protokolldateien mit einer Dateigröße von null (0) und mit unterschiedlichen Prozess-IDs gibt.

  • Überprüfen Sie, ob die VXLAN-Netzwerk-ID (VNI) konfiguriert ist. Weitere Informationen finden Sie im Abschnitt Schritte zur VXLAN-Vorbereitung im VMware VXLAN Deployment Guide.

  • Überprüfen Sie, ob auf dem Controller-Cluster SSL aktiviert ist. Führen Sie den Befehl show log cloudnet/cloudnet_java-vnet-controller*.log filtered-by sslEnabled auf jedem Controller-Knoten durch.