Wenn der Status des Antrea-Containerclusters inaktiv ist, führen Sie die Schritte in dieser Dokumentation aus, um die Ursache dieses Problems zu ermitteln und es zu beheben, oder erfassen Sie das Support-Paket.

Problem

Der Cluster-Control Plane-Knoten ist inaktiv. Der Antrea-Containercluster ist von der Zentralen Control Plane (CCP) getrennt.

Ursache

Navigieren Sie in der NSX Manager-Benutzeroberfläche zu System > Fabric > Knoten > Containercluster > Antrea. Filtern Sie bei Bedarf die Liste der Cluster auf der Seite Antrea mit dem Feld Externe ID.

Klicken Sie auf die Spalte Status des problematischen Clusters. Wenn alle Komponenten inaktiv sind, sind folgende Ursachen möglich:
  • Der Kubernetes-Cluster wurde gelöscht.
  • Netzwerkkonnektivitätsproblem mit CCP.
  • Die Adapter sind aus irgendeinem Grund abgestürzt oder wurden gelöscht.
  • Das Clientzertifikat der Adapter ist falsch.
  • Die Version der Adapter ist mit der CCP nicht kompatibel.

Wenn nur der Zentrale Control Plane(CCP)-Adapter ausgefallen ist, ist der CCP-Adapter möglicherweise abgestürzt.

Lösung

  1. Wenn der Kubernetes-Cluster gelöscht wurde, bereinigen Sie die verbleibenden Registrierungs- und Bestandsdaten in NSX. Siehe Bereinigen von Antrea-Daten in NSX.
  2. Rufen Sie den kubectl- und kubeconfig-Zugang für den Containercluster ab. Verwenden Sie kubectl, um den Knotennamen abzurufen, auf dem der Interworking-Pod ausgeführt wird. Starten Sie eine SSH-Sitzung mit dem Knoten und verwenden Sie den Befehl curl oder nc, um eine Verbindung zu jeder NSX Manager-IP an den Ports 1234 und 1235 herzustellen. Wenn die Verbindung nicht hergestellt werden kann, ist die Ursache ein Netzwerkkonnektivitätsproblem mit der CCP.
    Beispiel für den curl-Befehl:

    Stellen Sie sicher, dass Sie die NSX-Manager-IP durch die IP-Adresse von NSX Manager in Ihrer Umgebung ersetzen.

    curl -v NSX-Manager-IP:1235
    
    Trying NSX-Manager-IP... 
    Connected to NSX-Manager-IP (NSX-Manager-IP) port 1235 (#0) 
    ... 
    Empty reply from server 
    Connection #0 to host NSX-Manager-IP left intact 
    curl: (52) Empty reply from server

    Beispiel für den nc-Befehl:

    nc -v NSX-Manager-IP 1235 < /dev/null
    
    Ncat: Version 7.50 (https://nmap.org/ncat)
    Ncat: Connected to NSX-Manager-IP:1235.
    Ncat: 0 bytes sent, 0 bytes received in 0.37 seconds.
  3. Verwenden Sie kubectl, um zu überprüfen, ob alle Container des Interworking-Pods im Namespace vmware-system-antrea aktiv sind.
    Wenn ein Container ausgefallen ist, verwenden Sie kubectl, um Protokolle der abgestürzten Container abzurufen und die Fehlermeldung zu überprüfen. Dieser Schritt kann Ihnen dabei helfen, einen Fehler zu identifizieren, der durch einen der folgenden Gründe ausgelöst wurde:
    • Die Adapter stürzen aus irgendeinem Grund ab oder werden gelöscht.
    • CCP-Adapter ist abgestürzt.
    Beispiel für den kubectl-Befehl zum Abrufen des Interworking-Pods:
    kubectl get pod -o wide -l app=antrea-interworking -n vmware-system-antrea

    Notieren Sie sich den Namen des Interworking-Pods.

    Beispiel für den kubectl-Befehl zum Abrufen des detaillierten Zustands des Interworking-Pods:

    Stellen Sie sicher, dass Sie pod-name durch den tatsächlichen Pod-Namen ersetzen.

    kubectl get pod -o yaml pod-name -n vmware-system-antrea

    Beispiel für den kubectl-Befehl zum Abrufen von Containerprotokollen:

    Stellen Sie sicher, dass Sie pod-name durch den tatsächlichen Pod-Namen ersetzen.

    kubectl logs pod-name -c mp-adapter -n vmware-system-antrea > mp-adapter.log
    kubectl logs pod-name -c ccp-adapter -n vmware-system-antrea > ccp-adapter.log
    kubectl logs pod-name -c tn-proxy -n vmware-system-antrea > tn-proxy.log
    kubectl logs pod-name -c election-runner -n vmware-system-antrea > election-runner.log

    Wenn der Namespace vmware-system-antrea fehlt oder der Interworking-Pod fehlt, wurden die Adapter möglicherweise aus dem Kubernetes-Cluster gelöscht, ohne die Schritte zum Aufheben der Registrierung auszuführen. Sie können die verbleibenden Registrierungsdaten und die Bestandsliste vom -System bereinigen und dann den Kubernetes-Cluster erneut registrieren. Die Cluster-ID ist nach der erneuten Registrierung des Clusters eine andere. Wenn eine Antrea-Richtlinie auf den Cluster angewendet wird, müssen Sie die Richtlinie nach der erneuten Registrierung des Clusters erneut anwenden.

    Anweisungen zum Bereinigen der verbleibenden Registrierungsdaten finden Sie unter Bereinigen von Antrea-Daten in NSX.

    Anweisungen zum Registrieren eines Antrea-Containerclusters in NSX finden Sie unter Registrieren eines Antrea-Container-Clusters beim NSX.

  4. Verwenden Sie kubectl, um nsx-proxy-Containerprotokolle aus dem Interworking-Pod abzurufen, und überprüfen Sie die Fehlermeldungen.
    Dieser Schritt kann Ihnen dabei helfen, einen Fehler zu identifizieren, der durch einen der folgenden Gründe ausgelöst wurde:
    • Das Clientzertifikat der Adapter ist falsch.
    • Die Version der Adapter ist mit der CCP nicht kompatibel.

    In Schritt 3 finden Sie Beispiele für Befehle.

  5. Wenn der Management Plane-Adapter aktiv ist, verwenden Sie die Support-Paketfunktion in NSX, um Protokolldateien für den Containercluster zu erfassen.