Wenn der Status des Antrea Kubernetes-Clusters inaktiv ist, führen Sie die Schritte in dieser Dokumentation aus, um die Ursache dieses Problems zu ermitteln und das Problem wiederherzustellen, oder erfassen Sie das Support-Paket.
Problem
Der Cluster-Control Plane-Knoten ist inaktiv. Der Antrea-Kubernetes-Cluster wird von der Zentralen Control Plane (CCP) getrennt.
Ursache
Navigieren Sie in der NSX Manager-Benutzeroberfläche zu . Filtern Sie bei Bedarf die Liste der Cluster auf der Seite Antrea mit dem Feld Externe ID.
Klicken Sie auf die Spalte
Status des problematischen Clusters. Wenn alle Komponenten inaktiv sind, sind folgende Ursachen möglich:
- Der Kubernetes-Cluster wird gelöscht.
- Netzwerkkonnektivitätsproblem mit CCP.
- Die Adapter stürzen aus irgendeinem Grund ab oder werden gelöscht.
- Das Clientzertifikat der Adapter ist falsch.
- Die Version der Adapter ist mit der CCP nicht kompatibel.
Wenn nur der Zentrale Control Plane(CCP)-Adapter ausgefallen ist, ist der CCP-Adapter möglicherweise abgestürzt.
Lösung
- Wenn der Kubernetes-Cluster gelöscht wird, bereinigen Sie die verbleibenden Registrierungs- und Bestandsdaten in NSX. Siehe Bereinigen von Antrea-Daten in NSX.
- Rufen Sie den kubectl- und kubeconfig-Zugang für den Kubernetes-Cluster ab. Verwenden Sie kubectl, um den Knotennamen abzurufen, auf dem der Interworking-Pod ausgeführt wird. Starten Sie eine SSH-Sitzung mit dem Knoten und verwenden Sie den Befehl curl oder nc, um eine Verbindung zu jeder NSX Manager-IP an den Ports 1234 und 1235 herzustellen. Wenn die Verbindung nicht hergestellt werden kann, ist die Ursache ein Netzwerkkonnektivitätsproblem mit der CCP.
Beispiel für den curl-Befehl:
Stellen Sie sicher, dass Sie die NSX-Manager-IP durch die IP-Adresse von NSX Manager in Ihrer Umgebung ersetzen.
curl -v NSX-Manager-IP:1235
Trying NSX-Manager-IP...
Connected to NSX-Manager-IP (NSX-Manager-IP) port 1235 (#0)
...
Empty reply from server
Connection #0 to host NSX-Manager-IP left intact
curl: (52) Empty reply from server
Beispiel für den nc-Befehl:
nc -v NSX-Manager-IP 1235 < /dev/null
Ncat: Version 7.50 (https://nmap.org/ncat)
Ncat: Connected to NSX-Manager-IP:1235.
Ncat: 0 bytes sent, 0 bytes received in 0.37 seconds.
- Verwenden Sie kubectl, um zu überprüfen, ob alle Container des Interworking-Pods im Namespace vmware-system-antrea aktiv sind.
Wenn ein Container ausgefallen ist, verwenden Sie kubectl, um Protokolle der abgestürzten Container abzurufen und die Fehlermeldung zu überprüfen. Dieser Schritt kann Ihnen dabei helfen, einen Fehler zu identifizieren, der durch einen der folgenden Gründe ausgelöst wurde:
- Die Adapter stürzen aus irgendeinem Grund ab oder werden gelöscht.
- CCP-Adapter ist abgestürzt.
Beispiel für den kubectl-Befehl zum Abrufen des Interworking-Pods:
kubectl get pod -o wide -l app=antrea-interworking -n vmware-system-antrea
Notieren Sie sich den Namen des Interworking-Pods.
Beispiel für den kubectl-Befehl zum Abrufen des detaillierten Zustands des Interworking-Pods:
Stellen Sie sicher, dass Sie pod-name durch den tatsächlichen Pod-Namen ersetzen.
kubectl get pod -o yaml pod-name -n vmware-system-antrea
Beispiel für den kubectl-Befehl zum Abrufen von Containerprotokollen:
Stellen Sie sicher, dass Sie pod-name durch den tatsächlichen Pod-Namen ersetzen.
kubectl logs pod-name -c mp-adapter -n vmware-system-antrea > mp-adapter.log
kubectl logs pod-name -c ccp-adapter -n vmware-system-antrea > ccp-adapter.log
kubectl logs pod-name -c tn-proxy -n vmware-system-antrea > tn-proxy.log
kubectl logs pod-name -c election-runner -n vmware-system-antrea > election-runner.log
Wenn der Namespace vmware-system-antrea fehlt oder der Interworking-Pod fehlt, wurden die Adapter möglicherweise aus dem Kubernetes-Cluster gelöscht, ohne die Schritte zum Aufheben der Registrierung auszuführen. Sie können die verbleibenden Registrierungsdaten und die Bestandsliste vom System bereinigen und dann den Kubernetes-Cluster erneut registrieren. Die Cluster-ID ist nach der erneuten Registrierung des Clusters eine andere. Wenn eine Antrea-Richtlinie auf den Cluster angewendet wird, müssen Sie die Richtlinie nach der erneuten Registrierung des Clusters erneut anwenden.
Anweisungen zum Bereinigen der verbleibenden Registrierungsdaten finden Sie unter Bereinigen von Antrea-Daten in NSX.
Anweisungen zum Registrieren eines Antrea-Kubernetes-Clusters in NSX finden Sie unter Registrieren eines Antrea-Kubernetes-Clusters beim NSX.
- Verwenden Sie kubectl, um nsx-proxy-Containerprotokolle aus dem Interworking-Pod abzurufen, und überprüfen Sie die Fehlermeldungen.
Dieser Schritt kann Ihnen dabei helfen, einen Fehler zu identifizieren, der durch einen der folgenden Gründe ausgelöst wurde:
- Das Clientzertifikat der Adapter ist falsch.
- Die Version der Adapter ist mit der CCP nicht kompatibel.
In Schritt 3 finden Sie Beispiele für Befehle.
- Wenn der Management Plane-Adapter aktiv ist, verwenden Sie die Support-Paketfunktion in NSX, um Protokolldateien für den Antrea-Kubernetes-Cluster zu erfassen.