Si l'état du cluster de conteneurs Antrea est inactif, suivez les étapes décrites dans cette documentation pour déterminer la cause de ce problème et récupérer à partir de celui-ci ou collecter le bundle de support.

Problème

Le nœud du plan de contrôle du cluster est inactif. Le cluster de conteneurs Antrea est déconnecté du plan de contrôle central (CCP).

Cause

Dans l'interface utilisateur NSX Manager, accédez à Système > Infrastructure > Nœuds > Clusters de conteneurs > Antrea. Si nécessaire, filtrez la liste des clusters sur la page Antrea avec le champ ID externe.

Cliquez sur la colonne État du cluster problématique. Si tous les composants sont inactifs, les causes possibles sont les suivantes :
  • Le cluster Kubernetes est supprimé.
  • Problème de connectivité réseau avec le CCP.
  • Les adaptateurs sont bloqués ou supprimés pour une raison quelconque.
  • Le certificat client des adaptateurs est incorrect.
  • La version des adaptateurs est incompatible avec le CCP.

Si seul l'Adaptateur de plan de contrôle central est inactif, l'adaptateur CCP peut s'être bloqué.

Solution

  1. Si le cluster Kubernetes est supprimé, nettoyez les données d'enregistrement et d'inventaire restantes dans NSX. Reportez-vous à la section Nettoyer les données Antrea de NSX.
  2. Obtenez l'accès kubectl et kubeconfig pour le cluster de conteneurs. Utilisez kubectl pour récupérer le nom du nœud sur lequel l'espace d'interfonctionnement est en cours d'exécution. Démarrez une session SSH sur le nœud et utilisez la commande curl ou nc pour vous connecter à chaque adresse IP NSX Manager sur les ports 1234 et 1235. Si la connexion ne peut pas être établie, cela est dû à un problème de connectivité réseau avec le CCP.
    Exemple de commande curl :

    Assurez-vous de remplacer NSX-Manager-IP par l'adresse IP de NSX Manager dans votre environnement.

    curl -v NSX-Manager-IP:1235
    
    Trying NSX-Manager-IP... 
    Connected to NSX-Manager-IP (NSX-Manager-IP) port 1235 (#0) 
    ... 
    Empty reply from server 
    Connection #0 to host NSX-Manager-IP left intact 
    curl: (52) Empty reply from server

    Exemple de commande nc :

    nc -v NSX-Manager-IP 1235 < /dev/null
    
    Ncat: Version 7.50 (https://nmap.org/ncat)
    Ncat: Connected to NSX-Manager-IP:1235.
    Ncat: 0 bytes sent, 0 bytes received in 0.37 seconds.
  3. Utilisez kubectl pour vérifier si tous les conteneurs de l'espace d'interfonctionnement dans l'espace de noms vmware-system-antrea sont actifs.
    Si un conteneur est inactif, utilisez kubectl pour obtenir les journaux des conteneurs bloqués et vérifier le message d'erreur. Cette étape peut vous aider à identifier les échecs pour l'une des raisons suivantes :
    • Les adaptateurs sont bloqués ou supprimés pour une raison quelconque.
    • L'adaptateur CCP est bloqué.
    Exemple de commande kubectl pour obtenir l'espace d'interfonctionnement :
    kubectl get pod -o wide -l app=antrea-interworking -n vmware-system-antrea

    Notez le nom de l'espace d'interfonctionnement.

    Exemple de commande kubectl pour obtenir l'état détaillé de l'espace d'interfonctionnement :

    Veillez à remplacer pod-name par le nom réel de l'espace.

    kubectl get pod -o yaml pod-name -n vmware-system-antrea

    Exemple de commande kubectl pour l'obtention des journaux de conteneur :

    Veillez à remplacer pod-name par le nom réel de l'espace.

    kubectl logs pod-name -c mp-adapter -n vmware-system-antrea > mp-adapter.log
    kubectl logs pod-name -c ccp-adapter -n vmware-system-antrea > ccp-adapter.log
    kubectl logs pod-name -c tn-proxy -n vmware-system-antrea > tn-proxy.log
    kubectl logs pod-name -c election-runner -n vmware-system-antrea > election-runner.log

    Si l'espace de noms vmware-system-antrea est manquant ou si l'espace d'interfonctionnement est manquant, les adaptateurs peuvent avoir été supprimés du cluster Kubernetes sans exécuter les étapes de désinscription. Vous pouvez nettoyer les données d'enregistrement et l'inventaire restants du système, puis enregistrer de nouveau le cluster Kubernetes. L'ID du cluster sera différent après le réenregistrement du cluster. Si une stratégie Antrea est appliquée au cluster, vous devez la réappliquer après avoir réenregistré le cluster.

    Pour obtenir des instructions sur le nettoyage des données d'enregistrement restantes, reportez-vous à la section Nettoyer les données Antrea de NSX.

    Pour obtenir des instructions sur l'enregistrement d'un cluster de conteneurs Antrea dans NSX, reportez-vous à la section Enregistrement d'un cluster de conteneurs Antrea dans NSX-T Data Center.

  4. Utilisez kubectl pour obtenir les journaux du conteneur nsx-proxy à partir de l'espace d'interfonctionnement et vérifiez les messages d'erreur.
    Cette étape peut vous aider à identifier les échecs pour l'une des raisons suivantes :
    • Le certificat client des adaptateurs est incorrect.
    • La version des adaptateurs est incompatible avec le CCP.

    Reportez-vous à l'étape 3 pour voir des exemples de commandes.

  5. Si l'Adaptateur de plan de gestion est actif, utilisez la fonctionnalité de bundle de support dans NSX pour collecter des fichiers journaux pour le cluster de conteneurs.

    Pour plus d'informations, reportez-vous à la section Collecter des bundles de support pour un cluster de conteneurs Antrea.