Problème

La connectivité MPA du dispositif NSX Edge est inactive en raison d'une panne du service d'infrastructure.

Cause

Des disques de nœud NSX Edge saturés ou une fuite de mémoire peuvent entraîner le blocage de certains processus et cet échec. La CLI admin get managers peut renvoyer le nœud de gestionnaire actif (si une panne s'est produite après l'enregistrement réussi du gestionnaire) et la CLI admin get controller génère l'erreur Échec de l'obtention de la liste des contrôleurs.

Solution

  1. Exécutez la CLI admin get diagnosis config ou GET API /api/v1/transport-nodes/{transport-node-id}/node/diagnosis pour diagnostiquer les échecs liés à la santé des nœuds NSX Edge qui sont causés lorsque les services deviennent inactifs.
  2. Exécutez la CLI admin get cores-dumps pour voir si des cœurs ont été générés (dans /var/core ou /image/core) en raison d'une panne du service. Si le vidage de mémoire est visible, exécutez cmd top -o %MEM en tant que racine pour voir quel processus NSX consomme trop de mémoire et CLI admin get filesystem-status pour vérifier si les partitions de disque utilisées par NSX ne sont pas complètes ou presque.
  3. Exécutez la CLI racine /etc/init.d/nsx-proxy | nsx-nestdb status pour obtenir l'état des services d'infrastructure sur l'hôte NSX Edge.
  4. Nettoyez l'espace disque, puis démarrez tous les services d'infrastructure arrêtés sur l'hôte en émettant la commande /etc/init.d/<service-name> start (comme solution temporaire). Ouvrez un dossier de support auprès de VMware si des cœurs sont détectés.