NSX Manager est lent à charger et les tâches échouent avec le message le serveur est surchargé ou trop de demandes.

Problème

Le chargement de l'interface utilisateur de NSX Manager échoue avec l'erreur suivante : Certains composants du dispositif ne fonctionnent pas correctement. Santé des composants : POLICY:UNKNOWN, MANAGER:UNKNOWN, SEARCH:UNKNOWN, NO et les commandes de création de cluster échouent à l'aide de la CLI et de l'API.

Solution

  1. Connectez-vous via SSH à chacun des nœuds NSX Manager concernés et exécutez les commandes suivantes :
    1. Exécutez get file-system-stats et vérifiez que /config et /image n'est pas rempli à 100 %.
    2. Exécutez get core-dumps pour vérifier qu'aucun cœur n'a été généré dans NSX Manager.
    3. Vérifiez qu'il n'y a pas eu de panne de banque de données, comme indiqué à l'étape 1b ci-dessus.
    4. Recherchez les erreurs de mémoire insuffisante dans les journaux. Reportez-vous au journal /var/log/proton/proton-tomcat-wrapper.log
  2. Pour restaurer le clustering et l'interface utilisateur, 2 nœuds dans un cluster à 3 nœuds doivent être actifs. Si vous ne pouvez pas effectuer de sauvegarde de nœuds arrêtés, mais que vous disposez toujours d'un nœud sain, effectuez l'une des étapes suivantes pour restaurer le clustering :
    • Déployez un nouveau nœud de gestionnaire (en tant que 4e nœud membre), joignez le cluster existant puis détachez l'un des nœuds ayant échoué en utilisant l'invite de commande CLI detach node <node-uuid> ou l'API POST /api/v1/cluster/<node-uuid>?action=remove_node. Les commandes doivent être exécutées à partir de l'un des nœuds sains.
    • Exécutez la commande deactivate cluster sur le nœud actif afin de vous retrouver avec un cluster à nœud unique. Ensuite, continuez à ajouter les nouveaux nœuds supplémentaires pour créer un cluster NSX Manager à 3 membres.
      Note : Les nœuds NSX Manager qui sont supprimés du cluster doivent être mis hors tension et supprimés.