NSX Manager est en panne ou indisponible si la majorité des nœuds du cluster sont inactifs.
Problème
Solution
- Connectez-vous via SSH à chacun des nœuds NSX Manager concernés et exécutez les commandes suivantes :
- Exécutez get file-system-stats et vérifiez que /config et /image n'est pas rempli à 100 %.
- Exécutez get core-dumps pour vérifier qu'aucun cœur n'a été généré dans NSX Manager.
- Vérifiez qu'il n'y a pas eu de panne de banque de données. Reportez-vous à la section État du cluster NSX Manager dégradé, car les composants liés à la banque de données sont inactifs.
- Recherchez les erreurs de mémoire insuffisante dans les journaux. Reportez-vous au journal /var/log/proton/proton-tomcat-wrapper.log
- Pour restaurer le clustering et l'interface utilisateur, 2 nœuds dans un cluster à 3 nœuds doivent être actifs. Si vous ne pouvez pas effectuer de sauvegarde de nœuds échoués, mais que vous disposez toujours d'un nœud sain, effectuez l'une des étapes suivantes pour restaurer le clustering :
- Déployez un nouveau nœud de gestionnaire (en tant que 4e nœud membre), joignez le cluster existant puis détachez l'un des nœuds ayant échoué en utilisant l'invite de commande CLI detach node <node-uuid> ou l'API POST /api/v1/cluster/<node-uuid>?action=remove_node. Les commandes doivent être exécutées à partir de l'un des nœuds sains. Vous pouvez également suivre le point à puces suivant pour désactiver le cluster.
- (Facultatif) Exécutez la commande deactivate cluster sur le nœud actif afin de vous retrouver avec un cluster à nœud unique. Ensuite, continuez à ajouter les nouveaux nœuds supplémentaires pour créer un cluster NSX Manager à 3 membres.
Note : Les nœuds NSX Manager qui sont supprimés du cluster doivent être mis hors tension et supprimés.