Vous pouvez rencontrer une alarme de perte de communication entre le NSX Manager et l'hôte. Les signaux de pulsation sont envoyés toutes les minutes du nœud de gestionnaire au nœud hôte. Cette alarme vous informe d'une perte de signal de pulsation, ce qui indique la dernière fois que NSX Manager et l'hôte ont communiqué.

Si l'hôte perd la connectivité au NSX Manager ou au service de contrôleur, une synchronisation complète de la configuration ou de l'état d'exécution, respectivement, est envoyée à l'hôte lorsque la connectivité est restaurée.

Les informations d'alarme s'affichent dans plusieurs emplacements de l'interface NSX Manager. Pour obtenir la liste complète des événements, reportez-vous au NSXCatalogue d'événements. Par exemple, les alarmes s'affichent sur la page Alarmes de l'interface utilisateur NSX Manager. Chaque alarme contient une action recommandée. Utilisez cette action et les informations de cette rubrique pour dépanner votre alarme.

Le tableau suivant décrit le protocole IP utilisé, le mécanisme de contrôle de santé des canaux et les temporisateurs associés, ainsi que les validations de contrôle de santé des canaux d'authentification, de sécurité et de communication. Il fournit également des informations sur les différents problèmes courants qui entraînent une dégradation de la santé de l'infrastructure.

Pour valider la santé des canaux de communication, utilisez les détails du tableau de surveillance de la santé NSX Manager.
Tableau 1. Surveillance de la santé NSX Manager
Communication Protocole et port IP Canal Authentification Contrôle de santé
Connectivité du Hub de proxy du dispositif du plan de gestion (MP APH) à l'hôte TCP:1234 TLS entre le gestionnaire et l'hôte Authentification TLS mutuelle basée sur des certificats auto-signés ou d'autorité de certification entre les clients (hôtes/nœuds de transport) et le serveur (APH dans MP) Pour déterminer l'état de connectivité entre le nœud de transport et les gestionnaires, utilisez get managers commande CLI sur le nœud de transport.

Diverses alarmes se déclenchent lorsque les canaux de communication entre MP et l'hôte sont déconnectés.

  • management_channel_to_transport_node_down alarme se déclenche lorsque MP et l'hôte sont déconnectés pendant plus de 5 minutes. La description de l'alarme mentionne le nom et l'adresse IP du nœud de transport : le canal de gestion vers le nœud de transport {transport_node_name} ({transport_node_address}) est inactif pendant 5 minutes.
  • L'alarme management_channel_to_transport_node_down_long se déclenche lorsque MP et l'hôte sont déconnectés pendant plus de 15 minutes. La description de l'alarme mentionne le nom et l'adresse IP du nœud de transport : le canal de gestion vers le nœud de transport {transport_node_name} ({transport_node_address}) est inactif pendant 15 minutes.
  • network_latency_high alarme se déclenche lorsque la latence entre MP et l'hôte est supérieure à 150 ms pour une durée de 5 minutes. La description de l'alarme mentionne le nom et l'adresse IP du nœud de transport : la latence réseau moyenne entre les nœuds de gestionnaire et l'hôte {transport_node_name} ({transport_node_address}) est supérieure à 150 ms pendant 5 minutes.

Si l'hôte se détache pour une raison quelconque, les alarmes sont effacées.

Connectivité du plan de contrôle central (CCP) à l'hôte (NSX-proxy) TCP : 1235 TLS entre CCP et l'hôte Authentification TLS mutuelle basée sur des certificats auto-signés ou d'autorité de certification entre le client (hôtes/nœuds de transport) et le serveur (CCP)

Pour déterminer l'état de connectivité entre le nœud de transport et CCP, utilisez get controllers commande d'interface de ligne de commande.

Diverses alarmes se déclenchent lorsque les canaux de communication entre MP et l'hôte sont déconnectés.
  • control_channel_to_manager_node_down alarme se déclenche lorsque l'hôte et le CCP sont déconnectés pendant plus de 3 minutes. Description de l'alarme : la connexion du plan de contrôle du nœud de transport {entity_id} au nœud de gestionnaire {appliance_address} est inactive pendant au moins {timeout_in_minutes} minutes du point de vue du nœud de transport.
  • L'alarme control_channel_to_manager_node_down_too_long se déclenche lorsque l'hôte et le CCP sont déconnectés pendant plus de 15 minutes. Description de l'alarme : la connexion du plan de contrôle du nœud de transport {entity_id} au nœud de gestionnaire {appliance_address} est inactive pendant au moins {timeout_in_minutes} minutes du point de vue du nœud de transport.