NSX Manager とホスト間の通信が失われたことを示すアラームが発生する場合があります。ハートビートは、マネージャ ノードからホスト ノードに 1 分ごとに送信されます。このアラームはハートビートの喪失を通知します。これは、NSX Manager とホストが最後に通信した時刻を示します。

ホストが NSX Manager またはコントローラ サービスへの接続を失った場合、接続が復元されたときに、完全な構成またはランタイムの状態の同期が、それぞれホストに送信されます。

アラーム情報は、NSX Manager インターフェイスの複数の場所に表示されます。イベントの完全なリストについては、NSX イベント カタログを参照してください。たとえば、アラームは、NSX Manager ユーザー インターフェイスの [アラーム] ページに表示されます。すべてのアラームには推奨アクションが含まれています。このアクションおよびこのトピックの情報を使用して、アラームのトラブルシューティングを行います。

次の表では、使用される IP プロトコル、チャネル健全性チェック メカニズムと関連タイマー、認証、セキュリティ、および通信チャネル健全性チェックの検証について説明します。また、ファブリックの健全性の劣化につながるいくつかの一般的な問題についての詳細情報も提供します。

通信チャネルの健全性を検証するには、NSX Manager の健全性モニターの表の詳細を使用します。
表 1. NSX Manager の健全性モニター
通信 IP プロトコルとポート チャネル 認証 健全性チェック
管理プレーン アプライアンス プロキシ ハブ (MP APH) からホストへの接続 TCP:1234 マネージャとホスト間の TLS クライアント(ホスト/トランスポート ノード)とサーバ(管理プレーンの APH)間の自己署名証明書または CA 証明書に基づく相互 TLS 認証 トランスポート ノードとマネージャ間の接続状態を確認するには、トランスポート ノードで get managers CLI コマンドを使用します。

管理プレーンとホスト間の通信チャネルが切断状態になると、さまざまなアラームが発生します。

  • 管理プレーンとホストが 5 分以上切断されると、management_channel_to_transport_node_down アラームが発生します。アラームの説明にはトランスポート ノード名と IP アドレスが記載されています:トランスポート ノード {transport_node_name} ({transport_node_address}) への管理チャネルが 5 分間停止しています。
  • 管理プレーンとホストが 15 分以上切断されると、management_channel_to_transport_node_down_long アラームが発生します。アラームの説明にはトランスポート ノード名と IP アドレスが記載されています:トランスポート ノード {transport_node_name} ({transport_node_address}) への管理チャネルが 15 分間停止しています。
  • 管理プレーンとホスト間の遅延が 5 分間で 150 ミリ秒を超えると、network_latency_high アラームが発生します。アラームの説明にはトランスポート ノード名と IP アドレスが記載されています:マネージャ ノードとホスト {transport_node_name} ({transport_node_address}) 間の平均ネットワーク遅延が 5 分間で 150 ミリ秒を超えています。

何らかの理由でホストが切断された場合、アラームはクリアされます。

中央制御プレーン (CCP) からホスト(NSX プロキシ)への接続 TCP:1235 CCP とホスト間の TLS クライアント(ホスト/トランスポート ノード)とサーバ (CCP) 間の自己署名証明書または CA 証明書に基づく相互 TLS 認証

トランスポート ノードと CCP 間の接続状態を確認するには、get controllers CLI コマンドを使用します。

管理プレーンとホスト間の通信チャネルが切断状態になると、さまざまなアラームが発生します。
  • ホストと CCP が 3 分以上切断されると、control_channel_to_manager_node_down アラームが発生します。アラームの説明:トランスポート ノード {entity_id} の制御プレーンからマネージャ ノード {appliance_address} への接続が停止しています。トランスポート ノード側からみると、少なくとも {timeout_in_minutes} 分間停止しています。
  • ホストと CCP が 15 分以上切断されると、control_channel_to_manager_node_down_too_long アラームが発生します。アラームの説明:トランスポート ノード {entity_id} の制御プレーンからマネージャ ノード {appliance_address} への接続が停止しています。トランスポート ノード側からみると、少なくとも {timeout_in_minutes} 分間停止しています。