問題

トランスポート ノードとして準備された ESXi ホストの状態が、 NSX Manager への接続が失われたために「 不明」または「 切断」状態になります。 NSX に次のエラーが表示されます:「 NSX 管理ノードとホスト <uuid> 間のハートビートが停止しています」。

原因

ESXi ディスクがいっぱいになっているか、メモリ リークが原因でホスト インフラストラクチャ サービスが停止している場合、この状態になる可能性があります。ESXi の場合。

ESXi ディスクがいっぱいの場合、またはメモリ リークが発生した場合は、特定のプロセスがクラッシュし、トランスポート ノードが「 切断」状態になる可能性があります。admin cli get managers を実行したときに、マネージャの登録に成功した後にクラッシュが発生すると、NSX がアクティブなマネージャ ノードを返す場合があります。admin cli get controllers を実行すると、NSX はエラー「 コントローラ リストの取得に失敗しました」を表示します。

解決方法

  1. admin cli get core-dumps を実行して、サービスのクラッシュが原因で(/var/core または /image/core)コアが生成されたかどうかを確認します。
  2. コア ダンプが発生する場合は、コマンド esxtop を実行して、どの NSX プロセスが大量のメモリを消費しているかを確認し、df -h を実行して、NSX で使用されるディスク パーティションがいっぱいになっていないか、またはいっぱいに近いかどうかを確認します。
  3. /etc/init.d/nsx-proxy | nsx-nestdb status を実行して、ホスト上のインフラストラクチャ サービスの状態を取得します。
  4. ディスク容量をクリーンアップしてから、(一時的な回避策として)コマンド /etc/init.d/<service-name> start を発行して、ホスト上で停止したインフラストラクチャ サービスを開始します。
  5. コアが見られる場合は、VMware でサポート ケースを開きます。