クラスタ内のノードの大部分がダウンしている場合、NSX Manager はダウンしているか、使用できません。

問題

NSX Manager ユーザー インターフェイスのロードに失敗し、「 一部のアプライアンス コンポーネントが正常に機能していません。コンポーネントの健全性:POLICY:UNKNOWN, MANAGER:UNKNOWN, SEARCH:UNKNOWN, NO」というエラーが表示され、クラスタリング関連のコマンドは、CLI および API を介して失敗します。

解決方法

  1. 影響を受ける各 NSX Manager ノードに SSH 接続し、次のコマンドを実行します。
    1. get filesystem-stats を実行して、/config と /image が 100% 使用されている状態でないことを確認します。
    2. get core-dumps を実行して、NSX Manager でコアが生成されていないことを確認します。
    3. データストアが停止していないことを確認します。「データストア関連のコンポーネントがダウンしたために NSX Manager クラスタの状態が「劣化」になる」を参照してください。
    4. ログでメモリ不足エラーを確認します。/var/log/proton/proton-tomcat-wrapper.log を参照してください。
  2. クラスタリングとユーザー インターフェイスをリストアするには、3 ノード クラスタ内の 2 台のノードが稼動している必要があります。障害が発生したノードを再開できないが、使用できる健全なノードがある場合は、次のいずれかの手順を実行してクラスタリングをリストアします。
    • 新しいマネージャ ノードを(4 番目のメンバー ノードとして)展開し、既存のクラスタに参加し、CLI コマンド detach node <node-uuid> または API POST /api/v1/cluster/<node-uuid>?action=remove_node を使用して、失敗したノードのいずれかを接続解除します。コマンドは、健全なノードのいずれかから実行する必要があります。または、次の箇条書きの項目に従ってクラスタを無効にすることもできます。
    • (オプション)単一ノードのクラスタが作成されるように、アクティブ ノードで deactivate cluster コマンドを実行します。引き続き、新しいノードを追加して、3 メンバー NSX Manager クラスタを作成します。
      注: クラスタから削除された NSX Manager ノードは、パワーオフして、削除する必要があります。