如果叢集中的大多數節點都已關閉,則 NSX Manager 會處於關閉或無法使用狀態。

問題

NSX Manager UI 將無法載入,並顯示以下錯誤: 部分應用裝置元件未正常運作。元件健全狀況:POLICY:UNKNOWN, MANAGER:UNKNOWN, SEARCH:UNKNOWN, NO,使用 CLI 和 API 的叢集化相關命令將會失敗。

解決方案

  1. 請透過 SSH 來連線至每個受影響的 NSX Manager 節點,然後執行下列命令:
    1. 執行 get file-system-stats,並確認 /config 和 /image 未全滿。
    2. 執行 get core-dumps,以確認未在 NSX Manager 中產生任何核心傾印。
    3. 確認沒有資料存放區中斷問題。請參閱因為資料存放區相關元件已關閉,NSX Manager 叢集狀態為「已降級」
    4. 請查看記錄以瞭解記憶體不足錯誤。請參閱 /var/log/proton/proton-tomcat-wrapper.log
  2. 若要還原叢集和 UI,三節點叢集中的任兩個節點必須啟動。如果您無法復原任何失敗的節點,但仍有一個狀況良好的節點可用,請執行下列其中一個步驟來還原叢集:
    • 部署新的管理程式節點 (作為第 4 個成員節點),加入現有叢集,然後使用 CLI 命令 detach node <node-uuid> 或 API POST /api/v1/cluster/<node-uuid>?action=remove_node,來中斷其中一個失敗節點的連結。應從其中一個狀況良好的節點執行命令。或者,您也可以遵循下一個項目符號要點來停用該叢集。
    • (選用) 在作用中節點上執行 deactivate cluster 命令,以便最終使用單一節點叢集。現在,繼續新增其他節點,以建立一個包含 3 個成員的 NSX Manager 叢集。
      備註: 對於已從叢集中移除的 NSX Manager 節點應關閉電源並予以刪除。