如果無法復原 NSX Controller 叢集,或您因叢集成員資格變更而需要取代一或多個控制器,則應還原整個控制器叢集。

執行這項作業的原因和時機

在還原控制器叢集前,您必須將管理層所知的叢集成員資格與控制器所知的實際成員資格進行比對,來判斷控制叢集成員資格是否有變更。如果在備份後進行變更,成員資格便會不同。

先決條件

  • 確認您的叢集層級備份為最新版本。

  • 執行叢集層級還原。請參閱還原叢集備份

程序

  1. 登入 NSX Manager 的 CLI,然後執行 get management-cluster status 命令。
  2. 登入 NSX Controller 的 CLI,然後執行 get managers 命令以確保控制器登錄至 Manager。
  3. 執行 get control-cluster status 命令。
  4. 若要判斷成員資格是否已變更,請將 get management-cluster status 命令輸出中的 IP 位址和 get control-cluster status 命令輸出中的 IP 位址進行比對。

    如果兩個輸出的所有 IP 位址皆相同,即不需執行任何動作。如果有 IP 位址不同,請繼續進行剩餘的步驟以還原整個控制器叢集。

  5. 登入 NSX Controller 的 CLI,透過執行 get control-cluster status 命令來判斷主控制器。

    主控制器輸出將顯示 is master: true

  6. 在非主控制器上執行 stop service <controller> 命令。
  7. 登入主控制器,然後執行 detach control-cluster <ip-address[:port]> 命令以與上個步驟中的非主控制器中斷連結。
  8. (選擇性步驟) 請只在 get management-cluster status 命令於 NSX Manager 上顯示此控制器時,再於 NSX Manager 上執行 detach controller <uuid> 命令來與此控制器中斷連結。
  9. 登入 NSX Controller 的 CLI,然後執行 deactivate control-cluster 命令。
  10. 透過下列命令移除啟動程序檔案和 UUID 檔案:rm -r /opt/vmware/etc/bootstrap-configrm -r /config/vmware/node-uuid
  11. 針對剩餘的非主控制器執行步驟 6-10。
  12. 登入主控制器的 CLI,然後執行 stop service <controller> 命令。
  13. NSX Manager 上執行 detach controller <uuid> 命令以與此控制器中斷連結。
  14. 登入主控制器的 CLI,然後執行 deactivate control-cluster 命令。
  15. 透過下列命令移除啟動程序檔案和 UUID 檔案:rm -r /opt/vmware/etc/bootstrap-configrm -r /config/vmware/node-uuid
  16. NSX Manager 執行 get management-cluster status 命令。如果輸出中仍顯示控制器,請執行 detach controller <uuid> 命令以和所有剩餘的控制器中斷連結。

下一步

遵循列出的順序來完成下列工作。

  1. 完成節點層級還原。請參閱還原 NSX Manager 節點備份

  2. 請依照《NSX-T 安裝指南》所述,將 NSX Controller 與管理平面聯結。

  3. 請依照《NSX-T 安裝指南》所述,重新部署 NSX Controller 叢集。