如果无法恢复 NSX Controller 群集,或者由于更改了群集成员资格而需要替换一个或多个控制器,则应该还原整个控制器群集。

在还原控制器群集之前,请先确定是否将控制群集成员资格从管理层面已知的成员资格更改为控制器本身已知的实际成员资格或相反。如果在备份后进行了更改,则成员资格可能会有所不同。

前提条件

  • 确认您具有最新的备份。

  • 执行还原。请参见还原备份

过程

  1. 登录到 NSX Manager 的 CLI,然后运行 get management-cluster status 命令。
  2. 登录到 NSX Controller 的 CLI,然后运行 get managers 命令以确保在管理器中注册该控制器。
  3. 运行 get control-cluster status 命令。
  4. 要确定是否更改了成员资格,请将 get management-cluster status 命令输出中的 IP 地址与 get control-cluster status 命令输出进行比较。
    如果 IP 地址集相同,则不需要执行任何操作。如果任何 IP 地址不相同,请继续执行其余步骤以还原整个控制器群集。
  5. 登录到 NSX Controller 的 CLI,然后运行 get control-cluster status 命令以确定哪个控制器是主控制器。
    主控制器输出将显示 is master: true
  6. 在某个非主控制器上运行 stop service <controller> 命令。
  7. 登录到主控制器,然后运行 detach control-cluster <ip-address[:port]> 命令以断开连接上一步中的非主控制器。
  8. (可选)只有在 get management-cluster status 命令在 NSX Manager 上显示该控制器时,才应在 NSX Manager 上运行 detach controller <uuid> 命令以断开连接该控制器。
  9. 登录到 NSX Controller 的 CLI,然后运行 deactivate control-cluster 命令。
  10. 使用以下命令移除引导文件和 uuid 文件:rm -r /opt/vmware/etc/bootstrap-configrm -r /config/vmware/node-uuid
  11. 对于其余非主控制器,执行步骤 6-10。
  12. 登录到主控制器的 CLI,然后运行 stop service <controller> 命令。
  13. NSX Manager 上运行 detach controller <uuid> 命令以断开连接该控制器。
  14. 登录到主控制器的 CLI,然后运行 deactivate control-cluster 命令。
  15. 使用以下命令移除引导文件和 uuid 文件:rm -r /opt/vmware/etc/bootstrap-configrm -r /config/vmware/node-uuid
  16. NSX Manager 中运行 get management-cluster status 命令。如果在输出中仍显示控制器,请运行 detach controller <uuid> 命令以断开连接任何剩余的控制器。

后续步骤

按列出的顺序完成以下任务。

  1. 完成还原。
  2. NSX Controller 加入管理层面,如《NSX-T 安装指南》中所述。
  3. 重新部署 NSX Controller 群集,如《NSX-T 安装指南》中所述。