NSX Controller 群集必须具有至少三个成员。如果 NSX Controller 设备无法运行,或者出于其他任何原因需要从群集中移除该设备,您必须先添加新的 NSX Controller 设备以创建四个成员的群集。在添加第四个成员后,您可以从群集中移除一个 NSX Controller 设备。

前提条件

  • 通过故障排除确认无法恢复设备。例如,以下步骤可以恢复设备,而无需更换这些设备。
    • 确认设备具有网络连接;如果没有,请解决该问题。
    • 重新引导设备。
  • 确认您了解要替换的 NSX Controller 版本,并具有相同版本的相应安装文件(OVA、OVF 或 QCOW2)。

过程

  1. 安装并配置新的 NSX Controller
    有关这些步骤的信息和说明,请参阅《 《NSX-T Data Center 安装指南》》。
    1. 安装新的 NSX Controller 设备。
      NSX Controller 的版本必须与要替换的 NSX Controller 相同。
    2. 将新的 NSX Controller 加入管理层面。
    3. 将新的 NSX Controller 加入控制群集。
  2. 关闭要从群集中移除的 NSX Controller
  3. 登录到另一个 NSX Controller,然后检查要移除的 NSX Controller 是否具有 not active 状态。
    nsx-controller-1> get control-cluster status
    uuid: e075cf44-0d49-4eb2-9e4f-d8b10ca97a3b
    is master: true           
    in majority: true           
    uuid                                 address              status              
    06996547-f50c-43c0-95c1-8bb644dea498 192.168.110.53       active              
    471e5ac0-194b-437c-9359-564cea845333 192.168.110.54       active              
    e075cf44-0d49-4eb2-9e4f-d8b10ca97a3b 192.168.110.51       active              
    863f9669-509f-4eba-b0ac-61a9702a242b 192.168.110.52       not active
  4. 将控制器与群集断开连接。
    nsx-controller-1> detach control-cluster 192.168.110.52
    Successfully detached node from the control cluster.
    
  5. 将控制器与管理层面断开连接。
    nsx-manager-1> detach controller 863f9669-509f-4eba-b0ac-61a9702a242b
    The detach operation completed successfully
  6. 验证控制器是否处于活动状态,以及控制群集是否处于稳定状态。
    NSX Controller 中:
    nsx-controller-1> get control-cluster status 
    uuid: e075cf44-0d49-4eb2-9e4f-d8b10ca97a3b
    is master: true           
    in majority: true           
    uuid                                 address              status              
    06996547-f50c-43c0-95c1-8bb644dea498 192.168.110.53       active              
    471e5ac0-194b-437c-9359-564cea845333 192.168.110.54       active              
    e075cf44-0d49-4eb2-9e4f-d8b10ca97a3b 192.168.110.51       active
    NSX Manager 中:
    nsx-manager-1> get management-cluster status
    Number of nodes in management cluster: 1
    - 192.168.110.201  (UUID 4213216E-F93A-71B2-DA20-AFE5E714644F) Online     
    
    Management cluster status: STABLE
    
    Number of nodes in control cluster: 3
    - 192.168.110.51   (UUID e075cf44-0d49-4eb2-9e4f-d8b10ca97a3b)
    - 192.168.110.53   (UUID 06996547-f50c-43c0-95c1-8bb644dea498)
    - 192.168.110.54   (UUID 471e5ac0-194b-437c-9359-564cea845333)
    
    Control cluster status: STABLE
    

结果

注: 已使用 detach 命令移除的控制器仍保留某些配置信息。如果要再次将控制器加入到任何控制器群集,则必须在控制器上运行以下 CLI 命令以移除失效信息:
    deactivate control-cluster