当出现 NSX Controller 故障时,可能仍有两个控制器正在工作。此时保持着群集多数,并且控制层面仍继续正常工作。尽管如此,您也必须将三个控制器全部删除并添加新的控制器,以便维护完全正常工作的三节点群集。

当一个或多个控制器遇到不可恢复的灾难性错误,或者一个或多个控制器虚拟机变为无法访问并且无法修复时,建议删除控制器群集。

在这种情况下,虽然部分控制器看似运行良好,我们也建议删除所有控制器。建议的过程是先创建新的控制器群集,然后在 NSX Manager 上使用“更新控制器状态”机制将状态同步到控制器。

过程

  1. 登录到 vSphere Web Client。
  2. 网络和安全 中,单击安装 > 管理
  3. 在“NSX Controller 节点”部分中,单击每个控制器并获取详细信息屏幕的屏幕截图/打印屏幕,或者记下配置信息以供将来参考。

    例如:

  4. 在“NSX Controller 节点”部分中,将三个节点全部删除,方法是选择每个节点并单击删除节点 (x) 图标。

    当系统中不存在任何控制器时,主机将在所谓的“无头”模式下工作。新虚拟机或已执行 vMotion 操作的虚拟机将遇到网络问题,直至部署了新的控制器并且同步已完成为止。

  5. 部署三个新的 NSX Controller 节点,方法是单击添加节点 (+) 图标。
  6. 在“添加控制器”对话框中,选择要添加节点的数据中心,然后配置控制器设置。
    1. 选择适当的群集。
    2. 在群集和存储中选择一个主机。
    3. 选择分布式端口组。
    4. 选择要将其中的 IP 地址分配给节点的 IP 池。
    5. 单击确定,等待安装完成,并确保所有节点的状态均为“正常”。
  7. 重新同步控制器状态,方法是单击操作 > 更新控制器状态

    更新控制器状态将当前 VXLAN 和分布式逻辑路由器配置(包括跨 VC NSX 部署中的通用对象)从 NSX Manager 推送到控制器群集。