在集群的三个 NSX Advanced Load Balancer 控制器 节点中的两个节点永久关闭并且无法恢复时,由于未达到集群仲裁数,集群中的其余控制器节点将标记为“关闭”运行状态。
所有 SE 将继续在无主模式下运行。
按照以下步骤恢复为高可用三节点集群:
要恢复集群,您必须先将其余正常运行的控制器节点转换为单节点集群配置。然后,可以将两个新节点添加到集群中。
可以使用两种方法恢复控制器,即具有配置和没有配置。要恢复一个具有配置的节点,请务必确保将其指定为控制器主节点,而将其他节点作为从属节点添加到集群中:
要恢复具有配置的控制器,请使用
/opt/avi/scripts/recover_cluster.py
脚本。要恢复没有配置的控制器(实际上是出厂重置;很少需要这样做),请改用
/opt/avi/scripts/clean_cluster.py
脚本。这是不可撤销的。控制器将需要更长的时间以重新创建数据库。/opt/avi/scripts/clean_cluster.py
脚本执行以下任务:默认情况下,该脚本重新引导连接的 SE,除非使用以下开关运行该脚本。
/opt/avi/scripts/clean_cluster.py --skip-se-reboot
在运行脚本后,登录到控制器节点的唯一方法是通过 UI 重置 admin 密码。
典型恢复
要将其余控制器节点转换为单节点集群,同时保留 NSX Advanced Load Balancer 配置,请从 root 帐户中执行以下脚本。如果尝试从非 root 帐户中执行该脚本,脚本将失败并显示权限被拒绝 (Permission denied) 消息。在运行该脚本之前,运行 sudo
并输入要提升为 root 的 admin 密码。
root@controller1:/home/admin# /opt/avi/scripts/recover_cluster.py
该脚本将要求进行确认以防万一,并提醒用户必须以 root 身份运行该脚本。
强烈建议在运行 recover_cluster.py
脚本时关闭集群包含的其他控制器的电源。否则,可能会使当前节点和其他节点处于无法运行状态。
该脚本停止控制器上的所有服务,然后重新启动它们。控制器将关闭几分钟,在此期间无法进行访问。
在该脚本完成后,您能够登录到采用单节点集群形式的控制器节点。要使其成为高可用性的三节点集群,请在集群中添加两个新的未配置的控制器节点。
确保控制器具有相同的基础版本和修补程序版本。