如果主单元未正常运行,要恢复 VMware Cloud Director 数据库,则其中一个备用单元必须成为新的主单元,且您必须部署新的备用单元。VMware Cloud Director 设备会自动将备用单元提升为新的主单元,或者您必须手动提升备用单元,具体取决于故障模式。
根据 VMware Cloud Director 设备的故障切换模式,有两个不同的工作流可用于从主单元故障中恢复。部署新的备用单元时,可以使用这些工作流重用出现故障的主单元的 IP 地址和主机名。
手动故障切换模式的恢复工作流
如果主单元处于“Not reachable
”或“Failed
”状态,并且两个备用单元处于“Running
”状态,则可以使用设备 HTML5 用户界面和 VMware Cloud Director 设备 API 从故障中恢复。
要查看集群中单元的状态,请参见查看 VMware Cloud Director 设备集群运行状况和故障切换模式。
- 如果可能,使用单元管理工具关闭 VMware Cloud Director 进程。从出现故障的主单元中,运行以下命令
/opt/vmware/vcloud-director/bin/cell-management-tool -u <sysadmin user> cell --shutdown
- 关闭出现故障的主 VM。
- 将备用单元提升为新的主单元。
- 以 root 用户身份登录到正在运行的备用单元的设备管理用户 UI:https://standby_ip_address:5480。
- 在要成为新主单元的备用单元的角色列中,单击提升。
管理 UI 显示具有主要角色的两个单元。原始主单元具有失败状态,新的主单元具有正在运行状态。集群运行状况为已降级。
- 从除出现故障的主单元外的任何单元,使用设备 API Unregister 方法,从 repmgr 高可用性集群中移除出现故障的主设备。请参见 VMware Cloud Director 设备 API 文档。
- 将出现故障的主设备从 VMware Cloud Director 服务器组中移除。
- 以管理员身份登录到 Service Provider Admin Portal。
- 从顶部导航栏的资源下,选择云资源。
- 在左侧面板中,单击云单元。
- 选择非活动单元,然后单击取消注册。
- 如果要重用出现故障的主设备的 IP 地址和主机名,请确保出现故障的主设备保持关闭状态,或者使用 vSphere Client 将其删除。
- 部署新的备用设备。您可以使用 vSphere Client 部署设备或使用 VMware OVF Tool 部署设备。
部署新的备用设备后,集群运行状况必须为 Healthy。
- 如果在还原之前启用了 VMware Cloud Director 设备 FIPS 模式,则必须使用 VMware Cloud Director 设备 API 对其进行重新设置。
单元 FIPS 模式会自动还原。
自动故障切换模式的恢复工作流
如果主单元处于 Failed
状态,VMware Cloud Director 会自动将备用单元提升为新的正在运行的主单元,但集群处于已降级状态,因为只有一个正在运行的备用单元。您可以使用 HTML5 用户界面和 VMware Cloud Director 设备 API 从故障中恢复。
要查看集群中单元的状态,请参见查看 VMware Cloud Director 设备集群运行状况和故障切换模式。
- 如果可能,使用单元管理工具关闭 VMware Cloud Director 进程。从出现故障的主单元中,运行以下命令
/opt/vmware/vcloud-director/bin/cell-management-tool -u <sysadmin user> cell --shutdown
- 关闭出现故障的主 VM。
管理 UI 显示具有主要角色的两个单元。原始主单元为失败状态,新的主单元为正在运行状态。集群运行状况为已降级。
- 从除出现故障的主单元外的任何单元,使用设备 API Unregister 方法,从 repmgr 高可用性集群中移除出现故障的主设备。请参见 VMware Cloud Director 设备 API 文档。
- 将出现故障的主设备从 VMware Cloud Director 服务器组中移除。
- 以管理员身份登录到 Service Provider Admin Portal。
- 从顶部导航栏的资源下,选择云资源。
- 在左侧面板中,单击云单元。
- 选择非活动单元,然后单击取消注册。
- 如果要重用出现故障的主设备的 IP 地址和主机名,请确保出现故障的主设备已关闭,或者使用 vSphere Client 将其删除。
- 部署新的备用设备。您可以使用 vSphere Client 部署设备或使用 VMware OVF Tool 部署设备。部署新的备用设备后,集群运行状况必须为 Healthy。
- 从除出现故障的主单元外的任何单元,使用设备 API Failover 方法将集群故障切换模式重置为
Automatic
。请参见 VMware Cloud Director 设备 API 文档。 - 如果在还原之前启用了 VMware Cloud Director 设备 FIPS 模式,则必须使用 VMware Cloud Director 设备 API 对其进行重新设置。
单元 FIPS 模式会自动还原。