如果主单元未正常运行,要恢复 VMware Cloud Director 数据库,则其中一个备用单元必须成为新的主单元,且您必须部署新的备用单元。VMware Cloud Director 设备会自动将备用单元提升为新的主单元,或者您必须手动提升备用单元,具体取决于故障模式。

根据 VMware Cloud Director 设备的故障切换模式,有两个不同的工作流可用于从主单元故障中恢复。部署新的备用单元时,可以使用这些工作流重用出现故障的主单元的 IP 地址和主机名。

手动故障切换模式的恢复工作流

如果主单元处于“Not reachable”或“Failed”状态,并且两个备用单元处于“Running”状态,则可以使用设备 HTML5 用户界面和 VMware Cloud Director 设备 API 从故障中恢复。

要查看集群中单元的状态,请参见查看 VMware Cloud Director 设备集群运行状况和故障切换模式

  1. 如果可能,使用单元管理工具关闭 VMware Cloud Director 进程。从出现故障的主单元中,运行以下命令
    /opt/vmware/vcloud-director/bin/cell-management-tool  -u <sysadmin user> cell --shutdown
  2. 关闭出现故障的主 VM。
  3. 将备用单元提升为新的主单元。
    1. root 用户身份登录到正在运行的备用单元的设备管理用户 UI:https://standby_ip_address:5480
    2. 在要成为新主单元的备用单元的角色列中,单击提升

    管理 UI 显示具有主要角色的两个单元。原始主单元具有失败状态,新的主单元具有正在运行状态。集群运行状况为已降级

  4. 从除出现故障的主单元外的任何单元,使用设备 API Unregister 方法,从 repmgr 高可用性集群中移除出现故障的主设备。请参见 VMware Cloud Director 设备 API 文档。
  5. 将出现故障的主设备从 VMware Cloud Director 服务器组中移除。
    1. 管理员身份登录到 Service Provider Admin Portal
    2. 在左侧一级导航面板中选择资源,然后在页面顶部导航栏中选择云资源
    3. 在左侧二级导航面板中,单击云单元
    4. 选择非活动单元,然后单击取消注册
  6. 如果要重用出现故障的主设备的 IP 地址和主机名,请确保出现故障的主设备保持关闭状态,或者使用 vSphere Client 将其删除。
  7. 部署新的备用设备。您可以使用 vSphere Client 部署设备使用 VMware OVF Tool 部署设备

    部署新的备用设备后,集群运行状况必须为 Healthy

  8. 如果在还原之前启用了 VMware Cloud Director 设备 FIPS 模式,则必须使用 VMware Cloud Director 设备 API 对其进行重新设置。

    单元 FIPS 模式会自动还原。

自动故障切换模式的恢复工作流

如果主单元处于 Failed 状态,VMware Cloud Director 会自动将备用单元提升为新的正在运行的主单元,但集群处于已降级状态,因为只有一个正在运行的备用单元。您可以使用 HTML5 用户界面和 VMware Cloud Director 设备 API 从故障中恢复。

要查看集群中单元的状态,请参见查看 VMware Cloud Director 设备集群运行状况和故障切换模式

  1. 如果可能,使用单元管理工具关闭 VMware Cloud Director 进程。从出现故障的主单元中,运行以下命令
    /opt/vmware/vcloud-director/bin/cell-management-tool  -u <sysadmin user> cell --shutdown
  2. 关闭出现故障的主 VM。

    管理 UI 显示具有主要角色的两个单元。原始主单元为失败状态,新的主单元为正在运行状态。集群运行状况为已降级

  3. 从除出现故障的主单元外的任何单元,使用设备 API Unregister 方法,从 repmgr 高可用性集群中移除出现故障的主设备。请参见 VMware Cloud Director 设备 API 文档。
  4. 将出现故障的主设备从 VMware Cloud Director 服务器组中移除。
    1. 管理员身份登录到 Service Provider Admin Portal
    2. 在左侧一级导航面板中选择资源,然后在页面顶部导航栏中选择云资源
    3. 在左侧二级导航面板中,单击云单元
    4. 选择非活动单元,然后单击取消注册
  5. 如果要重用出现故障的主设备的 IP 地址和主机名,请确保出现故障的主设备已关闭,或者使用 vSphere Client 将其删除。
  6. 部署新的备用设备。您可以使用 vSphere Client 部署设备使用 VMware OVF Tool 部署设备。部署新的备用设备后,集群运行状况必须为 Healthy
  7. 从除出现故障的主单元外的任何单元,使用设备 API Failover 方法将集群故障切换模式重置为 Automatic。请参见 VMware Cloud Director 设备 API 文档。
  8. 如果在还原之前启用了 VMware Cloud Director 设备 FIPS 模式,则必须使用 VMware Cloud Director 设备 API 对其进行重新设置。

    单元 FIPS 模式会自动还原。