如果主数据库服务出现故障,可以将 VMware Cloud Director 自动故障切换到新的主单元。

使用自动故障切换功能,在主数据库服务出于任何原因而无法执行其功能时,管理员无需启动故障切换操作。默认情况下,故障切换模式设置为“手动”。可以使用 VMware Cloud Director 设备 API 将故障切换模式设置为“自动”或“手动”。请参见VMware Cloud Director 设备 API 架构参考》

注: 如果已将集群配置为自动故障切换,则在部署一个或多个其他单元后,必须使用设备 API 将集群故障切换模式重置为“ Automatic”。请参见 VMware Cloud Director 设备 API。新单元的默认故障切换模式为“ Manual”。如果集群节点之间的故障切换模式不一致,则集群故障切换模式为“ Indeterminate”。“ Indeterminate”模式可能会导致这些节点与支持旧主单元的节点之间的集群状态不一致。要查看集群故障切换模式,请参见 查看 VMware Cloud Director 设备集群运行状况和故障切换模式

如果您的环境中至少有两个活动备用单元,则在主数据库发生故障时,将自动启动数据库故障切换。故障切换后,必须至少有一个活动的备用单元才能更新新的主数据库。在正常情况下,VMware Cloud Director 设备部署必须始终至少有两个活动备用单元。如果短期内只有一个活动备用单元(例如,由于主单元发生故障提升了其中一个备用单元),则必须尽快将发生故障的旧主单元替换为新的备用单元。

当具有活动主单元和至少两个活动备用单元时,集群被视为处于 Healthy 状态。如果有一个活动主单元以及只有一个活动备用单元,则集群将处于 Degraded 状态。如果集群处于 Degraded 状态时出现其他数据库故障,则在另一个备用单元联机之前,主单元不可更新。当主数据库不可更新时,VMware Cloud Director 不可用,因为 VMware Cloud Director 单元无法更新数据库,直到至少有一个活动备用单元处理来自主数据库的流式复制。无论激活手动故障切换还是自动故障切换,HealthyDegraded 集群的概念都相同。

主数据库出现故障后,主数据库的状态为 No_Active_Primary。对于手动 VMware Cloud Director 设备故障切换,管理员必须手动将备用单元提升为主单元,并将发生故障的主单元重新部署为备用单元。对于自动设备故障切换,VMware Cloud Director 会自动将备用单元提升为主单元,管理员需要手动将发生故障的主单元重新部署为备用单元。

图 1. 手动和自动 VMware Cloud Director 设备故障切换
如果主数据库服务出现故障,则可以手动或自动将备用单元提升为主单元。