VMware Cloud Director 10.1 开始,如果主数据库服务出现故障,可以将 VMware Cloud Director 自动故障切换到新的主数据库服务。

使用自动故障切换功能,在主数据库服务出于任何原因而无法执行其功能时,管理员无需启动故障切换操作。默认情况下,故障切换模式设置为“手动”。可以使用 VMware Cloud Director 设备 API 将故障切换模式设置为“自动”或“手动”。请参见VMware Cloud Director 设备 API 架构参考》

注: 如果已将集群配置为自动故障切换,则在部署一个或多个其他单元后,必须使用设备 API 将集群故障切换模式重置为“ Automatic”。请参见 VMware Cloud Director 设备 API。新单元的默认故障切换模式为“ Manual”。如果集群节点之间的故障切换模式不一致,则集群故障切换模式为“ Indeterminate”。“ Indeterminate”模式可能会导致这些节点与支持旧主单元的节点之间的集群状态不一致。要查看集群故障切换模式,请参见 查看 VMware Cloud Director 设备群集运行状况和故障切换模式

如果您的环境中至少有两个活动备用单元,则在主数据库发生故障时,将自动启动数据库故障切换。故障切换后,必须至少有一个活动的备用单元才能更新新的主数据库。在正常情况下,VMware Cloud Director 设备部署必须始终至少有两个活动备用单元。如果短期内只有一个活动备用单元(例如,由于主单元发生故障提升了其中一个备用单元),则必须尽快将发生故障的旧主单元替换为新的备用单元。

当具有活动主单元和至少两个活动备用单元时,集群被视为处于 Healthy 状态。如果有一个活动主单元以及只有一个活动备用单元,则集群将处于 Degraded 状态。如果集群处于 Degraded 状态时出现其他数据库故障,则在另一个备用单元联机之前,主单元不可更新。当主数据库不可更新时,VMware Cloud Director 不可用,因为 VMware Cloud Director 单元无法更新数据库,直到至少有一个活动备用单元处理来自主数据库的流式复制。无论启用手动故障切换还是自动故障切换,HealthyDegraded 集群的概念都相同。

图 1. 手动和自动 VMware Cloud Director 设备故障切换
操作状态图,表示主数据库发生故障后主单元的“No_Active_Primary”状态、提升备用单元所需的管理员输入以及手动重新部署发生故障的主单元。旁边是自动故障切换的操作状态图。该图显示主数据库发生故障后主单元的“No_Active_Primary”状态、自动提升备用单元以及手动重新部署发生故障的主单元。