要让 vCenter HA 集群正常运行,每个主动、被动和见证节点都必须完全正常运行,并且可通过 vCenter HA 集群网络进行访问。如果任何节点出现故障,集群将被视为处于已降级状态。
问题
集群处于已降级状态时,不会进行故障切换。有关集群处于已降级状态时故障情形的信息,请参见故障切换故障。
原因
集群处于已降级状态有很多原因。
- 某个节点出现故障
-
- 如果主动节点出现故障,则会自动从主动节点故障切换到被动节点。故障切换之后,被动节点将成为主动节点。
此时,集群处于已降级状态,因为原来的主动节点不可用。
出现故障的节点在修复或恢复联机后成为新的被动节点,而集群在主动节点和被动节点同步后恢复到正常状态。
- 如果被动节点发生故障,主动节点继续正常运行,但是无法进行故障切换且集群处于已降级状态。
如果被动节点已修复或恢复联机,它会自动重新加入集群,主动节点和被动节点同步后,集群状态恢复正常。
- 如果见证节点发生故障,主动节点继续正常运行,主动节点和被动节点之间的复制也会继续,但无法进行故障切换。
如果见证节点已修复或恢复联机,它会自动重新加入集群且集群状态恢复正常。
- 如果主动节点出现故障,则会自动从主动节点故障切换到被动节点。故障切换之后,被动节点将成为主动节点。
- 数据库复制失败
- 当主动节点与被动节点之间的复制失败时,集群将被视为已降级。主动节点继续与被动节点同步。如果同步成功,集群恢复到正常状态。此状态可能是由于网络带宽问题或其他资源短缺所致。
- 配置文件复制问题
- 如果主动节点和被动节点之间未正确复制配置文件,集群则处于已降级状态。主动节点继续尝试与被动节点同步。此状态可能是由于网络带宽问题或其他资源短缺所致。
解决方案
如何进行恢复取决于已降级集群状态的起因。如果集群处于已降级状态,事件、警报和 SNMP 陷阱将显示错误。
如果某个节点关闭,请检查是否发生硬件故障或网络隔离。检查发生故障的节点是否已打开电源。
如果复制失败,请检查 vCenter HA 网络的带宽是否充足,并确保网络延迟不超过 10 ms。