使用“群集允许的主机故障数目”接入控制策略后,由于故障切换资源不足,vSphere HA 群集可能会变为无效(红色)。

问题

如果选择“群集允许的主机故障数目”接入控制策略且出现某些问题,该群集会变为红色。

原因

当群集中的主机断开连接、处于维护模式、无响应或存在 vSphere HA 错误时,可能会出现此问题。若主机处于断开连接状态或处于维护模式下,则通常是由用户操作导致的。若主机无响应或存在错误,则通常是由更为严重的问题引起的,例如,主机或代理出现故障或存在网络问题。

此问题的另一个可能原因是群集中包含的某些虚拟机比其他虚拟机具有更大的内存或 CPU 预留。“群集允许的主机故障数目”接入控制策略基于对插槽大小(由虚拟机的 CPU 和内存预留两部分组成)的计算。如果对插槽大小的计算由于离群虚拟机而发生偏离,则接入控制策略可能会变得过于严格并导致出现红色群集。在这种情况下,可以使用 vSphere HA 高级选项来减小插槽大小,使用不同的接入控制策略或修改策略以允许较少的主机故障。

解决方案

检查群集中的所有主机是否都处于正常状态,即是否处于连接状态(而不是处于维护模式)且没有 vSphere HA 错误。vSphere HA 接入控制仅考虑来自处于正常状态的主机的资源。