使用 [叢集容許的主機故障次數] 許可控制原則時,由於容錯移轉資源不足,vSphere HA 叢集可能會變為無效 (紅色)。

問題

如果選取 [叢集容許的主機故障次數] 許可控制原則且出現某些問題,則該叢集會變為紅色。

原因

當叢集中的主機中斷連線、處於維護模式、沒有回應或存在 vSphere HA 錯誤時,可能會出現此問題。若主機處於中斷連線或處於維護模式下,則通常是由使用者動作導致的。若主機無回應或存在錯誤,則通常是由更嚴重的問題引起的,例如,主機或代理程式出現故障或存在網路問題。

此問題的另一個可能原因是,叢集中包含的某些虛擬機器比其他虛擬機器具有更大的記憶體或 CPU 保留。[叢集容許的主機故障次數] 許可控制原則以對插槽大小的計算為基礎,該插槽大小由虛擬機器的 CPU 和記憶體保留兩部分組成。如果由於離群虛擬機器而對插槽大小的計算產生偏差,則許可控制原則可能會變得限制過多並導致出現紅色叢集。在此情況下,您可以使用 vSphere HA 進階選項來減少插槽大小,使用不同的許可控制原則或修改原則以容許較少的主機故障次數。

解決方案

檢查叢集中的所有主機是否都處於良好狀態,即是否處於連線狀態 (而不是處於維護模式) 且沒有 vSphere HA 錯誤。vSphere HA 許可控制僅考慮來自狀況良好之主機的資源。