嘗試開啟 vSphere HA 叢集中某個虛擬機器的電源時,可能會出現容錯移轉資源不足故障。

問題

如果選取「叢集容許的主機故障次數」許可控制原則且出現某些問題,則可能由於資源不足而無法開啟虛擬機器的電源。

原因

該問題可能是由多種原因造成。
  • 叢集中的主機已中斷連線、處於維護模式、沒有回應或出現 vSphere HA 錯誤。

    若主機處於中斷連線或處於維護模式下,則通常是由使用者動作導致的。若主機沒有回應或存在錯誤,則通常由更嚴重的問題引起,例如,主機或代理程式出現故障或存在網路問題。

  • 叢集包含比其他虛擬機器具有更大記憶體或 CPU 保留區的虛擬機器。

    「叢集容許的主機故障次數」許可控制原則以對插槽大小的計算為基礎,該插槽大小由虛擬機器的 CPU 和記憶體保留區兩部分組成。如果由於離群虛擬機器而對插槽大小的計算產生偏差,則許可控制原則可能會變得限制過多,並導致無法開啟虛擬機器的電源。

  • 叢集中沒有可用的插槽。

    當叢集中沒有可用的插槽,或開啟虛擬機器電源導致插槽大小增加 (因為該虛擬機器的保留區大於現有虛擬機器的保留區) 時,會出現問題。無論是哪種情況,都應使用 vSphere HA 進階選項來減少插槽大小,使用不同的許可控制原則或修改原則以容許較少的主機故障次數。

解決方案

檢視顯示在 vSphere HA 區段中的進階執行階段資訊窗格 (vSphere HA 區段位於 vSphere Web Client 中叢集的監控索引標籤上)。該資訊窗格顯示了插槽大小以及叢集中的可用插槽數。如果插槽大小過大,請按一下叢集的資源配置索引標籤,按照保留區對虛擬機器進行排序,確定哪個虛擬機器具有最大的 CPU 和記憶體保留區。如果存在比其他虛擬機器具有更大保留區的離群虛擬機器,請考慮使用不同的 vSphere HA 許可控制原則 (如「保留的叢集資源百分比」許可控制原則),或使用 vSphere HA 進階選項設定插槽大小的絕對上限。但是,這兩個選擇都可增加出現資源片段的風險。