vSphere HA 叢集的主要主機負責偵測從屬主機的故障。視偵測到的故障類型而定,主機上執行的虛擬機器可能需要容錯移轉。

在 vSphere HA 叢集中,偵測到三種類型的主機故障:

  • 故障 - 主機停止運作。

  • 隔離 - 主機處於網路隔離狀態。

  • 磁碟分割 - 主機與主要主機的網路連線中斷。

主要主機監控叢集中從屬主機的運作情況。此通訊透過每秒交換一次網路活動訊號來完成。當主要主機停止從從屬主機接收這些活動訊號時,它會在宣告該主機已出現故障之前檢查主機的運作情況。主要主機執行的運作情況檢查是要確定從屬主機是否在與其中一個資料存放區交換活動訊號。請參閱 資料存放區活動訊號。而且,主要主機還檢查主機是否對傳送至其管理 IP 位址的 ICMP Ping 做出回應。

如果主要主機無法直接與從屬主機上的代理程式進行通訊,則該從屬主機不會對 ICMP Ping 做出回應,並且該代理程式不會發出被視為已出現故障的活動訊號。會在備用主機上重新啟動主機的虛擬機器。如果此類從屬主機與資料存放區交換活動訊號,則主要主機會假定它處於某個網路磁碟分割或隔離網路中,因此會繼續監控該主機及其虛擬機器。請參閱 網路磁碟分割

當主機仍在執行但無法再監視來自管理網路上 vSphere HA 代理程式的流量時,會發生主機網路隔離。如果主機停止監視此流量,則它會嘗試對叢集隔離位址執行 Ping 動作。如果仍然失敗,主機將宣告自己已與網路隔離。

主要主機會監控在已隔離主機上執行的虛擬機器,如果發現虛擬機器的電源已關閉,而且該主要主機負責這些虛擬機器,則會重新啟動這些虛擬機器。

備註︰

如果您確定網路基礎結構具有足夠的冗餘度且至少有一個網路路徑始終可用,則應該極少會出現主機網路隔離情況。