vSphere Fault Tolerance 透過建立和維護次要虛擬機器 (與主要虛擬機器相同且可在發生容錯移轉時隨時取代主要虛擬機器),提供對虛擬機器的持續可用性。

可為大多數任務關鍵虛擬機器啟用 Fault Tolerance。會建立一個重複的虛擬機器 (稱為次要虛擬機器),該虛擬機器會以虛擬 Lockstep 方式隨主要虛擬機器一起執行。VMware vLockstep 可擷取主要虛擬機器上發生的輸入和事件,並將這些輸入和事件傳送到正在另一主機上執行的次要虛擬機器。使用此資訊,次要虛擬機器的執行將等同於主要虛擬機器的執行。因為次要虛擬機器與主要虛擬機器一起以 vLockStep 方式執行,所以它可以無中斷地接管任何點處的執行,從而提供容錯保護。

備註︰

主要虛擬機器與次要虛擬機器之間的 FT 記錄流量是未加密的,且包含客體網路和 Storage I/O 資料以及客體作業系統的記憶體內容。此流量可以包含敏感資料,如純文字格式的密碼。為避免這些資料洩漏,尤其是避免受到「攔截式」攻擊,請確保此網路是安全的。例如,可以對 FT 記錄流量使用私人網路。

圖表 1. Fault Tolerance 配對中的主要虛擬機器和次要虛擬機器
Fault Tolerance 配對有主要虛擬機器和次要虛擬機器。

主要虛擬機器和次要虛擬機器可持續交換活動訊號。此交換允許虛擬機器配對中的虛擬機器監控彼此的狀態,以確保持續維護 Fault Tolerance。如果執行主要虛擬機器的主機發生故障,將會發生透明容錯移轉,在此情況下,會即時啟動次要虛擬機器來取代主要虛擬機器。新的次要虛擬機器啟動,並在幾秒內重新建立 Fault Tolerance 冗餘。如果執行次要虛擬機器的主機發生故障,則該主機也會即時遭取代。在任一情況下,使用者都不會遭遇服務中斷和資料遺失的情況。

容錯虛擬機器及其次要複本不允許在相同主機上執行。此限制可確保主機故障不會導致兩個虛擬機器都遺失。也可以使用虛擬機器-主機相似性規則來確定要在其上執行指定虛擬機器的主機。如果使用這些規則,應瞭解對於受這種規則影響的任何主要虛擬機器,其相關次要虛擬機器也受這些規則影響。如需有關相似性規則的詳細資料,請參閱vSphere 資源管理說明文件。

Fault Tolerance 可避免「核心分裂」情況發生,此情況可能會造成虛擬機器在從故障復原後存在兩個作用中複本。共用儲存區上鎖定的原子檔案用於協調容錯移轉,以便只有一端做為主要虛擬機器繼續執行,並會自動再生新的次要虛擬機器。

備註︰

主要虛擬機器開啟電源時,會執行反相似性檢查。當主要虛擬機器和次要虛擬機器都處於關閉電源狀態時,它們可能會位於相同主機上。這是一般行為,當主要虛擬機器開啟電源時,次要虛擬機器在其他主機上啟動。