為確保獲得最佳 Fault Tolerance 結果,您應當遵循某些最佳做法。

下列針對主機和網路組態的建議可以協助您提升叢集的穩定性和效能。

主機組態

執行主要和次要虛擬機器的主機應當按照與處理器大致相同的頻率運作,否則次要虛擬機器可能會更頻繁地重新啟動。不根據工作負載進行調整 (例如,為省電而執行電源限定和強制低頻率模式) 的平台電源管理功能可能會導致處理器頻率大幅變動。如果次要虛擬機器要定期重新啟動,請在執行容錯虛擬機器的主機上停用所有電源管理模式,或者確保所有主機以相同電源管理模式執行。

主機網路組態

您可以按照下面的準則設定主機的網路,以便在不同流量類型的組合 (如 NFS) 和不同數目的實體 NIC 的情形下支援 Fault Tolerance。

  • 將每個 NIC 整併散佈到兩台實體交換器,同時確保這兩台實體交換器之間的每個 VLAN 的 L2 網域連續性。

  • 使用決定性的整併原則來確保特定流量類型與特定 NIC (作用中/待命) 或 NIC 集 (如原始虛擬連接埠識別碼) 具有相似性。

  • 採用作用中/待命的原則時,將流量類型配對,以便使兩種流量類型在共用一個 vmnic 的情況下發生容錯移轉時所產生的影響最小。

  • 採用作用中/待命原則時,設定所有使用中的介面卡,以便特定的流量類型 (如 FT 記錄) 流向同一部實體交換器。這樣可最大限度地減少網路躍點數目,並降低過度訂閱交換器到交換器連結的可能性。

備註︰

主要虛擬機器與次要虛擬機器之間的 FT 記錄流量是未加密的,且包含客體網路和 Storage I/O 資料以及客體作業系統的記憶體內容。此流量可以包含敏感資料,如純文字格式的密碼。為避免這些資料洩漏,尤其是避免受到「攔截式」攻擊,請確保此網路是安全的。例如,可以對 FT 記錄流量使用私人網路。

同質性叢集

vSphere Fault Tolerance 可以在主機不一致的叢集內運作,但在節點相容的叢集內工作狀態最佳。建構叢集時,所有主機都應具有下列組態:

  • 虛擬機器所使用的資料存放區的通用存取權。

  • 相同的虛擬機器網路組態。

  • 所有主機的相同 BIOS 設定 (電源管理和超執行緒)。

執行檢查符合性,以識別不相容問題並加以更正。

效能

若要為主要和次要虛擬機器之間的記錄流量增加可用頻寬,請使用 10 Gbit NIC,並允許使用 Jumbo 框架。

在共用儲存區上儲存 ISO 以進行連續存取

將啟用了 Fault Tolerance 的虛擬機器存取的 ISO 儲存在可以供容錯虛擬機器的兩個執行個體存取的共用儲存區中。如果使用此組態,虛擬機器中的 CD-ROM 會繼續正常運作,即使發生了容錯移轉也是如此。

對於啟用了 Fault Tolerance 的虛擬機器,您可能會使用只有主要虛擬機器才可存取的 ISO 映像。在這種情況下,主要虛擬機器可以存取 ISO,但是如果發生容錯移轉,CD-ROM 會報告錯誤,就好像媒體不存在一樣。如果 CD-ROM 目前用於暫時的非關鍵作業 (如修補),則此情況是可接受的。

避免網路磁碟分割

當 vSphere HA 叢集發生管理網路故障而導致某些主機與 vCenter Server 隔離並且使這些主機彼此隔離時,會發生網路磁碟分割。請參閱《vSphere 可用性》文件。如果發生磁碟分割,則可能降低 Fault Tolerance 保護層級。

在使用 Fault Tolerance 的已進行磁碟分割的 vSphere HA 叢集中,主要虛擬機器 (或其次要虛擬機器) 可能最終處於不負責虛擬機器的主要主機所管理的磁碟分割中。如果需要容錯移轉,則僅當主要虛擬機器處於負責虛擬機器的主要主機所管理的磁碟分割中時,次要虛擬機器才會重新啟動。

若要確保管理網路盡可能不發生會導致網路磁碟分割的故障,請遵循《vSphere 可用性》文件中的建議。