如果在設定的時間內未接收到個別虛擬機器的 VMware Tools 活動訊號,則虛擬機器監控將重新啟動這些虛擬機器。同樣地,如果沒有接收虛擬機器執行中的應用程式的活動訊號,應用程式監控也可以重新啟動該虛擬機器。可以啟用這些功能,並設定 vSphere HA 監控無回應時的敏感度。
啟用虛擬機器監控後,虛擬機器監控服務 (使用 VMware Tools) 將透過檢查正在客體內執行的 VMware Tools 程序的常規活動訊號和 I/O 活動來評估叢集內的每個虛擬機器是否處於執行中。如果沒有接收到活動訊號或 I/O 活動,則很有可能是客體作業系統出現故障,或未配置給 VMware Tools 用來完成工作的時間。在這種情況下,虛擬機器監控服務會先決定虛擬機器已發生故障,然後決定將虛擬機器重新開機以還原服務。
有時,仍然正常運作的虛擬機器或應用程式會停止傳送活動訊號。為了避免不必要的重設,虛擬機器監控服務還監控虛擬機器的 I/O 活動。如果在故障時間間隔內未接收到任何活動訊號,則會檢查 I/O 統計間隔 (叢集層級屬性)。I/O 統計間隔可決定在前兩分鐘 (120 秒) 內虛擬機器是否已發生任何磁碟或網路活動。如果沒有,則重設該虛擬機器。可以使用進階選項 das.iostatsinterval 變更此預設值 (120 秒)。
要啟用應用程式監控,必須先取得適用的 SDK (或使用可支援 VMware 應用程式監控的應用程式),然後使用它來設定要監控的應用程式的自訂活動訊號。完成此操作後,應用程式監控的工作方式將與虛擬機器監控的工作方式大致相同。如果在指定時間內未接收到應用程式的活動訊號,將重新啟動其虛擬機器。
您可以設定監控敏感度的層級。高敏感度監控可以更快得出已發生故障的結論。然而,如果受監控的虛擬機器或應用程式實際上仍在運作,但由於資源限制等因素導致未接收到活動訊號,高敏感度監控可能會錯誤地認為此虛擬機器出現故障。低敏感度監控會延長實際故障和虛擬機器重設之間服務中斷的時間。請選取一個有效折衷滿足需求的選項。
也可以透過選取自訂核取方塊以指定監控敏感度和 I/O 統計間隔的自訂值。
設定 | 故障時間間隔 (秒) | 重設期間 |
---|---|---|
高 | 30 | 1 小時 |
中等 | 60 | 24 小時 |
低 | 120 | 7 天 |
偵測到故障後,vSphere HA 會重設虛擬機器。重設可確保這些服務仍然可用。為了避免因暫時性錯誤而反復重設虛擬機器,依預設,在某個可配置的時間間隔內將對虛擬機器僅重設三次。在對虛擬機器執行過三次重設後,指定的時間結束之前,vSphere HA 不會在後續故障出現後進一步嘗試重設虛擬機器。可以使用每台虛擬機器的重設次數上限自訂設定來設定重設次數。