Elastic DRS 演算法會在一段時間內監控叢集中的資源使用率。考量到使用率的突然增加和隨機性,演算法建議擴充或縮小叢集並產生警示。透過佈建新主機或從叢集中移除主機,可立即處理此警示。
- 演算法應垂直擴充/縮減至的主機數目下限和上限。
- CPU、記憶體和儲存區使用率的臨界值,以便主機配置進行最佳化以實現成本或效能。在管理 SDDC 叢集中的彈性頁面上列出的這些臨界值是針對每個 DRS 原則類型預先定義的,因此無法由使用者進行變更。
擴充建議
當 CPU、記憶體或儲存區使用率中的任意一項持續高於臨界值時,會產生擴充建議。例如,如果儲存區使用率超過高臨界值,但記憶體和 CPU 使用率低於其各自的臨界值,則會產生擴充建議。會發佈 vCenter Server 事件以指示叢集上的擴充開始、完成或失敗。
縮小建議
當 CPU、記憶體和儲存區使用率全部持續低於臨界值時,會產生縮小建議。如果叢集中的主機數目達到指定的下限值,則不會實作縮小建議。會發佈 vCenter Server 事件以指示叢集上的縮小作業開始、完成或失敗。
當您減小叢集大小時,由於主機移除所引入的程序額外負荷,儲存區延遲時間會增加。此額外負荷的持續時間視涉及的資料量而有所不同。可能只需一小時,但某些極端的案例可能需要超過 48 小時。減小叢集大小 (縮小) 時,受影響的叢集所支援的工作負載虛擬機器的儲存區延遲時間會大幅增加。
縮放延伸叢集
當 Elastic DRS 為延伸 (多個可用性區域) 叢集產生縮小或擴充事件時,將在兩個可用性區域中移除或新增主機。
如果主機在任何延伸叢集中出現故障,Elastic DRS 會嘗試在其原始可用性區域中取代該主機。如果由於全部或部分可用性區域故障而無法執行此操作,Elastic DRS 將在其餘的可用性區域中擴充叢集。它會在其餘的可用性區域中新增不計費主機,直到叢集達到其原始主機計數。此擴充工作流程取決於可用容量,無法保證執行。還原出現故障的可用性區域後,Elastic DRS 將縮小叢集以移除額外的主機,從而保持原始主機計數。
如需有關 Elastic DRS 如何處理縮放和區域故障情況的詳細資訊,請參閱 VMware Cloud 技術區文章〈VMware Cloud on AWS:延伸叢集〉。
兩個建議之間的時間延遲
演算法中包含安全檢查,以避免處理頻繁產生的事件,並為叢集提供一些時間來冷卻由於上次處理事件而導致的變更。會強制執行事件之間的下列時間間隔:
- 兩個連續擴充事件之間的 30 分鐘延遲。
- 在擴充叢集後處理縮小事件的 3 小時延遲。
與其他作業的建議互動
下列作業可能會與 Elastic DRS 建議互動:
- 使用者起始的新增或移除主機作業。
通常,在啟用 Elastic DRS 的情況下,您不需要從叢集手動新增或移除主機。您仍然可以執行這些作業,但 Elastic DRS 建議可能會在某個時間點將其還原。
如果使用者起始的新增或移除主機作業正在進行中,會略過 Elastic DRS 演算法的目前建議。當使用者起始的作業完成後,演算法可能會根據資源使用率和目前所選原則中的變更來建議縮小或擴充作業。
如果您在套用 Elastic DRS 建議的同時啟動新增或移除主機作業,該作業會失敗,並顯示錯誤指出並行更新例外狀況。
- 計劃的維護作業
計劃的維護作業表示特定主機需要取代為新的主機。當計劃的維護作業正在進行時,會略過 Elastic DRS 演算法的目前建議。在計劃的維護完成後,演算法會再次執行,並套用全新的建議。如果在叢集上起始計劃的維護事件,且同時正在對該叢集套用 Elastic DRS 建議,則計劃的維護工作會排入佇列。當 Elastic DRS 建議工作完成後,會啟動計劃的維護工作。
- 自動修復
在自動修復期間,失敗的主機會取代為新主機,並且其主機標籤會套用至取代主機。進行自動修復時,會略過 Elastic DRS 演算法的目前建議。自動修復完成後,演算法會再次執行,並套用全新的建議。如果針對叢集起始自動修復事件,且同時正在對該叢集套用 Elastic DRS 建議,則自動修復工作會排入佇列。Elastic DRS 建議工作完成後,會啟動自動修復工作。
- SDDC 維護時段
如果 SDDC 正在維護中,或排程為在接下來的 6 小時內進行計劃維護,將會略過 EDRS 建議。