Elastic DRS アルゴリズムは、クラスタ内のリソース使用率の推移を監視します。このアルゴリズムは使用率の急上昇とランダム性を考慮しつつ、クラスタ内のスケールアウトまたはスケールインの推奨を行い、アラートを生成します。このアラートは、新しいホストをプロビジョニングするかクラスタからホストを削除するという形で、ただちに処理されます。

アルゴリズムは 5 分ごとに実行され、次のパラメータが使用されます。
  • アルゴリズムによってスケールアップまたはスケールダウンする際に使用される、ホストの台数の最小値と最大値。
  • コストやパフォーマンスのためにホストの割り当てを最適化するために使用される、CPU、メモリ、ストレージの使用率のしきい値。SDDC クラスタでの弾性の管理画面に一覧表示されているこれらのしきい値は、各 DRS ポリシー タイプで事前に定義されており、ユーザーが変更することはできません。

スケール アウト推奨

スケール アウト推奨は、CPU、メモリ、ストレージのいずれかの使用率が一貫してしきい値を超えている場合に生成されます。たとえば、ストレージ使用率が上限しきい値を超えると、メモリと CPU の使用率がそれぞれのしきい値よりも低いままでもスケールアウト推奨が生成されます。クラスタのスケール アウトの開始、完了、または失敗を示すために、vCenter Server イベントがポストされます。

スケール イン推奨

スケール イン推奨は、CPU、メモリ、ストレージのすべての使用率が一貫してしきい値を下回っている場合に生成されます。クラスタ内のホストの台数が指定された最小値に達していると、スケール イン推奨は発生しません。クラスタのスケール イン処理の開始、完了、または失敗を示すために、vCenter Server イベントがポストされます。

注:

クラスタ サイズを縮小すると、ホストを削除することで発生する処理のオーバーヘッドが原因でストレージ遅延が増加します。このオーバーヘッドの処理に要する時間は、関連するデータ量によって異なります。場合によっては、48 時間以上かかることがありますが、1 時間程度で終わる場合もあります。クラスタ サイズの縮小(スケールイン)中は、縮小中のクラスタがサポートするワークロード仮想マシンでのストレージ遅延が大幅に増加する場合があります。

ストレッチ クラスタのスケーリング

Elastic DRS がストレッチ(複数のアベイラビリティ ゾーン)クラスタのスケールインまたはスケールアウト イベントを生成すると、両方のアベイラビリティ ゾーンでホストが削除または追加されます。

ストレッチ クラスタでホスト障害が発生すると、Elastic DRS は元のアベイラビリティ ゾーンでホストの置き換えを試行します。アベイラビリティ ゾーン全体または一部の障害が原因でこの処理を実行できない場合、Elastic DRS は残りのアベイラビリティ ゾーン内のクラスタをスケール アウトします。クラスタが元のホスト数に達するまで、請求可能でないホストが残りのアベイラビリティ ゾーンに追加されます。このスケールアウト ワークフローは使用可能なキャパシティに依存し、保証されるものではありません。障害が発生したアベイラビリティ ゾーンがリストアされると、Elastic DRS はクラスタをスケール インして追加ホストを削除し、元のホスト数に戻します。

Elastic DRS でスケーリングとゾーン障害のシナリオに対処する方法については、VMware Cloud Tech Zone の記事「VMware Cloud on AWS: Stretched Clusters」を参照してください。

2 つの推奨の間の遅延

頻繁に生成されるイベントの処理を回避するため、および処理されたばかりのイベントによる変更が落ち着くまでの時間をクラスタで確保するために、アルゴリズムには安全性の確認が含まれます。イベントとイベントの間には、次の時間が適用されます。

  • 2 つの連続したスケールアウト イベントの間には 30 分の遅延。
  • クラスタのスケールアウト後のスケールイン イベントの処理には 3 時間の遅延。

推奨とその他の処理との相互作用

以下の処理では、Elastic DRS 推奨との間で相互作用が発生する可能性があります。

  • ユーザーによるホストの追加または削除。

    Elastic DRS が有効になっている場合、原則としてクラスタのホストを追加したり削除したりする必要はありません。これらの処理を開始することはできますが、ある時点で Elastic DRS による推奨によって元に戻される可能性があります。

    ユーザーによるホストの追加または削除処理を開始し、それが進行中の間、Elastic DRS アルゴリズムによる最新の推奨は無視されます。ユーザーが開始した処理が完了すると、アルゴリズムはリソース使用率の変化と現在選択されているポリシーに基づいて、スケール インまたはスケール アウト処理を推奨する可能性があります。

    Elastic DRS による推奨が適用されているときにホストの追加または削除処理を開始すると、同時更新の例外が示されてホストの追加または削除処理が失敗する可能性があります。

  • 計画されたメンテナンス処理

    計画されたメンテナンス処理は、特定のホストを新しいホストに置き換える必要があることを意味します。計画されたメンテナンス処理の進行中は、Elastic DRS アルゴリズムによる最新の推奨は無視されます。計画されたメンテナンスが完了すると、アルゴリズムが再実行され、新しい推奨が適用されます。計画されたメンテナンス イベントが開始されたときに、そのクラスタに対して Elastic DRS による推奨が適用されていると、計画されたメンテナンス タスクはキューに格納されます。Elastic DRS による推奨タスクが完了すると、計画されたメンテナンス タスクが開始されます。

  • 自動修正

    自動修正中に、障害が発生したホストは新しいホストに置き換えられ、置き換えられたホストにホスト タグが適用されます。自動修正の進行中は、Elastic DRS アルゴリズムによる最新の推奨は無視されます。自動修正が完了すると、アルゴリズムが再実行され、新しい推奨が適用されます。自動修正イベントが開始されたときに、そのクラスタに対して Elastic DRS による推奨が適用されていると、自動修正タスクはキューに格納されます。Elastic DRS による推奨タスクが完了すると、自動修正タスクが開始されます。

  • SDDC のメンテナンス ウィンドウ

    SDDC でメンテナンスが行われているか今後 6 時間以内に行われる場合は、Elastic DRS による推奨は無視されます。