高レベルでの自動修正では、ハードウェアとソフトウェアの障害が監視されており、原因の修復やハードウェアの置き換えによって問題の自動修正を試みます。それ以外の何らかの操作が失敗した場合は、自動修正プロセスは SRE に手動介入を要求します。

イベント発生時に自動スケーラーでシーケンス処理される機能:

  1. 監視 - VMC プラットフォームでは、すべての SDDC とそれぞれの内部のホストのシステムの健全性が絶えず監視されています。障害が検出されると、自動修正にイベントが送信されます。
    • ハードウェアとソフトウェアの障害を監視
    • 障害を検出すると、ハードウェアを自動的にプロビジョニング
    • 可能な場合、障害を自動的に修正
    • 自動解決できない場合、SRE が手動介入
  2. 一時的イベントを待機 - ときには、検出された障害が、一時的なイベントの場合があります。たとえば一時的な接続問題のために、監視システムがホストにアクセスできない場合。自動修正は、問題が一時的なものかどうかを判断するために 5 分間待機します。問題が解決すると、自動修正は何も実行しません。
  3. ホストの追加 - エラーが 5 分経っても解決されない場合、ホストが必要かどうかが不明でも、自動修正によって SDDC に対するホストの追加が開始します。そのため、必要な場合に、ホストを確実に使用できます。SDDC 内の障害のあるホストがこのホストに置き換えられるまで、このホストは請求対象になりません。
  4. 障害タイプを特定してアクションを実行 - ホストの障害の原因はさまざまであり、解決のためにはさまざまなアクションが必要です。たとえば、vCenter Server に引き続き接続された状態のホストで発生する vSAN ディスク障害は、ソフト リブートで解消できますが、PSOD ホストにはハード リブートが必要です。この自動修正ロジックは複雑で絶えず進化していますが、ユーザーはエラーを確認して、最小限の介入アクションで対応できます。自動修正は内部プロセスであり、ユーザーはロジックにアクセスできません。問題が発生した場合は、VMware サポートにお問い合わせください。
  5. ホストの健全性の確認 - 次の手順では、修正アクションでホストの問題が修正されたかどうかを確認します。障害発生ホストの状態が、ソフト リブートまたはハード リブート後に健全になった場合、自動修正では、SDDC のそれ以上の中断は行われません。自動修正では、その他の必要なアクションを収集して実行し、手順 2 であらかじめ追加しておいた新しいホストを削除します。
  6. ホストの置き換え - 障害発生ホストを回復できない場合、障害発生ホストは自動スケーラーによって削除され、手順 2 で追加したホストに置き換えられます。この段階で、障害発生ホストは自動スケーラーによって削除され、手順 2 で追加したホストに置き換えられます。vSphere HA と vSAN がトリガされ、コンピューティング ポリシー タグが新しいホストに添付されます。