仮想マシンの監視では、VMware Tools のハートビートが設定した時間内に受信できなかった場合、その仮想マシンが個別に再起動されます。同様に、実行中のアプリケーションのハートビートが受信できない場合には、アプリケーションの監視によって仮想マシンが再起動されます。これらの機能を有効にし、vSphere HA が無応答を監視する感度を設定できます。

仮想マシンの監視を有効にすると、仮想マシンの監視サービスは (VMware Tools を使用)、ゲスト内で実行される VMware Tools プロセスからの定期的なハートビートおよび I/O アクティビティをチェックして、クラスタ内の各仮想マシンが稼動しているかどうかを判断します。ハートビートや I/O アクティビティが受信されない場合、ほとんどの原因は、ゲスト OS で障害が発生しているか、VMware Tools が割り当てられていないためにタスクが終了できないというものです。このような場合、仮想マシンの監視サービスは、仮想マシンで障害が発生したと判断し、仮想マシンを再起動してサービスを回復させます。

場合によっては、正常に機能している仮想マシンやアプリケーションが、ハートビートの送信を停止することがあります。不必要なリセットを防ぐため、仮想マシンの監視サービスは、仮想マシンの I/O アクティビティも監視しています。障害間隔内にハートビートが受信されなかった場合は、I/O 統計間隔 (クラスタ レベルの属性) がチェックされます。I/O 統計間隔では、過去 2 分間 (120 秒間) に、仮想マシンでディスクまたはネットワーク アクティビティが発生しているかどうかが確認されます。発生していない場合、その仮想マシンはリセットされます。このデフォルト値(120 秒)は、詳細オプション das.iostatsinterval を使用して変更できます。

アプリケーションの監視を有効にするには、まず適切な SDK を入手し (または VMware アプリケーションの監視をサポートするアプリケーションを使用中)、これを使用して監視対象となるアプリケーションの、カスタマイズされたハートビートを設定する必要があります。ハートビートを設定したら、アプリケーションの監視は仮想マシンの監視とほぼ同じように機能します。アプリケーションのハートビートが指定した期間受信できないと、仮想マシンは再起動されます。

監視感度のレベルは設定が可能です。監視感度を高度にすると、障害が発生したことが迅速に判断されます。ほとんど起こらないことですが、監視感度を高くすると、対象の仮想マシンまたはアプリケーションが実際には機能しているのに、リソースの制約などによってハートビートが受信されないため、障害であると誤って判断してしまうことがあります。監視感度を低くすると、実際に障害が発生してから仮想マシンがリセットされるまでの間、サービスが中断される時間が長くなります。ニーズに対して効果があるオプションを選択します。

[カスタム] チェック ボックスを選択すると、監視感度と I/O 統計間隔の両方に、カスタム値を指定することもできます。

表 1. 仮想マシンの監視設定
設定 障害間隔 (秒) リセット間隔
30 1 時間
60 24 時間
120 7 日

障害が検出されると、vSphere HA は仮想マシンをリセットします。リセットすることで、確実にそのサービスが継続して利用可能になります。一時的ではないエラーに対して、仮想マシンが繰り返しリセットされないようにするため、デフォルトでは、仮想マシンは設定可能な特定の期間中に 3 回しかリセットされません。仮想マシンが 3 回リセットされると、vSphere HA は、これ以降に障害が発生しても、指定された時間が経過するまでは仮想マシンをリセットしようとしません。[仮想マシンごとの最大リセット回数] カスタム設定を使用することで、リセット回数を構成できます。

注: 仮想マシンをパワーオフしてからパワーオンした場合、または vMotion を使用して別のホストに移行した場合には、リセット統計がクリアされます。これによりゲスト OS が再起動しますが、仮想マシンの電源状態が変更した場合の再起動とは異なります。