環境内のオブジェクトに問題がある場合、VMware Aria Operations ではアラートによって通知されます。このシナリオでは、担当しているオブジェクトのアラートの監視と処理に利用できる方法の 1 つを示します。
アラートは、アラートのシンプトムの 1 つ以上がトリガされるときに生成されます。アラートは、構成方法に応じて、1 つのシンプトムがトリガされたときに生成されるか、またはすべてのシンプトムがトリガされたときに生成されます。
アラートが生成されるときには、環境内のオブジェクトに与える悪影響に基づいてアラートを処理する必要があります。この処理を行うには、健全性アラートから開始し、クリティカル度に基づいてそれらを処理します。
仮想インフラストラクチャ管理者として、少なくとも日に 2 回はアラートを確認します。このシナリオでは、評価プロセスの一部として、次のアラートが発生します。
- 仮想マシンに予期しない高い CPU ワークロードがかかっています。
- いくつかの仮想マシンに起因するメモリの競合が発生しています。
- クラスタには、メモリ圧縮、バルーニング、またはスワッピングのためにメモリ競合が発生している仮想マシンが多く存在します。
手順
- 左側のメニューで [トラブルシューティング] をクリックし、[アラート] をクリックします。
- [次でグループ分け] フィルタの [時間] を選択し、[発生日時] 列の下向き矢印をクリックして、最近のアラートが先にリストされるようにします。
- [すべてのフィルタ] で の順に選択します。
警告アラートが最近のものから発生順にすべてリストされます。
- 名前、アラートがトリガされたオブジェクト、オブジェクト タイプ、およびアラートが生成された時刻別にアラートを確認します。
たとえば、自分が管理を担当しているオブジェクトだとわかるものがありますか。今後 1 時間の間に実施する修正によってオブジェクトの健全性ステータスに影響を与えているアラートのどれかが修正されるということを認識していますか。リソース制約のためにアラートの一部は現在解決できないことが判明していますか。
- アラート「仮想マシンに予期しない高い CPU ワークロードがかかっています」の所有権が自分にあることを他の管理者やエンジニアに示すには、選択されているアラートをクリックし、メニュー バーの [アクション] をクリックし、[所有権の取得] をクリックします。
[アラート詳細] の [割り当て先] フィールドが、現在のユーザー名で更新されます。
- アラート「仮想マシンに予期しない高い CPU ワークロードがかかっています」の所有権を別のユーザーに割り当てるには、アラートをクリックし、メニュー バーの [アクション] をクリックして、[割り当て先] をクリックします。
- アラートの所有権の割り当て先にするユーザーの名前を入力し、[保存] をクリックします。
[アラート詳細] の [割り当て先] フィールドが、アラートの割り当て先に指定したユーザーの名前で更新されます。
注: ユーザーに割り当てられた所有権を削除するには、アラートをクリックし、
[アクション] メニューから
[所有権の解除] オプションを選択します。
- アラートの所有権を取得して、そのアラートがオブジェクトの状態に影響しないように一時的に除外するには、リスト内の「少数の仮想マシンに起因するメモリの競合が発生しています」というアラートを選択します。次に、メニュー バーの [アクション] をクリックし、[サスペンド] をクリックします。
- アラートを 1 時間サスペンドするには、60 と入力します。
- [OK] をクリックします。
アラートが 60 分間サスペンドされ、アラート リストに自分が所有者として示されます。1 時間以内にそのアラートが解決されない場合、そのアラートはアクティブ状態に戻ります。
- クラスタには、メモリ圧縮、バルーニング、またはスワッピングのためにメモリ競合が発生している仮想マシンが多く存在します というアラートが含まれている行を選択します。次に、メニュー バーの [アクション] をクリックし、[アラートのキャンセル] をクリックして、リストからアラートを削除します。
このアラートは、新しいハードウェアが現れるまでは解決できない既知の問題です。
アラートがアラート リストから削除されますが、このアクションでは根本的な条件は解決されません。このアラートにおけるシンプトムはメトリックに基づいているため、このアラートは次の収集および分析サイクルで生成されます。このパターンは、原因となっている、ハードウェアおよびワークロード分散の問題を解決するまで継続します。
結果
以上で、クリティカルな健全性アラートの処理と、詳細な解決またはトラブルシューティングを行うアラートの所有権の取得が完了しました。