このトピックでは、VMware Aria Operations のさまざまなタイプのアラート、アラートにアクセスする方法、およびそれらのアラートに関する詳細情報の表示方法について説明します。
アラートのタイプ
VMware Aria Operations のアラートには 3 つのタイプがあります。アラート タイプによって、問題の重要度が決まります。
- 健全性アラート
- 健全性アラート リストには、環境の健全性に影響を与え、ただちに注意が必要であるものとして構成された、生成済みのすべてのアラートが表示されます。健全性アラート リストは、問題の評価、優先順位付け、およびその速やかな解決開始に使用します。
- リスク アラート
- リスク アラート リストには、ご使用の環境におけるリスクを示すために構成されたすべての発生アラートが表示されます。アラート生成のトリガとなったシンプトムが環境の健全性に悪影響を与える前に、近い将来、リスク アラートに対処します。
- 効率アラート
- 効率アラートのリストには、環境内の監視対象オブジェクトの効率的な使用に関する問題を示すように構成されたアラートのうち、生成されたすべてのアラートが表示されます。効率アラートに対処して、環境内の無駄な領域を解放したり、オブジェクトのパフォーマンスを向上したりします。
VMware Aria Operations でのアラートへのアクセス
[すべてのアラート] または [管理アラート] 画面では、VMware Aria Operations で生成されたすべてのアラートのリストを参照できます。このアラート リストを使用して、環境の状態を判断したり、問題の解決に着手したりします。
[すべてのアラート] ページの場所
左側のメニューで、
の順にクリックします。[管理アラート] ページの場所
管理者は、[アラート] メニューの横にある警告アイコンをクリックするか、左側のメニューで [管理アラート] タブをクリックします。[管理アラート] ページは、ユーザーがグローバル管理者ユーザーである場合、または管理者権限が割り当てられている場合にのみ表示できます。
の順にクリックしてから[すべてのアラート] ページと [管理アラート] ページの機能
デフォルトでは、最初はアクティブなアラートのみがリストされ、アラートは時間でグループ化されます。リストのアラートはツールバー オプションを使用して確認および管理します。Shift キーまたは Control キーを押しながらクリックすると、リストの行を複数選択できます。
アラートの詳細を表示するには、アラート名をクリックします。アラートの詳細(アラートによってトリガされたシンプトムなど)が右側に表示されます。アラートに対処するための推奨事項と、推奨事項を実行するリンクがシステムから提示されます。詳細に [アクションの実行] ボタンが表示されることがあります。このボタンをポイントすると、ボタンをクリックした場合に実行される推奨事項を確認できます。代わりに、[アラート] データ グリッドに [実行] ボタンと [提案された修正] を表示することもできます。[実行] オプションが有効であるアラートでフィルタリングし、[アラート] データ グリッドから、推奨されるタスクを実行してアラートに対処できます。データ グリッドに [提案された修正] 列と [実行] 列を含めるには、アラート リストの左下にある小さいボックスをクリックします。
アラートが生成されたオブジェクトの名前をクリックすると、オブジェクトの詳細が表示され、メトリックやイベントに関連する追加情報にアクセスできます。
以前のバージョンの VMware Aria Operations からアラートを移行した場合、そのアラートはキャンセル済みステータスで表示され、アラートの詳細は使用できません。
すべてのアラートと管理アラートのオプション
アラート オプションには、ツールバーとデータ グリッドのオプションが含まれます。ツールバー オプションは、アラート リストのソートや、キャンセル、サスペンド、所有権の管理に使用します。データ グリッドは、アラートとアラートの詳細の表示に使用します。
リストからアラートを選択すると、次のようなアクション メニューが有効になります。
オプション | 説明 |
---|---|
アラートのキャンセル | 選択したアラートをキャンセルします。アクティブなアラートのみを表示するようにアラート リストが構成されている場合、キャンセルされたアラートはリストから除外されます。 対処の必要がないアラートをキャンセルします。アラートをキャンセルしても、その生成の基盤となった条件はキャンセルされません。アラートのキャンセルは、アラートが障害やイベントのシンプトムによってトリガされた場合に有効です。なぜなら、これらのシンプトムは、監視対象オブジェクトで障害やイベントが引き続き発生した場合に限って再度トリガされるためです。メトリックやプロパティのシンプトムに基づいてアラートが生成された場合、そのアラートは次の収集および分析サイクルまでに限ってキャンセルされます。違反値が依然として存在する場合は、アラートが再度生成されます。 |
キャンセルされたアラートを削除 | グループ選択するか個別にアラートを選択して、キャンセルされた(非アクティブの)アラートを削除します。アクティブ アラートではこのオプションは無効になります。 |
サスペンド | 指定された分数の間アラートをサスペンドします。 アラートを調査しているとき、作業中にアラートがオブジェクトの健全性、リスク、または効率に影響しないようにアラートをサスペンドします。経過時間後に問題が解決されない場合、アラートが再アクティブ化され、再びオブジェクトの健全性、リスク、または効率に影響を与えます。 アラートをサスペンドしたユーザーは所有者として割り当てられます。 |
割り当て先 | ユーザーにアラートを割り当てます。特定のユーザー名を検索し、[保存] をクリックして、選択したユーザーにアラートを割り当てます。 |
所有権の取得 | 現在のユーザーとして、自分自身をアラートの所有者にします。 アラートの所有権を獲得できるだけで、所有権を割り当てることはできません。 |
所有権の解放 | アラートのすべての所有権が解放されます。 |
アラート定義への移動 | [アラートの定義] ページに切り替わり、以前選択したアラートの定義が表示されます。 |
無効化... | アラートを無効にする次の 2 つのオプションが表示されます。
注: [無効化] オプションを有効にするには、
[次でグループ化] ドロップダウン リストから
[定義] を選択し、アラート定義グループの名前をクリックします。
|
外部アプリケーションを開く | 選択したオブジェクトに対して実行できるアクション。 (たとえば、[vSphere Client で仮想マシンを開く] など)。 |
オプション | 説明 |
---|---|
なし | アラートはグループ分けされません。 |
時刻 | アラートをトリガされた時間でグループ化します。デフォルトのオプションです。1 時間、4 時間、今日および昨日、今週の曜日、先週およびさらに古い時間でグループ化することもできます。 |
重要度 | アラートをクリティカル度でグループ化します。値はクリティカル度の低い方から [情報]、[警告]、[緊急]、[クリティカル] です。下の表「[すべてのアラート] データ グリッド」の「オプション」欄の「クリティカル度」も参照してください。 |
定義 | アラートを定義でグループ化します。つまり、類似するアラートをグループ化します。 |
オブジェクト タイプ | アラートをトリガしたオブジェクトのタイプで、アラートをグループ化します。たとえば、ホストに関するアラートをグループ化します。 |
スコープ | アラートをスコープでグループ化します。選択したスコープ内でアラートを検索できます。 |
クイック フィルタ | 説明 |
---|---|
フィルタリング オプション | リストされるアラートを、選択したフィルタと一致するものに限定します。 たとえば、[次でグループ分け] メニューで [時間] オプションを選択したとします。すると、[クイック フィルタ] メニューで [ステータス] -> [アクティブ] を選択できるようになり、[すべてのアラート] ページにアクティブなアラートのみが、トリガされた時間順に表示されます。 |
オプション(フィルタの詳細については、表「[次でグループ分け] オプション」および「[すべてのアラート] データ グリッド」も参照してください)。 | |
アラート ID | アラートに指定される ID。 |
アラート | アラートを生成したアラートの定義名。 |
所有者 | アラートを所有するオペレータの名前。 |
影響 | アラートの影響を受けたアラート バッジ。影響を受けたバッジ、健全性、リスク、または効率では、特定された問題の緊急度のレベルが示されます。 |
アラート サブタイプ | 選択したオブジェクトでトリガされるアラートのタイプに関する追加情報。これにより、特定のシステム管理者に特定のタイプのアラートを割り当てることができるように、アラート タイプ以外の詳細レベルでアラートを分類できます。たとえば、[可用性]、[パフォーマンス]、[容量]、[コンプライアンス]、[構成] などが表示されます。 |
ステータス | アラートの現在の状態。 値には、[有効] または [キャンセル済み] があります。 |
重要度 | 環境内でのアラートの重要度レベル。 このレベルは、アラート定義の作成時に割り当てられたレベルに基づきます。割り当てられたレベルが [シンプトム ベース] の場合は、シンプトムの最高の重要度に基づきます。
次の値があります。
|
起動元 | アラートが生成されたオブジェクトの名前と、オブジェクト名の上にマウスを置いたときにツールチップに表示されるオブジェクト タイプです。 オブジェクト名をクリックすると、オブジェクトの詳細タブが表示されます。ここで、オブジェクトに他に何か問題がないかどうかについて調査を開始できます。 |
制御状態 |
ユーザーのアラートとの相互作用の状態です。値には、次の種類があります。
|
オブジェクト タイプ | アラートの生成の基となったオブジェクトのタイプ。 |
作成日時 | アラートが生成された日時。 |
更新日時 | アラートが最後に変更された日時。
アラートは、次のいずれかの変更が発生するたびに更新されます。
|
キャンセル日時 |
アラートが次のいずれかの理由でキャンセルされた日時。
|
操作 | [実行] オプションが有効であるアラートに基づいてフィルタリングするには、[はい] を選択します。[実行] オプションが無効であるアラートに基づいてフィルタリングするには、[いいえ] を選択します。 |
[アラート] データ グリッドには、生成されたアラートのリストが表示されます。これを参考に、環境内の問題を解決します。各列の見出しの矢印を使用すると、リストを昇順または降順で並べることができます。
オプション | 説明 |
---|---|
重要度 | 環境内でのアラートの重要度レベルを示します。 このレベルは、アラート定義の作成時に割り当てられたレベルに基づきます。割り当てられたレベルが [シンプトム ベース] の場合は、シンプトムの最高の重要度に基づきます。
次の値があります。
|
アラート | アラートを生成したアラートの定義名。 アラート名をクリックすると、そのアラートの詳細が右側に表示されます。 |
起動元 | アラートが生成されたオブジェクトの名前と、オブジェクト名の上にマウスを置いたときにツールチップに表示されるオブジェクト タイプです。 オブジェクト名をクリックすると、オブジェクトの詳細タブが表示されます。ここで、オブジェクトに他に何か問題がないかどうかについて調査を開始できます。 |
作成日時 | アラートが生成された日時。 |
ステータス | アラートの現在の状態。 値には、[有効] または [キャンセル済み] があります。 |
アラート タイプ | 選択したオブジェクトに対して起動したアラートのタイプが表示されます。これにより、アラートを分類し、特定タイプのアラートを特定のシステム管理者に割り当てることができます。たとえば、[アプリケーション]、[仮想化/ハイパーバイザー]、[ハードウェア]、[ストレージ]、[ネットワーク]、[管理]、[検出] などが表示されます。 |
アラート サブタイプ | 選択したオブジェクトに対して起動したアラートのタイプについて、その他の情報が表示されます。これにより、アラート タイプよりも詳細にアラートを分類し、特定タイプのアラートを特定のシステム管理者に割り当てることができます。たとえば、[可用性]、[パフォーマンス]、[容量]、[コンプライアンス]、[構成] などが表示されます。 |
重要度 | アラートの優先度が表示されます。アラートの重要度レベルは、スマート ランク付けアルゴリズムを使用して決定されます。 |
提案された修正 | アラートに対処するための推奨事項を表示します。 |
操作 | アラートに対処するための推奨事項を実行するには、このボタンをクリックします。 |
アラート情報の表示
すべてのアラートのリストからアラートをクリックすると、アラート情報が右側に表示されます。アラート情報を表示して、アラートがトリガーされた症状、根底の問題を修正するための推奨事項を確認し、アラートの原因をトラブルシューティングします。
アラート情報を表示するさまざまな方法
- 左側のメニューで、 の順にクリックし、アラート リストでアラートをクリックします。
- 左側のメニューで [グローバル インベントリ] をクリックし、グループ、カスタム データセンター、アプリケーション、またはインベントリ オブジェクトを選択します。オブジェクトをクリックし、[アラート] タブをクリックします。
- メニューで [検索] を選択し、目的のオブジェクトを探します。オブジェクトをクリックし、[アラート] タブをクリックします。
- [アラート詳細] タブ
-
セクション 説明 推奨 アラートの推奨事項を表示します。[ < ] または [ > ] をクリックして、推奨事項をサイクルします。アラートを解決するには、[アクションの実行] ボタンをクリックします(このボタンが表示されている場合)。 その他の推奨事項 セクションを折りたたんで追加の推奨事項を表示します。[詳細情報が必要ですか? ] セクション内のリンクを確認して、リンクとして表示される追加のメトリック、イベント、または他の詳細を表示します。 アラートの基準 アクティブのみ このオプションはデフォルトで有効になっています。有効にすると、アラートの条件を満たしていたすべてのアクティブなシンプトム/条件が表示されます。無効にすると、アラートのすべてのシンプトム/条件が表示されます。 シンプトム アラートをトリガしたシンプトムを表示します。各シンプトムを折りたたんで追加情報を表示します。 条件 アラートをトリガした条件を表示します。各条件を折りたたんで追加情報を表示します。 メモ アラートに関するメモを入力し、[Submit] をクリックして保存します。 閉じる [X] アイコンをクリックして [アラート詳細] タブを閉じます。 - [関連アラート] タブ
-
[Related Scope] が右側に表示され、アラートがトリガーされたオブジェクトの 1 つ上のレベルと 1 つ下のレベルのオブジェクトが表示されます。このトポロジは修正されました。[関連のアラート] タブの範囲を変更することはできません。
右側に、次のように表示されます。- 過去 30 日間に同じアラートがオブジェクトでトリガーされた場合。これは、繰り返し発生する問題なのか、新しい問題かを理解するのに役立ちます。
- 過去 30 日間に同じ環境内の他のピアで同じアラートがトリガーされた場合。これは、迅速なピア分析を実行して、他のアラートが同じ問題の影響を受けたかどうかを理解するのに役立ちます。
- 現在のトポロジでトリガーされたすべてのアラート。これは、環境内で、オブジェクトの健全性に影響を与える他のアラートがアップストリームまたはダウンストリームにあるかどうかを調べるために役立ちます。
- [Potential Evidence] タブ
-
[潜在的な証拠] タブを参照して、問題の周辺の潜在的な証拠を確認し、根本原因を把握します。このタブには、アラートに関連する可能性があるイベント、プロパティの変更、および異常メトリックが表示されます。時間範囲と範囲は固定されています。範囲または時間範囲を変更してさらに調査するには、[ワークベンチを起動] をクリックします。これにより、トラブルシューティング ワークベンチが実行されます。
[潜在的な証拠] タブに表示される時間の範囲は、アラートがトリガーされる 2 時間 30 分前です。VMware Aria Operations はこの時間範囲で潜在的な証拠を探します。
インテリジェント アラート
すべての企業は、データセンターの運用のさまざまな側面を 24 時間監視する監視ツールを 5 つ以上持つことができます。これにより、単一の監視ツールまたは同じ問題に対する複数のツールによって複数のアラートが生成されるアラート フラッディングの状況が発生する可能性があります。その結果、IT 管理者は何千ものアラートを抽出してノイズを除外し、主要な問題に集中する必要があります。そのため、アラートの大量を増やし、アラート ストームやアラート ノイズが発生し、チームは最も重大なアラートを特定できなくなります。アラート フラッディングは、監視ツールに、すべてのアラートが同じ問題を示していることを理解するためのインテリジェンスがないために発生します。
機械学習 (ML) を使用すると、数百万のメトリック、大量のログ、アプリケーション トレースを監視することにより、仮想マシン、ホスト、データストアなど数千のオブジェクトを含む複雑なシステムの管理を自動化して、スタック全体の詳細なイメージを把握できます。
VMware Aria Operations は、インテリジェント アラート クラスタリングにより、短時間でのトラブルシューティングや複数のオブジェクトにまたがる重大な問題の解決ができないために発生するビジネスのダウンタイムを排除するのに役立ちます。
[インテリジェント アラート] タブを確認できる場所
左側のメニューで、[インテリジェント アラート] タブをクリックします。
の順にクリックし、インテリジェント アラート クラスタリングの仕組み
インテリジェント アラートは、VMware Aria Operations ではアラート クラスタとも呼ばれ、関連するアラートを作成日時およびトポロジ距離に基づいてまとめてグループ化します。このアプローチは、同じ根本的な問題から発生する個々のアラートを処理する方法と比較して、より整理された効率的なトラブルシューティング方法を提供します。アラートのクラスタリングは DBScan アルゴリズムに基づいて実行されます。DBScan (ノイズを伴うアプリケーションの密度ベースの空間クラスタリング) は、データ ポイントを人工クラスタに密接にパックしてグループ化しようとする、監視対象外のクラスタリング 機械学習アルゴリズムです。VMware Aria Operations のコンテキストでは、DBScan は直接の子と親のみを考慮するために、最小ポイントが 5、時間差が 15 分、トポロジ距離が 1 など、特定のパラメータが構成されたストリーミング アルゴリズムで調整されています。アラート クラスタのトラブルシューティングには、インテリジェント アラートの有効期間とオブジェクト トポロジの 2 つのメイン ビューが用意されています。
オプション | 説明 |
---|---|
フィルタ | アラート クラスタは、そのステータスでフィルタリングできます。[ステータス] ドロップダウン リストから [アクティブ] または [非アクティブ] を選択し、[適用] をクリックします。 |
アラート クラスタ | アラート クラスタ カードには、次の情報が表示されます。
|
オブジェクト | ルート オブジェクトの名前。 |
開始時刻/終了時刻 | アラート クラスタの開始時刻は、クラスタリング条件を満たす最初のクラスタが特定された時間です。アラート クラスタの終了時刻は、クラスタがアラート クラスタと見なされなくなった時間です。 |
アラート/オブジェクト | [アラート] を選択すると、特定の期間のアラートがグラフで表示されます。 アラート クラスタに関するオブジェクトの関係チャートを表示するには、[オブジェクト] を選択します。オブジェクトにカーソルを合わせ、[詳細] をクリックして、オブジェクトのサマリ ページを開きます。 |
開始方法 | [開始方法] をクリックして、アラート クラスタの有効期間を表示します。各バブルにはアラートとオブジェクトが表示され、バブルの上にカーソルを置くと詳細が表示されます。 |
トラブルシューティング | これをクリックしてトラブルシューティング ワークベンチを起動し、さらにトラブルシューティングを行います。 |
グラフ チャート | グラフ チャートには、選択したアラート クラスタの時間別のアラート数が表示されます。
チャートの凡例をクリックして、アラートを次の基準でフィルタリングします。
カレンダー アイコンをクリックして、[範囲] を選択するか [開始日] および [終了日] フィールドで日付を選択して、過去のアラートを表示します。 |
グループ化 | アラートは次の方法でグループ化できます。
|
フィルタ | 次の方法でアラートをフィルタリングできます。
|