[トラブルシューティング] タブを使用して、アラートの推奨事項や簡単な分析で解決されない問題の根本原因を特定できます。

始める前に

[分析] タブを使用して環境を分析します。環境の状態の分析 を参照してください。

このタスクについて

クラスタとホスト システムで発生しているキャパシティの問題のシンプトムのトラブルシューティングをさらに進め、それらの問題がいつ発生したかを確認するには、[トラブルシューティング] タブを使用して引き続きメモリの問題を調べます。

手順

  1. 環境 > vSphere ホストおよびクラスタ > USA-Cluster の順にクリックします。
  2. トラブルシューティング タブをクリックし、シンプトムを確認します。

    シンプトム タブには、選択したクラスタでトリガーされたシンプトムが表示されます。クリティカルなシンプトムがいくつか存在することに気付きました。

    • コミット済みプロジェクトのクラスタ コンピューティング リソースの残り時間が極めて少なくなっています

    • クラスタ コンピューティング リソースの残り時間が極めて少なくなっています

    • 残りキャパシティが極めて少なくなっています

  3. クリティカルなシンプトムを分析します。
    1. マウスをそれぞれのクリティカルなシンプトムの上に移動し、使用されているメトリックを特定します。
    2. クラスタに影響を与えているシンプトムだけを表示するには、クイック フィルタ テキスト ボックスに cluster と入力します。

      マウスを Cluster Compute Resource Time Remaining is critically low の上に移動すると、メトリック Badge|Time Remaining with committed projects (%) が表示されます。その値が 0 以下であることがわかります。USA-Cluster でキャパシティについてのシンプトムによってアラートがトリガーされ生成されたのはこのためです。

  4. タイムライン タブをクリックし、USA-Cluster 上で時間とともに発生したトリガーされたシンプトム、アラートおよびイベントを確認し、問題がいつ発生したかを特定します。
    1. ツールバーで、イベント タイプの選択 をクリックします。
    2. 日付コントロール をクリックし、過去 7 日間 を選択します。

      いくつかのイベントが赤色で表示されます。

    3. マウスを各イベントの上に移動し、詳細を確認します。
    4. クラスタのデータ センターで発生したイベントを表示するには、先祖イベントの表示 をクリックし、データセンター を選択します。

      そのデータセンターの警告イベントは黄色で表示されます。

    5. マウスを警告イベントの上に移動します。

      統合度が低くなり始めていることと、夕方遅くにデータ センターでハードしきい値違反が発生したことがわかります。このハードしきい値違反は、Badge|Density メトリック値が受容可能な値である 25 未満であったことと、その違反が値 14.89 でトリガーされたことを示しています。

    6. 影響を受ける子オブジェクトを表示するには、子孫イベントの表示 をクリックし、ホスト システム を選択します。
  5. イベント タブをクリックし、USA-Cluster で発生した変更を調べ、そのアラートまたはクラスタでの他の問題の根本原因に関係する変更が発生したかどうかを判断します。
    1. ツールバーで各バッジをクリックし、発生したイベントを確認します。

      ワークロード バッジは、クラスタで発生したイベントのグラフを表示します。グラフのさまざまな位置に赤い三角形がいくつか表示されます。クラスタ ワークロードのトラブルシューティングにおけるイベント

    2. マウスを赤色の各三角形の上に移動します。

      グラフを確認すると、再発しているイベントによってエラーが引き起こされたかどうかを判断できます。各イベントは、ゲスト ファイル システムでディスク領域不足が発生していることを示しています。該当するオブジェクトは、グラフの下のペインに表示されます。

    3. 赤色の各三角形をクリックして該当するオブジェクトを確認し、そのオブジェクトを下のペインでハイライト表示します。
  6. 問題の考えられる原因の特定するには、すべてのメトリック タブをクリックし、オブジェクトを環境トポロジにおけるそれらのコンテキストで評価します。
    1. 最上部のビューで、USA-Cluster を選択します。
    2. メトリック ペインで、バッジ を展開し、Badge|Capacity Remaining (%) をダブルクリックします。

      Badge|Capacity Remaining (%) 計算が右下のペインに追加されます。

    3. メトリック ペインで、統合度 をダブルクリックします。
    4. メトリック ペインで、ワークロード をダブルクリックします。
    5. ツールバー上で、日付コントロール をクリックし、過去 7 日間 を選択します。

      このメトリック チャートは、クラスタのキャパシティは過去 1 週間安定したレベルにあったが、クラスタ統合度は過去数日間でその最高値まで上昇したということを示しています。バッジ|ワークロード (%) 計算は、この統合度の問題に対応するワークロードの両極を表示しています。

タスクの結果

以上の操作で、クラスタ上の問題に関連するシンプトム、タイムライン、イベント、およびメトリックを分析し、過去数日間でクラスタ上の負荷の高いワークロードによってクラスタ統合度が下がった(クラスタでキャパシティが不足し始めたことを示す)ことを確認しました。

次のタスク

詳細ビューとヒートマップを調べ、プロパティ、メトリック、およびアラートを判断することにより、オブジェクトのリソースで発生するトレンドとスパイクや、オブジェクト全体にわたるリソース配分やデータ マップなどを確認し、オブジェクト全体におけるさまざまなリソース タイプの使用量を調べます。