該当する CIM プロバイダは、管理ノードの運用環境に関するレポートを作成します。これらはすべてのノードで監視される必要があります。

Linux_OperatingSystem

  • 説明

    このクラスのインスタンスは、1 アプライアンスに 1 つのみです。

  • プロパティ
    • FreePhysicalMemory:これが 0 に達した場合は、重大な障害が発生しており、すぐに解決する必要があります(下記の計算を参照)。
    • FreeVirtualMemory:これが 00 に達した場合は、重大な障害が発生しており、すぐに解決する必要があります(下記の計算を参照)。
    • HealthState:値が 5 以外であれば、問題が発生していることを示します。
    • OperationalStatus:値が 2 (OK) 以外であれば、問題が発生していることを示します。ただし、偶発的に値が 4(過負荷)と示されることがあります。サンプリングを繰り返したことで、2 以外の値が示される場合は、アラートを生成する必要があります。
    • TotalVirtualMemorySize:システムで使用可能なスワップ領域の合計。
  • 計算
    • PercentSwapUsed:100 * (TotalSwapSpaceSize – FreeSpaceInPagingFiles) / TotalSwapSpaceSize
    • これは、スワップ領域の使用率を監視するのに役立ちます。システムでスワップ領域の使用を開始すると、パフォーマンスが低下します。空きメモリ アラートはシステムでスワップ領域を使用するより前にトリガされるようにする必要があります。これは、スワップを使用することが重大な問題であるためです。
  • 緩和

    推奨されるのは、PercentSwapUsed > 5% で警告、PercentSwapUsed > 20% でアラートを発生させることです。

    メモリの使用量が高いレベルに達した場合は、メモリを大量に消費するプロセスがあるかどうかを確認してください。もしあれば、問題のノードで top と shift-M を使用して再起動する必要があります。
    $ top
    PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
    6816 root      20   0 2069m 389m  13m S  0.0 19.6   3:36.97 java
    6634 root      20   0  755m  84m 9.8m S  0.0  4.2   1:21.70 java
    ...

    問題のあるアプリケーションが 1 つも表示されない場合は、ノードを再起動します。

Linux_EthernetPort

  • 説明

    通常、このクラスには 2 つのインスタンスがあります。1 つは eth0 インターフェイス用(テナントまたはサービス プロバイダ ネットワーク)、もう 1 つは eth1(管理基盤)インターフェイス用です。

  • プロパティ
    • EnabledState:値が 2 以外であれば、問題が発生しています。
    • Status:OK 以外であれば、問題が発生しています。
  • 緩和

    eth0 のステータスが OK でない場合は、ifconfig を使用して、インターフェイスが稼働していて IP アドレスがあることを確認します。また、各ノードの IPv4 ゲートウェイに ping を送信することもできます。

    eth1 のステータスが OK でない場合は、トランジット サーバから SSH を使用して当該アプライアンスへの接続を試行します。これが奏功すれば、eth1 インターフェイスは正常です。

Linux_ComputerSystem

  • 説明

    このクラスのインスタンスは、1 アプライアンスに 1 つのみです。

  • プロパティ
    • EnabledState:値が 2 以外であれば、問題が発生していることを示します。
  • 緩和

    EnabledState が 2 以外の場合、ノードに ping を送信し、ノードへ ssh で接続し、ノードの dtServiceのステータス (service dtService status) を確認します。

CIM_FileSystem

  • 説明

    これにはいくつかのサブクラスがあります。(リモート ファイル システムを表示しない場合は、CIM_LocalFileSystem クラスも確認します。)特に重要で注目すべきなのは、すべての Linux_Ext4FleSystem インスタンスです。ルート ファイル システムの他にも、ReadOnly モードでないことを確認することが重要なものがある場合があります。現在、次のファイル システムを確認する必要があります。

    • /(root)
    • /boot
    • /data
    • /tmp
    • /usr/local
    • /var

    リソース マネージャ ノードと DB ノードには、いくつかの Linux_NFS インスタンスがあります。これらはリモートでマウントされたファイル システムです。これらのマウントの監視は、アプライアンスか、ストレージ システムに基づく代替メカニズムを使用して選択できます。

  • プロパティ
    • EnabledState:リモートでマウントされた NFS ファイル システムで値が 2(有効)以外だと、アラームが発生します。ただし、管理ノードのローカル ファイル システムには、EnabledState が 3 と示される場合があります。
    • ReadOnly:この値は FALSE にする必要があります。値が TRUE の場合、アラームが発生します。CIM_FileSystem クラスが特定のファイル システムに応答しない場合は、そのファイル システムが読み取り専用である可能性があり、ノードを再起動する必要があります。再起動に失敗した場合は、VMware のサポートにお問い合わせください。
    • Status:値が OK 以外の場合、アラームが発生します。ノードへ移動し、マウントを使用して、ファイル システムがマウントされていることを確認します。ファイル システムがマウントされている場合は、ファイルの作成を試行します。
    • PercentageSpaceUsed:使用可能なディスク容量の割合を表示します。ここでは、70% で警告として、そこから 10% の増分(つまり、70、80、90)でアラートの優先度を上げることが推奨されます。
  • 緩和

    高使用率を報告するファイル システムがある場合は、VMware のサポートに連絡して対策を講じてください。