次の表に、アラーム メッセージや解決の推奨アクションなど、アラームをトリガーするイベントについて説明します。重要度が「低」より大きいイベントが発生すると、アラームがトリガーされます。
アラーム管理イベント
アラーム管理イベントは、NSX Manager ノードとグローバル マネージャ ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
アラーム サービスの過負荷状態 | 重大 | アラーム サービスが過負荷状態になっています。 イベントの検出時:「大量のアラームが報告されたため、アラーム サービスが一時的に過負荷状態になっています。NSX ユーザー インターフェイスと GET /api/v1/alarm NSX API が新しいアラームの報告を停止しました。Syslog エントリと SNMP トラップ(有効になっている場合)は引き続き送信され、基になるイベントの詳細を報告します。アラームの大量発生の原因となっている問題が解決されると、アラーム サービスが新しいアラームの報告を再開します。」 イベントの解決時:「アラームの大量発生が収まりました。新しいアラームの報告が再開されました。」 |
NSX ユーザー インターフェイスの [アラーム] ページまたは GET /api/v1/alarms?status=OPEN,ACKNOWLEDGED,SUPPRESSED NSX API を使用して、すべてのアクティブ アラームを確認します。それぞれのアクティブ アラームに対して、アラームの推奨アクションに従い、根本原因を調査します。十分なアラームが解決されると、アラーム サービスが新しいアラームの報告を再開します。 |
大量のアラーム | 重大 | 特定のタイプのアラームが大量に検出されました。 イベントの検出時:「{event_id} アラームが大量に発生しているため、アラーム サービスはこのタイプのアラームの報告を一時的に停止しています。NSX ユーザー インターフェイスと GET /api/v1/alarms NSX API は、これらのアラームの新しいインスタンスを報告しません。Syslog エントリと SNMP トラップ(有効になっている場合)は引き続き送信され、基になるイベントの詳細を報告します。{event_id} アラームの大量発生の原因となっている問題が解決されると、アラーム サービスが新しい {event_id} アラームの報告を再開します。」 イベントの解決時:「{event_id} アラームの大量発生が収まりました。新しいアラームの報告が再開されました。」 |
NSX ユーザー インターフェイスの [アラーム] ページまたは GET /api/v1/alarms?status=OPEN,ACKNOWLEDGED,SUPPRESSED NSX API を使用して、すべてのアクティブ アラームを確認します。それぞれのアクティブ アラームに対して、アラームの推奨アクションに従い、根本原因を調査します。十分なアラームが解決されると、アラーム サービスが新しい {event_id} アラームの報告を再開します。 |
証明書イベント
証明書イベントは、NSX Manager ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
期限切れの証明書 | 重大 | 証明書が期限切れです。 イベントの検出時:「証明書 {entity-id} が期限切れです。」 イベントの解決時:「期限切れの証明書 {entity-id} が削除されたか、有効期限の問題が解決されました。」 |
現在、証明書を使用しているサービスが、期限切れでない新しい証明書を使用するように更新されていることを確認します。たとえば、HTTP サービスに新しい証明書を適用するには、次の API 呼び出しを行います。
ここで、<cert-id> は、API 呼び出し 期限切れの証明書が使用中でなければ、次の API 呼び出しを使用して、この証明書を削除する必要があります。
|
証明書がまもなく期限切れ | 高 | 証明書がまもなく期限切れになります。 イベントの検出時:「証明書 {entity-id} はまもなく期限切れになります。」 イベントの解決時:「有効期限の近い証明書 {entity-id} が削除されたか、有効期限の問題が解決されました。」 |
現在、証明書を使用しているサービスが、有効期限が近くない新しい証明書を使用するように更新されていることを確認します。たとえば、HTTP サービスに新しい証明書を適用するには、次の API 呼び出しを行います。
ここで、<cert-id> は、API 呼び出し 期限切れの近い証明書が使用中でなければ、API 呼び出しを使用して、この証明書を削除する必要があります。
|
証明書がまもなく期限切れ | Medium | 証明書の期限切れが近づいています。 イベントの検出時:「証明書 {entity-id} の期限切れが近づいています。」 イベントの解決時:「有効期限の近い証明書 {entity-id} が削除されたか、有効期限の問題が解決されました。」 |
現在、証明書を使用しているサービスが、有効期限が近くない新しい証明書を使用するように更新されていることを確認します。たとえば、HTTP サービスに新しい証明書を適用するには、次の API 呼び出しを行います。
ここで、<cert-id> は、API 呼び出し 期限切れの近い証明書が使用中でなければ、API 呼び出しを使用して、この証明書を削除する必要があります。
|
CNI 健全性イベント
CNI 健全性イベントは、 ESXi ノードと KVM ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
Hyperbus マネージャの切断 | Medium | Hyperbus がマネージャ ノードと通信できません。 イベントの検出時:「Hyperbus がマネージャ ノードと通信できません。」 イベントの解決時:「Hyperbus はマネージャ ノードと通信可能です。」 |
Hyperbus vmkernel インターフェイス (vmk50) が存在しない可能性があります。ナレッジベースの記事 KB67432 を参照してください。 |
DHCP イベント
DHCP イベントは、NSX Edge ノードとパブリック ゲートウェイ ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
プール リースの割り当て失敗 | 高 | IP プール内の IP アドレスが不足しています。 イベントの検出時:「DHCP サーバ {dhcp_server_id} の IP プール {entity_id} のアドレスがすべて使用されています。最後の DHCP 要求は失敗しています。以降の要求も失敗します。」 イベントの解決時:「DHCP サーバ {dhcp_server_id} の IP プール {entity_id} の問題が解決されました。前回の DHCP 要求にリースが正常に割り当てられています。」 |
NSX ユーザー インターフェイスまたは DHCP プールの構成を確認します。あるいは、DHCP サーバが実行されている Edge ノードで NSX CLI コマンド get dhcp ip-pool を呼び出し、構成を確認します。 さらに、NSX CLI コマンド get dhcp lease を呼び出して、Edge ノードで現在アクティブなリースを確認します。 リースとアクティブな仮想マシンの数を比較します。アクティブなリースの数と比較して、仮想マシンの数が少ない場合は、DHCP サーバ構成でリース時間を短縮することを検討します。また、NSX ユーザー インターフェイスで ページの順にアクセスして、DHCP サーバのプール範囲を拡張することを検討します。 |
プールの状態: 過負荷 | Medium | IP プールが過負荷状態になっています。 イベントの検出時:「DHCP サーバ {dhcp_server_id} の IP プール {entity_id} の使用率が上限に近づいています。{dhcp_pool_usage}% の IP が割り当てられています。」 イベントの解決時:「DHCP サーバ {dhcp_server_id} の IP プール {entity_id} が使用率の高しきい値を下回りました。」 |
NSX ユーザー インターフェイスまたは DHCP プールの構成を確認します。あるいは、DHCP サーバが実行されている Edge ノードで NSX CLI コマンド get dhcp ip-pool を呼び出し、構成を確認します。 さらに、NSX CLI コマンド get dhcp lease を呼び出して、Edge ノードで現在アクティブなリースを確認します。 リースとアクティブな仮想マシンの数を比較します。アクティブなリースの数と比較して、仮想マシンの数が少ない場合は、DHCP サーバ構成でリース時間を短縮することを検討します。また、NSX ユーザー インターフェイスで ページの順にアクセスして、DHCP サーバのプール範囲を拡張することを検討します。 |
分散ファイアウォール イベント
分散ファイアウォールイベントは、NSX Manager ノードまたは ESXi ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
分散ファイアウォールの CPU 使用率が非常に高い | 重大 | 分散ファイアウォールの CPU 使用率が非常に高くなっています。 イベントの検出時:「トランスポート ノード {entity_id} の DFW の CPU 使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値に達しているか、超えています。」 イベントの解決時:「DNS フォワーダ {entity_id} が再度実行されています。」 |
このホストと他のホストの間で仮想マシン ワークロードのリバランシングを行うことを検討してください。 最適化でのセキュリティ設計を確認してください。たとえば、ルールがデータセンター全体に適用されない場合は、適用先の構成を使用します。 |
分散ファイアウォールのメモリ使用率が非常に高い | 重大 | 分散ファイアウォールのメモリ使用率が非常に高くなっています。 イベントの検出時:「トランスポート ノード {entity_id} の DFW のメモリ使用率 {heap_type} が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値に達しているか、超えています。」 イベントの解決時:「トランスポート ノード {entity_id} の DFW のメモリ使用率 {heap_type} が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値を下回っています。」 |
ホストで NSX CLI コマンド get firewall thresholds を呼び出して、現在の DFW のメモリ使用率を確認します。 このホストと他のホストの間でワークロードのリバランシングを行うことを検討してください。 |
DNS イベント
DNS イベントは、NSX Edge ノードとパブリック ゲートウェイ ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
フォワーダ: 停止 | 高 | DNS フォワーダが停止しています。 イベントの検出時:「DNS フォワーダ {entity_id} が実行されていません。これは、現在有効になっている構成済みのすべての DNS フォワーダに影響します。」 イベントの解決時:「DNS フォワーダ {entity_id} が再度実行されています。」 |
|
フォワーダ: 無効 | 高 | DNS フォワーダが無効になっています。 イベントの検出時:「DNS フォワーダ {entity_id} が無効になっています。」 イベントの解決時:「DNS フォワーダ {entity_id} が有効になっています。」 |
|
Edge 健全性イベント
Edge 健全性イベントは、NSX Edge ノードとパブリック ゲートウェイ ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
Edge の CPU 使用率が非常に高い | 重大 | Edge ノードの CPU 使用率が非常に高くなっています。 イベントの検出時:「Edge ノード {entity_id} の CPU 使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値に達しているか、超えています。」 イベントの解決時:「Edge ノード {entity_id} の CPU 使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値を下回っています。」 |
この Edge ノードの構成、実行中のサービス、サイズを確認してください。ワークロードに合わせて Edge アプライアンスのフォーム ファクタのサイズを調整するか、他の Edge ノードの間でサービスのリバランシングを行うことを検討してください。 |
Edge の CPU 使用率が高い | Medium | Edge ノードの CPU 使用率が高くなっています。 イベントの検出時:「Edge ノード {entity-id} の CPU 使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値に達しているか、超えています。」 イベントの解決時:「Edge ノード {entity_id} の CPU 使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値を下回っています。」 |
この Edge ノードの構成、実行中のサービス、サイズを確認してください。ワークロードに合わせて Edge アプライアンスのフォーム ファクタのサイズを調整するか、他の Edge ノードの間でサービスのリバランシングを行うことを検討してください。 |
Edge データパスの構成エラー | 高 | Edge ノードのデータパスの構成に失敗しました。 イベントの検出時:「3 回試行しましたが、Edge ノードでデータパスを有効にできませんでした。」 イベントの解決時:「Edge ノードのデータパスが有効になりました。」 |
マネージャ ノードと Edge ノードの接続が良好であることを確認します。 サービスの健全性を確認するには、Edge ノードの NSX CLI から get services コマンドを呼び出します。 データプレーン サービスが停止している場合は、start service dataplane コマンドを呼び出してサービスを再起動します。 |
Edge データパスの CPU 使用率が非常に高い | 重大 | Edge ノードのデータパスの CPU 使用率が非常に高くなっています。 イベントの検出時:「Edge ノード {entity-id} でデータパスの CPU 使用率が {datapath_resource_usage}% になりました。超高しきい値に達しているか、超えている状態が少なくとも 2 分間続いています。」 イベントの解決時:「Edge ノード {entity-id} でデータパスの CPU 使用率が許容しきい値より低くなっています。」 |
NSX CLI コマンド get dataplane cpu stats を呼び出して CPU コアあたりのパケット レートを表示し、Edge ノードの CPU 統計情報を確認します。 パケット レートが高いと CPU 使用率が高い可能性があります。 Edge アプライアンスのフォーム ファクタのサイズを大きくし、同じクラスタの他の Edge ノードまたは別の Edge クラスタとの間でこの Edge ノードのサービスをリバランシングすることを検討してください。 |
Edge データパスの CPU 使用率が高い | Medium | Edge ノードのデータパスの CPU 使用率が高くなっています。 イベントの検出時:「Edge ノード {entity-id} でデータパスの CPU 使用率が {datapath_resource_usage}% になりました。高しきい値に達しているか、超えている状態が少なくとも 2 分間続いています。」 イベントの解決時:「Edge ノード {entity-id} の CPU 使用率が高しきい値を下回りました。」 |
NSX CLI コマンド get dataplane cpu stats を呼び出して CPU コアあたりのパケット レートを表示し、Edge ノードの CPU 統計情報を確認します。 パケット レートが高いと CPU 使用率が高い可能性があります。 Edge アプライアンスのフォーム ファクタのサイズを大きくし、同じクラスタの他の Edge ノードまたは別の Edge クラスタとの間でこの Edge ノードのサービスをリバランシングすることを検討してください。 |
Edge データバスの暗号ドライバが停止 | 重大 | Edge ノードでデータパスの暗号ドライバが停止しています。 イベントの検出時:「Edge ノードの暗号ドライバが停止しています。」 イベントの解決時:「Edge ノードの暗号ドライバが起動しています。」 |
必要に応じて、Edge ノードをアップグレードします。 |
Edge データパスのメモリ プールの使用率が高い | Medium | Edge ノードのデータパス メモリ プールの使用率が高くなっています。 イベントの検出時:「Edge ノード {entity-id} で {mempool_name} のデータパス メモリ プールの使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値に達しているか、超えています。」 イベントの解決時:「Edge ノード {entity-id} で {mempool_name} のデータパス メモリ プールの使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値を下回っています。」 |
root ユーザーとしてログインし、edge-appctl -t /var/run/vmware/edge/dpd.ctl mempool/show コマンドと edge-appctl -t /var/run/vmware/edge/dpd.ctl memory/show malloc_heap コマンドを呼び出して、DPDK のメモリ使用率を確認します。 |
Edge のディスク使用率が非常に高い | 重大 | Edge ノードのディスク使用率が非常に高くなっています。 イベントの検出時:「Edge ノードのディスク パーティション {disk_partition_name} のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値に達しているか、超えています。」 イベントの解決時:「Edge ノードのディスク パーティション {disk_partition_name} のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値を下回っています。」 |
使用率の高いパーティションを調べ、削除可能なサイズの大きいファイルがあるか確認します。 |
Edge のディスク使用率が高い | Medium | Edge ノードのディスク使用率が高くなっています。 イベントの検出時:「Edge ノードのディスク パーティション {disk_partition_name} のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値に達しているか、超えています。」 イベントの解決時:「Edge ノードのディスク パーティション {disk_partition_name} のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値を下回っています。」 |
使用率の高いパーティションを調べ、削除可能なサイズの大きいファイルがあるか確認します。 |
Edge グローバル ARP テーブルの使用率が高い | Medium | Edge ノードのグローバル ARP テーブルの使用率が高くなっています。 イベントの検出時:「Edge ノード {entity-id} でグローバル ARP テーブルの使用率が {datapath_resource_usage}% になりました。高しきい値に達しているか、超えている状態が 2 分以上続いています。」 イベントの解決時:「Edge ノード {entity-id} でグローバル ARP テーブルの使用率が高しきい値を下回りました。」 |
ARP テーブル サイズを大きくします。
|
Edge のメモリ使用率が非常に高い | 重大 | Edge ノードのメモリ使用率が非常に高くなっています。 イベントの検出時:「Edge ノード {entity_id} のメモリ使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値に達しているか、超えています。」 イベントの解決時:「Edge ノード {entity_id} のメモリ使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値を下回っています。」 |
この Edge ノードの構成、実行中のサービス、サイズを確認してください。ワークロードに合わせて Edge アプライアンスのフォーム ファクタのサイズを調整するか、他の Edge ノードの間でサービスのリバランシングを行うことを検討してください。 |
Edge のメモリ使用率が高い | Medium | Edge ノードのメモリ使用率が高くなっています。 イベントの検出時:「Edge ノード {entity-id} のメモリ使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値に達しているか、超えています。」 イベントの解決時:「Edge ノード {entity_id} のメモリ使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値を下回っています。」 |
この Edge ノードの構成、実行中のサービス、サイズを確認してください。ワークロードに合わせて Edge アプライアンスのフォーム ファクタのサイズを調整するか、他の Edge ノードの間でサービスのリバランシングを行うことを検討してください。 |
Edge NIC リンクの停止状態 | 重大 | Edge ノードの NIC リンクが停止しています。 イベントの検出時:「Edge ノードの NIC {edge_nic_name} リンクが停止しています。」 イベントの解決時:「Edge ノードの NIC {edge_nic_name} リンクが稼動しています。」 |
NSX CLI コマンド get interfaces を呼び出し、Edge ノードで NIC リンクが物理的に停止しているかどうかを確認します。 停止している場合は、ケーブル接続を確認します。 |
Edge NIC の受信バッファの不足 | 重大 | Edge ノードの NIC 受信記述子リング バッファに空き容量がありません。 イベントの検出時:「Edge ノード {entity-id} で Edge NIC {edge_nic_name} の受信リング バッファが 60 秒以上 {rx_ring_buffer_overflow_percentage}% オーバーフローしています。」 イベントの解決時:「Edge ノード {entity-id} で Edge NIC {edge_nic_name} の受信リング バッファのオーバーフローが解決されました。」 |
NSX CLI コマンド
get dataplane を呼び出し、次の操作を行います。
|
Edge NIC の送信バッファの不足 | 重大 | Edge ノードの NIC 送信記述子リング バッファに空き容量がありません。 イベントの検出時:「Edge ノード {entity-id} で Edge NIC {edge_nic_name} の送信リング バッファが 60 秒以上 {tx_ring_buffer_overflow_percentage}% オーバーフローしています。」 イベントの解決時:「Edge ノード {entity-id} で Edge NIC {edge_nic_name} の送信リング バッファのオーバーフローが解決されました。」 |
NSX CLI コマンド
get dataplane を呼び出し、次の操作を行います。
|
ストレージ エラー | 重大 | NSX-T Data Center 3.0.1 で開始。 Edge ノードの次のディスク パーティションは読み取り専用モードです: {disk_partition_name} 。 |
再起動で問題が解決されたかどうか読み取り専用パーティションを確認します。問題が解決していない場合は、ディスクの交換が必要になります。ナレッジベースの記事 https://kb.vmware.com/s/article/2146870 を参照してください。 |
エンドポイント保護イベント
エンドポイント保護イベントは、NSX Manager ノードまたは ESXi ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
EAM の状態: 停止 | 重大 | コンピュート マネージャの ESX Agent Manager (EAM) サービスが停止しています。 イベントの検出時:「コンピュート マネージャ {entity_id} の ESX Agent Manager (EAM) サービスが停止しています。」 イベントの解決時:「コンピュート マネージャ {entity_id} の ESX Agent Manager (EAM) サービスが起動しているか、コンピュート マネージャ {entity_id} が削除されています。」 |
ESX Agent Manager (EAM) サービスを再起動します。
|
パートナー チャネル: 停止 | 重大 | ホスト モジュールとパートナー サービス仮想マシンの接続が停止しています。 イベントの検出時:「ホスト モジュールとパートナー SVM {entity_id} の接続が停止しています。」 イベントの解決時:「ホスト モジュールとパートナー SVM {entity_id} の接続が開始しています。」 |
ナレッジベースの記事 KB2148821Troubleshooting NSX Guest Introspectionを参照して、{entity_id} で識別されるパートナー サービス仮想マシンがホスト モジュールに再接続されていることを確認してください。 |
フェデレーション イベント
フェデレーション イベントは、NSX Manager、NSX Edge、およびパブリック ゲートウェイのノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
LM から LM への同期エラー |
高 | NSX-T Data Center 3.0.1 で開始。 {site_name}({site_id} と {remote_site_name}({remote_site_id} 間の同期が 5 分以上失敗しています。 |
|
LM から LM への同期に関する警告 | Medium | NSX-T Data Center 3.0.1 で開始。 {site_name}({site_id} と {remote_site_name}({remote_site_id} 間の同期に失敗しました。 |
|
RTEP BGP が停止しています | 高 | NSX-T Data Center 3.0.1 で開始。 送信元 IP アドレス {bgp_source_ip} からリモートの場所 {remote_site_name} のネイバー IP アドレス {bgp_neighbor_ip} への RTEP BGP セッションが停止しています。原因: {failure_reason}。 |
|
高可用性イベント
高可用性イベントは、NSX Edge ノードと Public Cloud Gateway ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
Tier-0 ゲートウェイのフェイルオーバー | 高 | Tier-0 ゲートウェイがフェイルオーバーしました。 イベントの検出時:「Tier-0 ゲートウェイ {entity-id} は、{previous_gateway_state} から {current_gateway_state} にフェイルオーバーされました。」 イベントの解決時:「Tier-0 ゲートウェイ {entity-id} が起動しました。」 |
停止しているサービスを確認して再起動します。
|
Tier-1 ゲートウェイのフェイルオーバー | 高 | Tier-1 ゲートウェイがフェイルオーバーしました。 イベントの検出時:「Tier-1 ゲートウェイ {entity-id} は、{previous_gateway_state} から {current_gateway_state} にフェイルオーバーされました。」 イベントの解決時:「Tier-1 ゲートウェイ {entity-id} が起動しました。」 |
停止しているサービスを確認して再起動します。
|
インフラストラクチャ通信イベント
インフラストラクチャ通信イベントは、NSX Edge、KVM、ESXi、パブリック ゲートウェイのノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
Edge トンネル: 停止 | 重大 | Edge ノードのトンネル状態が「停止」になっています。 イベントの検出時:「Edge ノード {entity_id} のトンネルの全体的な状態が「停止」となっています。」 イベントの解決時:「Edge ノード {entity_id} のトンネルがリストアされました。」 |
|
インフラストラクチャ サービス イベント
インフラストラクチャ サービス イベントは、NSX Edge ノードとパブリック ゲートウェイ ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
Edge サービスの状態: 停止 | 重大 | Edge サービスが少なくとも 1 分間停止しています。 イベントの検出時:「サービス {edge_service_name} が少なくとも 1 分間停止しています。」 イベントの解決時:「サービス {edge_service_name} は起動しています。」 |
Edge ノードで、/var/log/core ディレクトリにあるコア ダンプ ファイルをチェックし、エラーが原因でサービスが終了していないことを確認します。 サービスが停止しているかどうかを確認するには、NSX CLI コマンド get services を呼び出します。 停止している場合は、 |
Edge サービスの状態変更 | Low | Edge サービスの状態が変更されました。 イベントの検出時:「サービス {edge_service_name} が {previous_service_state} から {current_service_state} に変更されました。」 イベントの解決時:「サービス {edge_service_name} が {previous_service_state} から {current_service_state} に変更されました。」 |
Edge ノードで、/var/log/core ディレクトリにあるコア ダンプ ファイルをチェックし、エラーが原因でサービスが終了していないことを確認します。 サービスが停止しているかどうかを確認するには、NSX CLI コマンド get services を呼び出します。 停止している場合は、 |
Intelligence 通信イベント
NSX Intelligence 通信イベントは、NSX Manager ノード、ESXi ノード、NSX Intelligence アプライアンスで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
トランスポート ノードのフロー エクスポータの切断 | 高 | トランスポート ノードは、Intelligence ノードのメッセージング ブローカから切断されています。データ収集が影響を受けます。 イベントの検出時:「トランスポート ノード {entity-id} のフロー エクスポータが Intelligence ノードのメッセージング ブローカから切断されています。データ収集が影響を受けます。」 イベントの解決時:「トランスポート ノード {entity-id} 上のフロー エクスポータが、Intelligence ノードのメッセージング ブローカに再接続しました。」 |
|
制御チャネルからトランスポート ノードへの接続が停止 | 重大 | 制御チャネルからトランスポート ノードへの接続が停止しています。 イベントの検出時:コントローラ サービス central_control_plane_id からトランスポート ノード {entity-id} への接続が停止しています。コントローラ サービス側からみると、少なくとも 3 分間停止しています。 イベントの解決時:コントローラ サービス central_control_plane_id で、トランスポート ノード {entity-id} との接続がリストアされました。 |
|
制御チャネルからトランスポート ノードへの接続が長時間停止 |
警告 | 制御チャネルからトランスポート ノードへの接続が長時間停止しています。 イベントの検出時:コントローラ サービス central_control_plane_id からトランスポート ノード {entity-id} への接続が停止しています。コントローラ サービス側からみると、少なくとも 15 分間停止しています。 イベントの解決時:コントローラ サービス central_control_plane_id で、トランスポート ノード {entity-id} との接続がリストアされました。 |
|
管理チャネルからトランスポート ノードへの接続が停止 |
重大 |
マネージャ ノードからトランスポート ノードへの接続が切断されています。 イベントの検出時: イベントの解決時: |
|
マネージャの制御チャネルが停止 |
重大 | マネージャからコントローラ チャネルへの接続が停止しています。 イベントの検出時: イベントの解決時: |
マネージャ ノード managernode (IP) で、次の 2 つの NSX CLI コマンドを呼び出します。
|
Intelligence 健全性イベント
NSX Intelligence 健全性イベントは、NSX Manager ノードと NSX Intelligence アプライアンスで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
CPU 使用率が非常に高い | 重大 | Intelligence ノードの CPU 使用率が非常に高くなっています。 イベントの検出時:「NSX Intelligence ノード {intelligence_node_id} の CPU 使用率が {system_usage_threshold}% の超高しきい値を超えています。」 イベントの解決時:「NSX Intelligence ノード {intelligence_node_id} の CPU 使用率が {system_usage_threshold}% の超高しきい値を下回っています。」 |
top コマンドを使用して、メモリ使用率が最も高いプロセスを確認します。次に、/var/log/syslog とこれらのプロセスのローカル ログを確認して、未解決のエラーがないか確認します。 |
CPU 使用率が高い | Medium | Intelligence ノードの CPU 使用率が高くなっています。 イベントの検出時:「NSX Intelligence ノード {intelligence_node_id} の CPU 使用率が {system_usage_threshold}% の高しきい値を超えています。」 イベントの解決時:「NSX Intelligence ノード {intelligence_node_id} の CPU 使用率が {system_usage_threshold}% の高しきい値を下回っています。」 |
top コマンドを使用して、メモリ使用率が最も高いプロセスを確認します。次に、/var/log/syslog とこれらのプロセスのローカル ログを確認して、未解決のエラーがないか確認します。 |
メモリ使用率が非常に高い | 重大 | Intelligence ノードのメモリ使用率が非常に高くなっています。 イベントの検出時:「NSX Intelligence ノード {intelligence_node_id} のメモリ使用率が {system_usage_threshold}% の超高しきい値を超えています。」 イベントの解決時:「NSX Intelligence ノード {intelligence_node_id} のメモリ使用率が {system_usage_threshold}% の超高しきい値を下回っています。」 |
top コマンドを使用して、メモリ使用率が最も高いプロセスを確認します。次に、/var/log/syslog とこれらのプロセスのローカル ログを確認して、未解決のエラーがないか確認します。 |
メモリ使用率が高い | Medium | Intelligence ノードのメモリ使用率が高くなっています。 イベントの検出時:「NSX Intelligence ノード {intelligence_node_id} のメモリ使用率が {system_usage_threshold}% の高しきい値を超えています。」 イベントの解決時:「NSX Intelligence ノード {intelligence_node_id} のメモリ使用率が {system_usage_threshold}% の高しきい値を下回っています。」 |
top コマンドを使用して、メモリ使用率が最も高いプロセスを確認します。次に、/var/log/syslog とこれらのプロセスのローカル ログを確認して、未解決のエラーがないか確認します。 |
ディスク使用率が非常に高い | 重大 | Intelligence ノードのディスク使用率が非常に高くなっています。 イベントの検出時:「NSX Intelligence ノード {intelligence_node_id} で、ディスク パーティション {disk_partition_name} のディスク使用率が {system_usage_threshold}% の超高しきい値を超えています。」 イベントの解決時:「NSX Intelligence ノード {intelligence_node_id} で、ディスク パーティション {disk_partition_name} のディスク使用率が {system_usage_threshold}% の超高しきい値を下回っています。」 |
ディスク パーティション {disk_partition_name} を調べ、削除可能なサイズの大きいファイルがあるか確認します。 |
ディスク使用率が高い | Medium | Intelligence ノードのディスク使用率が高くなっています。 イベントの検出時:「NSX Intelligence ノード {intelligence_node_id} で、ディスク パーティション {disk_partition_name} のディスク使用率が {system_usage_threshold}% の高しきい値を超えています。」 イベントの解決時:「NSX Intelligence ノード {intelligence_node_id} で、ディスク パーティション {disk_partition_name} のディスク使用率が {system_usage_threshold}% の高しきい値を下回っています。」 |
ディスク パーティション {disk_partition_name} を調べ、削除可能なサイズの大きいファイルがあるか確認します。 |
データ ディスク パーティションの使用率が非常に高い | 重大 | Intelligence ノードのデータ ディスク パーティションの使用率が非常に高くなっています。 イベントの検出時:「NSX Intelligence ノード {intelligence_node_id} で、ディスク パーティション /data のディスク使用率が {system_usage_threshold}% の超高しきい値を超えています。」 イベントの解決時:「NSX Intelligence ノード {intelligence_node_id} で、ディスク パーティション /data のディスク使用率が {system_usage_threshold}% の超高しきい値を下回っています。」 |
ディスク使用率がしきい値を下回るまで NSX Intelligence のデータ収集を停止します。 NSX ユーザー インターフェイスで、[システム] > [アプライアンス] > [NSX Intelligence アプライアンス] の順に移動します。次に の順に選択します。 |
データ ディスク パーティションの使用率が高い | Medium | Intelligence ノードのデータ ディスク パーティションの使用率が高くなっています。 イベントの検出時:「NSX Intelligence ノード {intelligence_node_id} で、ディスク パーティション /data のディスク使用率が {system_usage_threshold}% の高しきい値を超えています。」 イベントの解決時:「NSX Intelligence ノード {intelligence_node_id} で、ディスク パーティション /data のディスク使用率が {system_usage_threshold}% の高しきい値を下回っています。」 |
ディスク使用率がしきい値を下回るまで NSX Intelligence のデータ収集を停止します。 /data パーティションを調べ、削除可能なサイズの大きいファイルがあるか確認します。 |
ノードの状態:劣化 | 高 | Intelligence ノードの状態が「劣化」になっています。 イベントの検出時:「NSX Intelligence ノード {intelligence_node_id} のサービス {service_name} が実行されていません。」 イベントの解決時:「NSX Intelligence ノード {intelligence_node_id} のサービス {service_name} が正常に実行されています。」 |
NSX Intelligence ノードで NSX CLI コマンド get services を実行し、サービスの状態と健全性情報を確認します。 NSX CLI コマンド restart service <service-name> を使用して、予期せず停止したサービスを再起動します。 |
ライセンス イベント
ライセンス イベントは、NSX Manager ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
ライセンスの期限切れ | 重大 | ライセンスが期限切れです。 イベントの検出時:「タイプ {license_edition_type} のライセンスが期限切れです。」 イベントの解決時:「タイプ {license_edition_type} の期限切れ証明書が削除されたか、有効期限の問題が解決されました。」 |
期限切れでない新しいライセンスを追加します。
|
ライセンスがまもなく期限切れ | Medium | イベントの検出時:「タイプ {license_edition_type} のライセンスがまもなく期限切れになります。」 イベントの解決時:「{license_edition_type} の有効期限の近いライセンスが削除されたか、有効期限の問題が解決されました。」 |
期限切れでない新しいライセンスを追加します。
|
ロード バランサ イベント
ロード バランサ イベントは、NSX Edge ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
ロード バランサの CPU 使用率が非常に高い | Medium | ロード バランサの CPU 使用率が非常に高くなっています。 イベントの検出時:「ロード バランサ {entity_id} の CPU 使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値を超えています。」 イベントの解決時:「ロード バランサ {entity_id} の CPU 使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値を下回っています。」 |
ロード バランサの CPU 使用率が {system_usage_threshold}% を超えている場合、このロード バランサのワークロードが高すぎます。 ロード バランサのサイズを small から medium または medium から large に変更して、ロードバランサ サービスのサイズを変更します。 このロード バランサの CPU 使用率が高い場合は、ワークロードに合わせて Edge アプライアンスのフォーム ファクタのサイズを調整するか、ロード バランサ サービスを他の Edge ノードに移動することを検討してください。 |
ロード バランサの状態:停止 | Medium | ロード バランサ サービスが停止しています。 イベントの検出時:「ロード バランサ サービス {entity_id} が停止しています。」 イベントの解決時:「ロード バランサ サービス {entity_id} が起動しています。」 |
Edge ノードでロード バランサ サービスが実行されているかどうかを確認します。 ロード バランサ サービスの状態が準備未完了の場合は、Edge ノードをメンテナンス モードに切り替えてからメンテナンス モードを終了します。 ロード バランサの状態が回復しない場合は、syslog にエラー ログがあるかどうかを確認してください。 |
仮想サーバの状態: 停止 | Medium | ロード バランサの仮想サービスが停止しています。 イベントの検出時:「ロード バランサの仮想サーバ {entity_id} が停止しています。」 イベントの解決時:「ロード バランサの仮想サーバ {entity_id} が起動しています。」 |
ロード バランサ プールの状態と構成を確認します。 正しく構成されていない場合は、再構成を行い、仮想サーバからロード バランサ プールを削除し、仮想サーバに再度追加します。 |
プールの状態: 停止 | Medium | イベントの検出時:「ロード バランサ プール {entity_id} の状態が「停止」になっています。」 イベントの解決時:「ロード バランサ プール {entity_id} の状態が「起動中」になっています。」 |
メンバーの健全性が確認されると、モニターの「起動回数」構成に基づいて、プール メンバーの健全性の状態が更新されます。 |
マネージャ健全性イベント
NSX Manager 健全性イベントは、NSX Manager ノード クラスタで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
重複した IP アドレス | Medium | マネージャ ノードの IP アドレスが別のデバイスによって使用されています。 イベントの検出時:「マネージャ ノード {entity_id} の IP アドレス {duplicate_ip_address} は、ネットワーク内の別のデバイスで使用されています。」 イベントの解決時:「マネージャ ノード {entity_id} は {duplicate_ip_address} を使用していません。」 |
|
マネージャの CPU 使用率が非常に高い | 重大 | マネージャ ノードの CPU 使用率が非常に高くなっています。 イベントの検出時:「マネージャ ノード {entity_id} の CPU 使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値に達しているか、超えています。」 イベントの解決時:「マネージャ ノード {entity_id} の CPU 使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値を下回っています。」 |
このマネージャ ノードの構成、実行中のサービス、サイズを確認してください。 Manager アプライアンスのフォーム ファクタのサイズを調整することを検討してください。 |
マネージャーの CPU 使用率が高い | Medium | NSX-T Data Center 3.0.1 で開始。 マネージャ ノードの CPU 使用率が高くなっています。 イベントの検出時:「マネージャ ノード {entity_id} の CPU 使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値に達しているか、超えています。」 イベントの解決時:「マネージャ ノード {entity_id} の CPU 使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値を下回っています。」 |
このマネージャ ノードの構成、実行中のサービス、サイズを確認してください。 Manager アプライアンスのフォーム ファクタのサイズを調整することを検討してください。 |
マネージャのメモリ使用率が非常に高い | 重大 | NSX-T Data Center 3.0.1 で開始。 マネージャ ノードのメモリ使用率が非常に高くなっています。 イベントの検出時:「マネージャ ノード {entity_id} のメモリ使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値に達しているか、超えています。」 イベントの解決時:「マネージャ ノード {entity_id} のメモリ使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値を下回っています。」 |
このマネージャ ノードの構成、実行中のサービス、サイズを確認してください。 Manager アプライアンスのフォーム ファクタのサイズを調整することを検討してください。 |
マネージャーのメモリ使用率が高い | Medium | マネージャ ノードのメモリ使用率が高くなっています。 イベントの検出時:「マネージャ ノード {entity_id} のメモリ使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値に達しているか、超えています。」 イベントの解決時:「マネージャ ノード {entity_id} のメモリ使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値を下回っています。」 |
このマネージャ ノードの構成、実行中のサービス、サイズを確認してください。 Manager アプライアンスのフォーム ファクタのサイズを調整することを検討してください。 |
マネージャのディスク使用率が非常に高い | 重大 | マネージャ ノードのディスクの使用率が非常に高くなっています。 イベントの検出時:「マネージャ ノードのディスク パーティション {disk_partition_name} のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値に達しているか、超えています。」 イベントの解決時:「マネージャ ノードのディスク パーティション {disk_partition_name} のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値を下回っています。」 |
使用率の高いパーティションを調べ、削除可能なサイズの大きいファイルがあるか確認します。 |
マネージャのディスク使用率が高い | Medium | マネージャ ノードのディスク使用率が高くなっています。 イベントの検出時:「マネージャ ノードのディスク パーティション {disk_partition_name} のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値に達しているか、超えています。」 イベントの解決時:「マネージャ ノードのディスク パーティション {disk_partition_name} のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値を下回っています。」 |
使用率の高いパーティションを調べ、削除可能なサイズの大きいファイルがあるか確認します。 |
マネージャの構成ディスクの使用率が非常に高い | 重大 | マネージャ ノードの config ディスクの使用率が非常に高くなっています。 イベントの検出時:「マネージャ ノードのディスク パーティション /config のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値に達しているか、超えています。/config/corfu ディレクトリで NSX Datastore サービスが大量のディスクを使用している可能性があります。」 イベントの解決時:「マネージャ ノードのディスク パーティション /config のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値を下回っています。」 |
/config パーティションを調べ、削除可能なサイズの大きいファイルがあるか確認します。 |
マネージャの構成ディスクの使用率が高い | Medium | マネージャ ノードの config ディスクの使用率が高くなっています。 イベントの検出時:「マネージャ ノードのディスク パーティション /config のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値に達しているか、超えています。/config/corfu ディレクトリで NSX Datastore サービスのディスク使用量が増加している可能性があります。」 イベントの解決時:「マネージャ ノードのディスク パーティション /config のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値を下回っています。」 |
/config パーティションを調べ、削除可能なサイズの大きいファイルがあるか確認します。 |
オペレーション DB のディスク使用率が高い |
Medium | マネージャ ノードのディスク パーティション「/nonconfig」のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の高しきい値に達しているか、超えています。/nonconfig/corfu ディレクトリで NSX Datastore サービスのディスク使用量が増加している可能性があります。 |
/opt/vmware/tools/support/inspect_checkpoint_issues.py --nonconfig を実行して問題が報告された場合は、VMware サポートにお問い合わせください。 |
オペレーション DB のディスク使用率が非常に高い | 重大 | マネージャ ノードのディスク パーティション「/nonconfig」のディスク使用率が {system_resource_usage}% になりました。これは、{system_usage_threshold}% の超高しきい値に達しているか、超えています。/nonconfig/corfu ディレクトリで NSX Datastore サービスのディスク使用量が増加している可能性があります。 |
/opt/vmware/tools/support/inspect_checkpoint_issues.py --nonconfig を実行して問題が報告された場合は、VMware サポートにお問い合わせください。 |
NCP イベント
NSX Container Plug-in (NCP) イベントは、 ESXi ノードと KVM ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
NCP プラグイン停止 | 重大 | マネージャ ノードで NCP が停止しているか、不良な状態になっています。 イベントの検出時:「マネージャ ノードで NCP が停止しているか、不良な状態になっています。」 イベントの解決時:「マネージャ ノードで NCP が起動しているか、再び良好な状態になっています。」 |
問題のあるクラスタを検索するには、NSX API GET /api/v1/systemhealth/container-cluster/ncp/status を呼び出し、すべてのクラスタの状態を取得して、「停止」または「不明」状態のクラスタ名を確認します。 NSX ユーザー インターフェイスで ページの順に移動して、「停止」または「不明」状態のクラスタ名を確認し、[ノード] タブをクリックします。ここに、すべての Kubernetes クラスタと PAS クラスタのメンバーが表示されます。
Kubernetes クラスタの場合:
PAS クラスタの場合:
|
ノード エージェント健全性イベント
ノードエージェント健全性イベントは、 ESXi ノードと KVM ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
ノード エージェント停止 | 高 | ノード仮想マシン内で実行されているエージェントが停止している可能性があります。 イベントの検出時:「ノード仮想マシン内で実行されているエージェントが停止している可能性があります。」 イベントの解決時:「ノード仮想マシン内のエージェントが実行されています。」 |
ESX の場合:
KVM の場合:
ESX と KVM の場合:
|
パスワード管理イベント
パスワード管理イベントは、NSX Manager、NSX Edge、パブリック ゲートウェイのノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
パスワードの期限切れ | 重大 | ユーザー パスワードが期限切れです。 イベントの検出時:「ユーザー {username} のパスワードは期限切れになっています。」 イベントの解決時:「ユーザー {username} のパスワードが正常に変更されたか、有効期限の問題が解決されました。」 |
システムにアクセスするには、ユーザー {username} のパスワードを今すぐ変更する必要があります。たとえば、ユーザーに新しいパスワードを適用するには、要求の本文に有効なパスワードを指定して次の NSX API を呼び出します。
|
パスワードがまもなく期限切れ | 高 | ユーザー パスワードがまもなく期限切れになります。 イベントの検出時:「ユーザー {username} のパスワードはあと {password_expiration_days} 日で期限切れになります。」 イベントの解決時:「ユーザー {username} のパスワードが正常に変更されたか、有効期限の問題が解決されました。」 |
システムにアクセスするには、{username} で識別されるユーザーのパスワードを今すぐ変更する必要があります。たとえば、ユーザーに新しいパスワードを適用するには、要求の本文に有効なパスワードを指定して次の NSX API を呼び出します。
|
パスワードがまもなく期限切れ | 中 | ユーザー パスワードの期限切れが近づいています。 イベントの検出時:「ユーザー {username} のパスワードはあと {password_expiration_days} 日で期限切れになります。」 イベントの解決時:「ユーザー {username} のパスワードが正常に変更されたか、有効期限の問題が解決されました。」 |
{username} で識別されるユーザーのパスワードをすぐに変更する必要があります。たとえば、ユーザーに新しいパスワードを適用するには、要求の本文に有効なパスワードを指定して次の NSX API を呼び出します。
|
ルーティング イベント
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
BGP 停止 | 高 | BGP ネイバーが停止しています。 イベントの検出時:「ルーター {entity_id} で、BGP ネイバー {bgp_neighbor_ip} が停止しています。理由:{failure_reason}。」 イベントの解決時:「ルーター {entity_id} で、BGP ネイバー {bgp_neighbor_ip} が稼動しています。」 |
|
外部インターフェイスの双方向フォワーディング検出 (BFD) 停止 |
高 | BFD セッションが停止しています。 イベントの検出時:「ルーター {entity_id} で、ピア {peer_address} の BFD セッションが停止しています。」 イベントの解決時:「ルーター {entity_id} で、ピア {peer_address} の BFD セッションが起動しています。」 |
|
ルーティングの停止 | 高 | すべての BGP/BFD セッションが停止しています。 イベントの検出時:「すべての BGP/BFD セッションが停止しています。」 イベントの解決時:「1 つ以上の BGP/BFD セッションが起動しています。」 |
|
スタティック ルートの削除 | 高 | スタティック ルートが削除されました。 イベントの検出時:「ルーター {entity_id} で BFD が停止しているため、スタティック ルート {static_address} が削除されました。」 イベントの解決時:「BFD がリカバリされたため、ルーター {entity_id} でスタティック ルート {static_address} が再度追加されました。」 |
|
トランスポート ノードの健全性
トランスポート ノード健全性イベントは、KVM ノードと ESXi ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
LAG メンバーの停止 | Medium | LACP レポーティング メンバーが停止しています。 イベントの検出時:「LACP レポーティング メンバーが停止しています。」 イベントの解決時:「LACP レポーティング メンバーが起動しています。」 |
ホストの LAG メンバーの接続状態を確認します。
|
N-VDS アップリンク停止 | Medium | アップリンクが停止しています。 イベントの検出時:「アップリンクが停止しています。」 イベントの解決時:「アップリンクが起動しています。」 |
ホストのアップリンクの物理 NIC の状態を確認します。
|
VPN イベント
VPN イベントは、NSX Edge ノードとパブリック ゲートウェイ ノードで発生します。
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
IPsec ポリシー ベース セッションの停止 | Medium | ポリシー ベース IPsec VPN セッションが停止しています。 イベントの検出時:「ポリシー ベース IPsec VPN セッション {entity_id} が停止しています。理由:{session_down_reason}。」 イベントの解決時:「ポリシー ベース IPsec VPN セッション {entity_id} が起動しています。」 |
IPsec VPN セッションの構成を確認し、セッション停止の理由に応じてエラーを解決します。 |
IPsec ルート ベース セッションの停止 | Medium | ルート ベース IPsec VPN セッションが停止しています。 イベントの検出時:「ルート ベース IPsec VPN セッション {entity_id} が停止しています。理由:{session_down_reason}。」 イベントの解決時:「ルート ベース IPsec VPN セッション {entity_id} が起動しています。」 |
IPsec VPN セッションの構成を確認し、セッション停止の理由に応じてエラーを解決します。 |
IPsec ポリシー ベース トンネルの停止 | Medium | ポリシー ベース IPsec VPN トンネルが停止しています。 イベントの検出時:「セッション {entity_id} で、1 つ以上のポリシー ベース IPsec VPN トンネルが停止しています。」 イベントの解決時:「セッション {entity_id} で、すべてのポリシー ベース IPsec VPN トンネルが起動しています。」 |
IPsec VPN セッションの構成を確認し、トンネル停止の理由に応じてエラーを解決します。 |
IPsec ルート ベース トンネルの停止 | Medium | ルート ベース IPsec VPN トンネルが停止しています。 イベントの検出時:「セッション {entity_id} で、1 つ以上のルート ベース IPsec VPN トンネルが停止しています。」 イベントの解決時:「セッション {entity_id} で、すべてのルート ベース IPsec VPN トンネルが起動しています。」 |
IPsec VPN セッションの構成を確認し、トンネル停止の理由に応じてエラーを解決します。 |
L2VPN セッションの停止 | Medium | L2VPN セッションが停止しています。 イベントの検出時:「L2VPN セッション {entity_id} が停止しています。」 イベントの解決時:「L2VPN セッション {entity_id} が起動しています。」 |
IPsec VPN セッションの構成を確認し、理由に応じてエラーを解決します。 |
Identity Firewall イベント
イベント名 | 重要度 | アラート メッセージ | 推奨アクション |
---|---|---|---|
Active Directory サーバとの接続 |
重大 |
AD サーバとの接続が切断されました。 イベントの検出時:Identity Firewall の Active Directory サーバとの接続が停止しています。 イベントの検出時:Identity Firewall の Active Directory サーバとの接続が動作しています。 |
接続の問題を修正した後、LDAP サーバのユーザー インターフェイスで [接続のテスト] を使用して、Active Directory サーバとの接続をテストします。 |
差分同期エラー |
重大 | Active Directory サーバの エラーの説明 を同期できませんでした イベントの検出時:Identity Firewall Active Directory サーバで選択同期を実行中にエラーが発生しました。エラーの詳細。 イベントの検出時:Identity Firewall Active Directory サーバの選択的同期のエラーが修正されました。 |
|