Antrea Kubernetes クラスタの全体的な健全性状態は、さまざまな Antrea コンポーネントの状態から集計または計算され、NSX Manager ユーザー インターフェイスに表示されます。

次の Antrea コンポーネントは、その健全性状態を NSX Manager に公開します。
  • Antrea Controller
  • Antrea Agent
  • 管理プレーン アダプタ
  • 中央制御プレーン アダプタ

Antrea 内の Monitoring CustomResourceDefinition (CRD) オブジェクトは、ハートビート間隔という事前に定義された期間が経過した後、これらの Antrea コンポーネントの状態を NSX Manager に報告します。このハートビート間隔はクラスタごとに構成できます。デフォルト値は 60 秒です。使用可能な値の範囲は 60 秒 ~ 600 秒です。デフォルトの間隔を変更するには、NSX API を実行します。

特定の Antrea Kubernetes クラスタのハートビート構成を読み取るには、次の NSX GET API を実行します。

GET https://{nsx-mgr-ip}/policy/api/v1/infra/sites/{site-id}/enforcement-points/{enforcementpoint-id}/cluster-control-planes/{cluster-name}/heartbeat-config

特定の Antrea Kubernetes クラスタのハートビート構成を更新するには、次の NSX PUT API を実行します。

PUT https://{nsx-mgr-ip}/policy/api/v1/infra/sites/{site-id}/enforcement-points/{enforcementpoint-id}/cluster-control-planes/{cluster-name}/heartbeat-config
{
    "report_interval": 120,
    ""_revision": 0
}

PUT API の本文には、サンプル レポート間隔として 120 が表示されます。60 ~ 600 の整数値を指定できます。レポート間隔の単位は秒です。

_revision パラメータには、heartbeat-config リソースの現在のリビジョンを指定します。PUT 操作には、このリソースの現在のリビジョンを含める必要があります。これは、GET API を送信して取得できます。PUT 要求で指定されたリビジョンが見つからないか、古い場合、更新操作は拒否されます。

GET および PUT API 応答の例など、API のすべてのパラメータの詳細については、『NSX API ガイド』を参照してください。

注: Antrea コンポーネントがハートビートを NSX Manager に送信しない場合、そのコンポーネントの状態は「不明」と表示されます。この状態は、状態のモニタリングが機能していないことを意味します。ただし、ノードではコンテナ ネットワークが機能しています。既存の NSX セキュリティ ポリシーは引き続きポッドに適用されます。新しいセキュリティ ポリシーを適用しても、ポッドには適用されません。
以下の手順では、 NSX Manager で次の状態を確認する方法を説明します。
  • Antrea Kubernetes クラスタの全体的な健全性状態。
  • クラスタの各ノードでの Antrea Agent の健全性状態。

前提条件

Antrea Kubernetes クラスタが NSX に登録されている。

手順

  1. ブラウザから、NSX Manager (https://nsx-manager-ip-address) にログインします。
  2. Antrea Kubernetes クラスタの全体的な健全性状態を表示します。
    1. [システム] > [ファブリック] > [ノード] > [コンテナ クラスタ] > [Antrea] の順に移動します。
      すべての登録済みの Antrea Kubernetes クラスタのリストが表示されます。 [状態] 列には、各クラスタの全体的な健全性状態が表示されます。
    2. [状態] 列で [上へ] または [下へ] をクリックすると、ポップアップ ウィンドウに詳細が表示されます。
      Antrea Kubernetes クラスタの全体的な健全性状態は、次の Antrea コンポーネントの状態から計算されます。
      • Antrea Controller
      • 管理プレーン アダプタ
      • 中央制御プレーン アダプタ

      1 つのコンポーネントの状態または 3 つの Antrea コンポーネントの状態がすべて「停止」の場合、クラスタ全体の状態は「停止」になります。ポップアップ ウィンドウで [失敗/停止] をクリックして、エラー メッセージを表示します。3 つの Antrea コンポーネントの状態がすべて「稼動中」の場合にのみ、クラスタの状態が「稼動中」になります。

      ポップアップ ウィンドウには、良好、失敗、劣化状態の Antrea Agent の合計数も表示されます。Antrea Agent が劣化している場合、ノードのコンテナ ネットワークは稼動しています。ただし、新しいセキュリティ ポリシーがノードに正しく適用されない可能性があります。Antrea Agent が失敗状態の場合、ノードのコンテナ ネットワークは稼動していません。

      Antrea Kubernetes クラスタ内の各ノードの状態を確認するには、次の手順で説明するように、各ノードの Antrea Agent の状態をチェックします。

  3. Antrea Kubernetes クラスタの各ノードの Antrea Agent の健全性状態をチェックします。
    1. [インベントリ] > [コンテナ] > [クラスタ] の順に移動します。
      NSX インベントリ内のすべてのコンテナ クラスタを含むリストが表示されます。
    2. [CNI タイプ][Antrea] を設定して、このリストをフィルタリングします。
    3. [ノード] 列で、ハイパーリンク付きの番号をクリックします。
      [ノード] ウィンドウが開きます。 [エージェントの状態] 列には、ノードの Antrea Agent の状態(稼動中または停止)が表示されます。 [エージェントの状態] 列に「劣化」は表示されません。