Antrea Kubernetes 集群的整体运行状况是根据各个 Antrea 组件的状态进行汇总或计算而来的,并显示在 NSX Manager UI 中。

以下 Antrea 组件的运行状况会公开到 NSX Manager
  • Antrea 控制器
  • Antrea 代理
  • 管理平面适配器
  • 中央控制平面适配器

Antrea 中的监控 CustomResourceDefinition (CRD) 对象会在预定义的时间段(称为检测信号时间间隔)后将这些 Antrea 组件的状态报告给 NSX Manager。可为每个集群配置此检测信号时间间隔。默认值为 60 秒。允许的值范围是 60 秒到 600 秒。您可以通过运行 NSX API 来修改默认时间间隔。

要读取特定 Antrea Kubernetes 集群的检测信号配置,请运行以下 NSX GET API:

GET https://{nsx-mgr-ip}/policy/api/v1/infra/sites/{site-id}/enforcement-points/{enforcementpoint-id}/cluster-control-planes/{cluster-name}/heartbeat-config

要更新特定 Antrea Kubernetes 集群的检测信号配置,请运行以下 NSX PUT API:

PUT https://{nsx-mgr-ip}/policy/api/v1/infra/sites/{site-id}/enforcement-points/{enforcementpoint-id}/cluster-control-planes/{cluster-name}/heartbeat-config
{
    "report_interval": 120,
    ""_revision": 0
}

PUT API 正文显示的示例报告时间间隔为 120。您可以指定 60 到 600 之间的任何整数值。报告时间间隔的单位为秒。

_revision 参数描述的是 heartbeat-config 资源的当前修订版本。PUT 操作必须包含此资源的当前修订版本(可通过提交 GET API 获取此修订版本)。如果 PUT 请求中提供的修订版本缺失或失效,则更新操作将被拒绝。

有关 API 中所有参数的详细信息(包括 GET 和 PUT API 响应示例),请参见《NSX API 指南》。

注: 如果 Antrea 组件未向 NSX Manager 发送检测信号,该组件的状态将显示为“未知”。此状态表示运行状况监控进程未在正常运行。但是,节点上的容器网络在正常运行。现有的 NSX 安全策略仍会在 Pod 上实施,但如果应用了任何新的安全策略,便不会在 Pod 上实施这些现有策略。
以下过程说明了在 NSX Manager 中查看这些状态的步骤:
  • Antrea Kubernetes 集群的整体运行状况。
  • 集群内每个节点上的 Antrea 代理的运行状况。

前提条件

已向 NSX 注册 Antrea Kubernetes 集群。

过程

  1. 从浏览器中,通过 https://nsx-manager-ip-address 登录到 NSX Manager
  2. 查看 Antrea Kubernetes 集群的整体运行状况。
    1. 导航到系统 > Fabric > 节点 > 容器集群 > Antrea
      此时将显示所有已注册的 Antrea Kubernetes 集群的列表。 状态列将显示每个集群的整体运行状况。
    2. 单击状态列中的“已启动”或“已关闭”可在弹出窗口中查看更多详细信息。
      Antrea Kubernetes 集群的整体运行状况是根据以下 Antrea 组件的状态计算的:
      • Antrea 控制器
      • 管理平面适配器
      • 中央控制平面适配器

      如果任一或全部三个 Antrea 组件的状态为“已关闭”,则集群的整体状态为“已关闭”。单击弹出窗口中的失败/已关闭,以查看错误消息。仅当全部三个 Antrea 组件的状态都为“已启动”时,集群的状态才会为“已启动”。

      弹出窗口还会显示分别处于“正常”、“失败”和“已降级”状态的 Antrea 代理的总数。如果 Antrea 代理已降级,则表示节点上的容器网络正常工作。但是,可能无法在节点上正确实施新的安全策略。如果 Antrea 代理失败,则表示节点上的容器网络无法正常工作。

      要查看 Antrea Kubernetes 集群中的每个节点的状态,请检查每个节点上的 Antrea 代理状态,如下一步中所述。

  3. 检查 Antrea Kubernetes 集群的每个节点上的 Antrea 代理的运行状况。
    1. 导航到清单 > 容器 > 集群
      此时将显示 NSX 清单中所有容器集群的列表。
    2. 请通过将 CNI 类型设置为 Antrea 来筛选该表。
    3. 单击节点列中的超链接编号。
      此时将打开 节点窗口。 代理状态列显示节点上的 Antrea 代理是处于“已启动”还是“已关闭”状态。 代理状态列不会将“已降级”显示为状态之一。