Antrea Kubernetes 集群的整体运行状况是根据各个 Antrea 组件的状态进行汇总或计算而来的,并显示在 NSX Manager UI 中。
- Antrea 控制器
- Antrea 代理
- 管理平面适配器
- 中央控制平面适配器
Antrea 中的监控 CustomResourceDefinition (CRD) 对象会在预定义的时间段(称为检测信号时间间隔)后将这些 Antrea 组件的状态报告给 NSX Manager。可为每个集群配置此检测信号时间间隔。默认值为 60 秒。允许的值范围是 60 秒到 600 秒。您可以通过运行 NSX API 来修改默认时间间隔。
要读取特定 Antrea Kubernetes 集群的检测信号配置,请运行以下 NSX GET API:
GET https://{nsx-mgr-ip}/policy/api/v1/infra/sites/{site-id}/enforcement-points/{enforcementpoint-id}/cluster-control-planes/{cluster-name}/heartbeat-config
要更新特定 Antrea Kubernetes 集群的检测信号配置,请运行以下 NSX PUT API:
PUT https://{nsx-mgr-ip}/policy/api/v1/infra/sites/{site-id}/enforcement-points/{enforcementpoint-id}/cluster-control-planes/{cluster-name}/heartbeat-config { "report_interval": 120, ""_revision": 0 }
PUT API 正文显示的示例报告时间间隔为 120。您可以指定 60 到 600 之间的任何整数值。报告时间间隔的单位为秒。
_revision 参数描述的是 heartbeat-config 资源的当前修订版本。PUT 操作必须包含此资源的当前修订版本(可通过提交 GET API 获取此修订版本)。如果 PUT 请求中提供的修订版本缺失或失效,则更新操作将被拒绝。
有关 API 中所有参数的详细信息(包括 GET 和 PUT API 响应示例),请参见《NSX API 指南》。
- Antrea Kubernetes 集群的整体运行状况。
- 集群内每个节点上的 Antrea 代理的运行状况。
前提条件
已向 NSX 注册 Antrea Kubernetes 集群。
过程
- 从浏览器中,通过 https://nsx-manager-ip-address 登录到 NSX Manager。
- 查看 Antrea Kubernetes 集群的整体运行状况。
- 导航到
。此时将显示所有已注册的 Antrea Kubernetes 集群的列表。 状态列将显示每个集群的整体运行状况。
- 单击状态列中的“已启动”或“已关闭”可在弹出窗口中查看更多详细信息。
Antrea Kubernetes 集群的整体运行状况是根据以下 Antrea 组件的状态计算的:
- Antrea 控制器
- 管理平面适配器
- 中央控制平面适配器
如果任一或全部三个 Antrea 组件的状态为“已关闭”,则集群的整体状态为“已关闭”。单击弹出窗口中的失败/已关闭,以查看错误消息。仅当全部三个 Antrea 组件的状态都为“已启动”时,集群的状态才会为“已启动”。
弹出窗口还会显示分别处于“正常”、“失败”和“已降级”状态的 Antrea 代理的总数。如果 Antrea 代理已降级,则表示节点上的容器网络正常工作。但是,可能无法在节点上正确实施新的安全策略。如果 Antrea 代理失败,则表示节点上的容器网络无法正常工作。
要查看 Antrea Kubernetes 集群中的每个节点的状态,请检查每个节点上的 Antrea 代理状态,如下一步中所述。
- 导航到
。
- 检查 Antrea Kubernetes 集群的每个节点上的 Antrea 代理的运行状况。
- 导航到
。此时将显示 NSX 清单中所有容器集群的列表。
- 请通过将 CNI 类型设置为 Antrea 来筛选该表。
- 单击节点列中的超链接编号。
此时将打开 节点窗口。 代理状态列显示节点上的 Antrea 代理是处于“已启动”还是“已关闭”状态。 代理状态列不会将“已降级”显示为状态之一。
- 导航到
。