用户界面显示 Meterics-PostDeployment failed
错误消息。
问题
在部署 NSX Metrics 功能后调用部署后 API 时,系统遇到错误。
原因
在部署 NSX Metrics 功能后,系统发送一个部署后 API 请求,以对 NSX 和 NSX Application Platform 上的 ClusterApi Pod 执行 API 调用。系统遇到错误。
解决方案
- 确保系统成功部署了 NSX Application Platform。
- 如果您有权访问 NSX Manager 命令行界面 (CLI),请使用以下步骤调查 NSX Metrics 日志中记录的任何错误。如果您无权访问 NSX Manager CLI,请使用步骤 3 中提供的信息。
- 以 root 用户身份登录到 NSX Manager 设备。
- 为任何后续 helm 和 kubectl 命令调用标记 Kubernetes 配置。
export KUBECONFIG=/config/vmware/napps/.kube/config
- 使用以下命令验证系统是否成功部署了衡量指标 Helm Chart。
helm --namespace nsxi-platform list --all --filter 'metrics'
STATUS 属性必须显示为 deployed。
- 使用以下命令验证是否成功部署并完成了设置 Pod。
kubectl --namespace nsxi-platform get pods --selector='app.kubernetes.io/instance=metrics'
- 通过使用以下命令,检查
metrics-app-server
Pod 的日志。将检查POD_NAME
以metrics-app-server-*
开头的 Pod 出现的任何异常或错误。kubectl --namespace nsxi-platform logs <POD_NAME>
- 如果您无权访问 NSX Manager CLI,请使用以下章节中的信息收集 NSX Application Platform 支持包:使用 UI 收集 NSX Application Platform 的支持包。检查名称以 metrics-app-server 开头的 TKG Cluster on Supervisor 或上游 Kubernetes Pod 的支持包日志。
- 通过使用部署后调用
napp/api/v1/metrics/data-collection
APIGET
和POST
,您可以读取和设置数据收集来源。您可以启用或禁用数据收集。如果遇到问题并且部署后 API 成功完成,您可以手动检查是否未启用某些主机的数据收集属性,然后根据需要启用该属性。 - 此外,
/infra/sites/intelligence/registration GET
和/infra/sites/intelligence/registration/{cluster-id} POST
API 是作为部署后步骤的一部分调用的。api/v1/infra/sites/intelligence/registration
输出具有一个is_metrics_enabled
属性,应在部署期间设置该属性,它指示是否成功完成了部署后步骤。如果未设置,您可以使用以下信息手动设置 NSX Metrics 功能。- 调用
GET napp/api/v1/metrics/data-collection
命令,它返回类似下面的 JSON 内容。{ "metrics_toggle_nsx": true, "metrics_toggle_nsx_cloud_native": true, "metrics_toggle_nsx_config": false }
- 找到所有设置为 false 的标记并将其切换到 true。更具体地说,确保将
metrics_toggle_nsx_config
和metrics_toggle_nsx
属性设置为 true。{ "metrics_toggle_nsx": true, "metrics_toggle_nsx_cloud_native": true, "metrics_toggle_nsx_config": true
- 使用修改的正文调用
POST napp/api/v1/metrics/data-collection
命令,并将标记设置为 true。
- 调用