由于出现错误,NSX Metrics 功能部署失败。

问题

在尝试部署 NSX Metrics 功能时,系统遇到一些错误。

原因

NSX Metrics 功能部署要求在 NSX Application Platform 部署上具有多个 Kubernetes 组件。如果 TKG Cluster on Supervisor 或上游 Kubernetes 集群处于不稳定状态,NSX Metrics 部署可能会失败。

解决方案

  1. 确保系统成功部署了 NSX Application Platform
  2. 如果您有权访问 NSX Manager 命令行界面 (CLI),请使用以下步骤调查 NSX Metrics 日志中记录的任何错误。如果您无权访问 NSX Manager CLI,请使用步骤 3 中提供的信息。
    1. 以 root 用户身份登录到 NSX Manager 设备。
    2. 为任何后续 helmkubectl 命令调用标记 Kubernetes 配置。
      export KUBECONFIG=/config/vmware/napps/.kube/config
    3. 使用以下命令验证系统是否成功部署了衡量指标 Helm Chart。
      helm --namespace nsxi-platform list --all --filter 'metrics'

      STATUS 属性必须显示为 deployed

    4. 使用以下命令验证是否成功部署并完成了设置 Pod。
      kubectl --namespace nsxi-platform get pods --selector='app.kubernetes.io/instance=metrics'
    5. 通过使用以下命令,检查未部署或未处于 Ready 状态的设置 Pod 的日志。
      kubectl --namespace nsxi-platform logs <POD_NAME>
  3. 如果您无权访问 NSX Manager CLI,请使用以下章节中的信息收集 NSX Application Platform 支持包:使用 UI 收集 NSX Application Platform 的支持包。检查名称以 metrics- 开头的 TKG Cluster on Supervisor 或上游 Kubernetes Pod 的支持包日志。
  4. 解决日志中报告的错误。
  5. 在解决日志中报告的错误后,再次尝试使用 NSX Manager UI 部署 NSX Application Platform