由于出现错误,NSX Metrics 功能部署失败。
问题
在尝试部署 NSX Metrics 功能时,系统遇到一些错误。
原因
NSX Metrics 功能部署要求在 NSX Application Platform 部署上具有多个 Kubernetes 组件。如果 TKG Cluster on Supervisor 或上游 Kubernetes 集群处于不稳定状态,NSX Metrics 部署可能会失败。
解决方案
- 确保系统成功部署了 NSX Application Platform。
- 如果您有权访问 NSX Manager 命令行界面 (CLI),请使用以下步骤调查 NSX Metrics 日志中记录的任何错误。如果您无权访问 NSX Manager CLI,请使用步骤 3 中提供的信息。
- 以 root 用户身份登录到 NSX Manager 设备。
- 为任何后续 helm 和 kubectl 命令调用标记 Kubernetes 配置。
export KUBECONFIG=/config/vmware/napps/.kube/config
- 使用以下命令验证系统是否成功部署了衡量指标 Helm Chart。
helm --namespace nsxi-platform list --all --filter 'metrics'
STATUS 属性必须显示为 deployed。
- 使用以下命令验证是否成功部署并完成了设置 Pod。
kubectl --namespace nsxi-platform get pods --selector='app.kubernetes.io/instance=metrics'
- 通过使用以下命令,检查未部署或未处于 Ready 状态的设置 Pod 的日志。
kubectl --namespace nsxi-platform logs <POD_NAME>
- 如果您无权访问 NSX Manager CLI,请使用以下章节中的信息收集 NSX Application Platform 支持包:使用 UI 收集 NSX Application Platform 的支持包。检查名称以 metrics- 开头的 TKG Cluster on Supervisor 或上游 Kubernetes Pod 的支持包日志。
- 解决日志中报告的错误。
- 在解决日志中报告的错误后,再次尝试使用 NSX Manager UI 部署 NSX Application Platform。