由於出現錯誤,NSX 度量 功能部署失敗。

問題

在嘗試部署 NSX 度量 功能時,系統遇到一些錯誤。

原因

NSX 度量 功能部署要求在 NSX Application Platform 部署上具有多個 Kubernetes 元件。如果 TKG Cluster on Supervisor 或上游 Kubernetes 叢集處於不穩定狀態,NSX 度量 部署可能會失敗。

解決方案

  1. 確保系統成功部署了 NSX Application Platform
  2. 如果您有權存取 NSX Manager 命令行介面 (CLI),請使用以下步驟調查 NSX 度量 記錄中記錄的任何錯誤。如果您無權存取 NSX Manager CLI,請使用步驟 3 中提供的資訊。
    1. 以 root 使用者身分登入到 NSX Manager 應用裝置。
    2. 為任何後續 helmkubectl 命令叫用標記 Kubernetes 設定。
      export KUBECONFIG=/config/vmware/napps/.kube/config
    3. 使用以下命令,驗證系統是否成功部署了 Metrics Helm 圖表。
      helm --namespace nsxi-platform list --all --filter 'metrics'

      STATUS 屬性必須顯示為 deployed

    4. 使用以下命令,驗證是否成功部署並完成了設定網繭。
      kubectl --namespace nsxi-platform get pods --selector='app.kubernetes.io/instance=metrics'
    5. 透過使用以下命令,檢查未部署或未處於 Ready 狀態的設定網繭的記錄。
      kubectl --namespace nsxi-platform logs <POD_NAME>
  3. 如果您無權存取 NSX Manager CLI,請使用以下章節中的資訊收集 NSX Application Platform 支援服務包:使用 UI 收集 NSX Application Platform 的支援服務包。檢查名稱以 metrics- 開頭的 TKG Cluster on Supervisor 或上游 Kubernetes 網繭的支援服務包記錄。
  4. 解決記錄中報告的錯誤。
  5. 在解決記錄中報告的錯誤後,再次嘗試使用 NSX Application Platform UI 部署 NSX Manager