NSX Intelligence 激活失败。

问题

无法成功完成 NSX Intelligence 激活。您可能已看到以下错误消息之一。
  • 在部署功能之前,集群状态需要为“稳定”(Cluster status needs to be STABLE before feature deployment)

    在单击激活后,可能会显示该错误消息。

  • 功能激活所用的时间太长。Kubernetes Pod 无法启动,或者在 NSX Manager 中注册失败。请联系您的基础架构管理员以寻求帮助。(The feature activation took too long. Either the Kubernetes pods failed to come up or the registration with NSX Manager failed. Please contact your Infrastructure Administrator for assistance.)

原因

NSX Intelligence 激活失败可能是以下原因之一造成的。
  • NSX Application Platform 使用的 Kubernetes Pod 处于降级或不稳定状态。由于要在该平台上托管 NSX Intelligence,因此,如果该平台不稳定,则无法进行部署激活。
  • Kubernetes Pod 无法启动,或尝试在 NSX Manager 中注册 NSX Intelligence 失败。

解决方案

要尝试解决此问题,请执行以下建议的解决方案之一,这些解决方案分别与上一节中列出的原因相对应。
  • 如果您收到在部署功能之前,集群状态需要为“稳定”(Cluster status needs to be STABLE before feature deployment) 错误消息,请解决导致部署了 NSX Application Platform 的 Kubernetes 集群处于不稳定状态的问题。有关信息,请参见随版本 3.2 及更高版本的 VMware NSX 文档集提供的部署和管理 VMware NSX Application Platform文档中的“解决 NSX Application Platform 问题”一节。
  • 如果您收到功能激活所用的时间太长 (The feature activation took too long) 错误消息,请使用以下信息缩小失败的根本原因范围。
    1. 检查 cluster-api Pod 的日志。
      1. 使用 root 帐户登录到 NSX Manager 设备。
      2. 在系统提示符下运行以下命令。
        napp-k logs cluster-api-xxxx -c cluster-api 
        可以从 napp-k get pods 命令中获取确切的 cluster-api Pod 名称。自动生成的后缀附加到 cluster-api Pod 名称后面,在上述命令中表示为 -xxxx

      必须能够从 cluster-api Pod 中访问 Helm 存储库。如果在 cluster-api Pod 和 Helm 存储库之间存在连接问题,cluster-api Pod 可能无法获取 Helm Chart 并导致它为 NSX Intelligence 创建 Kubernetes 资源。连接取决于您的 Kubernetes 基础架构管理员设置的网络策略和其他防火墙规则。与基础架构管理员一起进一步调查并解决该问题。

    2. 验证所需的所有 Pod 是否能够启动。Pod 启动取决于可访问的 Docker 注册表。如果无法访问 Docker 注册表或下载操作由于身份验证或授权原因失败,Kubernetes 工作节点可能无法下载运行工作负载所需的 Docker 容器映像。按照步骤 1 中所述,检查连接。当前不支持具有身份验证的 Docker 注册表。
    3. 检查所有 Pod 是否达到正在运行状态并成功完成了所有作业。在下载 Docker 容器映像后,Pod 必须能够启动和运行。对于未处于正在运行状态的 Pod,请使用以下 describe 命令检查事件。
      napp-k describe pod <pod-name>
      对于未成功完成的作业,请使用以下命令检查日志。
      napp-k logs <pod-name>