由于 NSX 集群的一个或多个管理器节点上的 DATASTORE 组件和/或 CORFU_NONCONFIG 组件已关闭,因此 NSX Manager 状态为“已降级”。

解决方案

  1. 以 admin 身份通过 SSH 连接到 NSX Manager CLI 终端。
  2. 要确定组件已关闭的管理器节点,请运行 get cluster status
  3. 验证底层数据存储是否可用并存在建议的磁盘访问延迟。要获取磁盘访问延迟数据并予以解决,请参见 https://kb.vmware.com/s/article/87075?lang=en_US
    注: 数据存储中断可能会导致 NSX Manager 设备虚拟机进入只读模式。Linux 不提供可用实用程序以从此错误中恢复。如果设备重新引导无法修复该问题,请按照知识库文章“在存储中断时恢复 NSX Manager”所述执行操作。在重新引导受影响的 NSX Manager 虚拟机之前,请确认后端数据存储已完全恢复。
  4. 要确认 NSX 使用的磁盘分区都没有已满或接近已满,请运行“get filesystem-stats”。
    注: 数据存储特定的日志位于 var/log/corfu/corfu.9000.log/var/log/corfu/tanuki.log 中。
  5. 清理磁盘空间和/或重新引导所有 NSX Manager 节点(在解决存储问题后)以移除只读模式。
  6. 如果组件仍然关闭,请联系 VMware 技术支持团队。
    重要说明: 数据存储已关闭时,如果网络连接处于“已启动”状态,则 NSX Manager 会继续加入集群。这种情况可能会导致管理平面和控制平面变得不可用。如果无法解决数据存储问题,请通过关闭受影响的 NSX Manager 的电源来替换受影响的 NSX Manager(前提是通过启动大多数节点来维持集群仲裁数)。
  7. 从现有 NSX Manager 集群中移除 NSX Manager 节点。在 NSX Manager 上,运行 detach node <node-id>
  8. 运行 get cluster status,确认有问题的节点不再是集群成员。
  9. 部署新的 NSX Manager 节点,并将其加入现有管理器集群。