您可以使用 Aria Operations Manager 监控 NSX 环境。

表 1. NSX 管理包中的警示
警示 描述 建议
NSX 管理服务失败 以下情况下触发:NSX 主机上的管理服务未运行。 登录到 NSX Manager,然后重新启动失败的管理服务。
逻辑交换机的管理状态为未启动 以下情况下触发: 逻辑交换机上禁用了管理状态。 登录到 NSX,然后根据需要启用管理状态。
Edge 节点控制器/管理器连接未启动 以下情况下触发:NSX 中的 Edge 节点连接状态为已断开。 检查控制器集群和管理器集群的 Edge 节点连接状态,并修复已断开的连接。
Edge 主机节点处于失败/错误状态 以下情况下触发:由于以下原因之一,NSX 中的主机节点处于错误或失败状态:
  • Edge 配置错误
  • 安装失败
  • 卸载失败
  • 升级失败
  • 虚拟机部署失败
  • 虚拟机关闭电源失败
  • 虚拟机打开电源失败
  • 虚拟机取消部署失败
Edge 主机节点处于失败/错误状态,请检查主机节点状态并修复该问题。
BFD 服务已禁用 以下情况下触发:未在逻辑路由器上启用 BFD 服务。 即使配置了邻居,也未启用 Tier-0 路由器的 BFD 服务。如果需要,请启用 BFD 服务。
未配置 NAT 规则 以下情况下触发:未在逻辑路由器上配置 NAT 规则。 登录到 NSX Manager,然后为逻辑路由器添加 NAT 规则。
未配置静态路由 以下情况下触发:未在逻辑路由器上配置静态路由。 登录到 NSX Manager,如果需要,请为逻辑路由器添加静态路由。
路由通告服务已禁用 以下情况下触发:未在逻辑路由器上启用路由通告服务。 即使配置了路由通告,也未启用 Tier-1 路由器的路由通告服务,请登录到 NSX Manager 并启用该服务。
路由重新分发服务已禁用 以下情况下触发:未在逻辑路由器上启用路由重新分发服务。 即使配置了路由重新分发规则,也未启用 Tier-0 路由器的路由重新分发服务,请登录到 NSX Manager 并启用该服务。
已为逻辑路由器禁用 ECMP 服务 以下情况下触发:未在逻辑路由器上启用 ECMP 服务。 即使配置了邻居,也未启用 Tier-0 路由器的 BGP ECMP 服务,请登录到 NSX Manager 并启用该服务。
控制器节点连接已断开 以下情况下触发:NSX 中的控制器节点连接状态为已断开。 登录到 NSX Manager,检查控制器节点与管理节点和控制器集群的连接并解决断开连接状态。
部署的控制器节点少于 3 个 以下情况下触发:NSX 服务器的控制器节点少于三个。 在集群中部署至少 3 个控制器节点。
控制器集群状态不稳定 以下情况下触发:NSX 中的所有控制器节点都已关闭。 检查控制器集群的状态。
管理状态不稳定 以下情况下触发:管理集群上的任一节点的状态均为已关闭。 检查管理集群的状态。
文件系统使用率超过 85% 以下情况下触发:控制器虚拟机的客户机文件系统使用率超过 85%。 文件系统使用率超过 85%,请检查并清理文件系统以腾出更多空间。
文件系统使用率超过 75% 以下情况下触发:控制器虚拟机的客户机文件系统使用率超过 75%。 文件系统使用率超过 75%,请检查并清理文件系统以腾出更多空间。
文件系统使用率超过 70% 以下情况下触发:控制器虚拟机的客户机文件系统使用率超过 70%。 文件系统使用率超过 70%,请检查并清理文件系统以腾出更多空间。
Edge 集群的状态为已关闭 以下情况下触发:Edge 集群的状态为已关闭。 检查 Edge 集群状态,如果需要,请按照 NSX 文档和 VMware 文档中建议的标准故障排除步骤进行操作。
逻辑交换机的状态为失败 以下情况下触发:逻辑交换机的状态为失败。 检查逻辑交换机状态,如果需要,请按照 NSX 文档和 VMware 文档中建议的标准故障排除步骤进行操作。
负载均衡器服务的运行状态为已关闭 以下情况下触发:负载均衡器服务的运行状态为已关闭。 检查负载均衡器服务的运行状态,如果需要,请按照 NSX 文档和 VMware 文档中建议的标准故障排除步骤进行操作。
负载均衡器服务的运行状态为错误 以下情况下触发:负载均衡器服务的运行状态包含错误。 检查负载均衡器服务的运行状态,如果需要,请按照 NSX 文档和 VMware 文档中建议的标准故障排除步骤进行操作。
负载均衡器虚拟服务器的运行状态为已关闭 以下情况下触发:负载均衡器虚拟服务器的运行状态为已关闭。 检查负载均衡器虚拟服务器的运行状态,如果需要,请按照 NSX 文档和 VMware 文档中建议的标准故障排除步骤进行操作。
负载均衡器虚拟服务器的运行状态为已分离 以下情况下触发:负载均衡器虚拟服务器的运行状态为已分离。 检查负载均衡器虚拟服务器的运行状态,如果需要,请按照 NSX 文档和 VMware 文档中建议的标准故障排除步骤进行操作。
Edge 节点的配置状态为失败 以下情况下触发:Edge 节点的配置状态为失败。 检查 Edge 节点的配置状态,如果需要,请按照 NSX 文档和 VMware 文档中建议的标准故障排除步骤进行操作。
管理服务的监控运行时状态为失败 以下情况下触发:管理服务的监控运行时状态停止运行。 登录到 NSX Manager VA,然后重新启动失败的管理服务。
管理集群的管理状态不稳定 以下情况下触发:管理集群的管理状态不稳定。 检查管理集群的状态。
部署的管理器节点少于 3 个 以下情况下触发:NSX 服务器部署的管理器节点少于三个。 在集群中部署至少 3 个管理器节点。
管理器节点连接已断开 以下情况下触发:管理器节点的管理器连接状态为已断开。 登录到 NSX Manager,检查管理器节点的管理器连接,并按照 NSX 文档和 VMware 文档中建议的标准故障排除步骤进行操作。
管理器节点的文件系统使用率超过 85% 以下情况下触发:管理器节点的客户机文件系统使用率超过 85%。 文件系统使用率超过 85%,请检查并清理文件系统以腾出更多空间。
管理器节点的文件系统使用率超过 75% 以下情况下触发:管理器节点的客户机文件系统使用率超过 75%。 文件系统使用率超过 75%,请检查并清理文件系统以腾出更多空间。
管理器节点的文件系统使用率超过 70% 以下情况下触发:管理器节点的客户机文件系统使用率超过 70%。 文件系统使用率超过 70%,请检查并清理文件系统以腾出更多空间。