最常见的故障情况分为两类。

它们是配置和控制层面问题。也可能是管理层面问题,但并不常见。

配置问题和修复

常见配置问题和影响 中介绍了常见配置问题及其影响。
表 1. 常见配置问题和影响
问题 影响
动态路由的协议和转发 IP 地址是相反的 没有建立动态协议邻接
传输区域与 DVS 边界不对齐 分布式路由在一部分 ESXi 主机上无法正常工作(在传输区域中缺少这些主机)
动态路由协议配置不匹配(计时器、MTU、BGP ASN、密码、接口到 OSPF 区域的映射) 没有建立动态协议邻接
为 DLR HA 接口分配了 IP 地址并允许重新分发连接的路由 DLR 控制虚拟机可能会吸收 HA 接口子网的流量并产生流量黑洞

要解决这些问题,请查看配置并根据需要进行更正。

如果需要,请使用 debug ip ospfdebug ip bgp CLI 命令,并观察 DLR 控制虚拟机或 ESG 控制台(而不是通过 SSH 会话)上的日志以检测协议配置问题。

控制层面问题和修复

发现的控制层面问题通常是以下问题造成的:
  • 主机控制层面代理 (netcpa) 无法通过 vsfwd 提供的消息总线通道连接到 NSX Manager
  • 控制器群集在处理 DLR/VXLAN 实例的主角色时出现问题

通常,可以重新启动某个 NSX Controller(控制器的 CLI 上的 restart controller)以解决与处理主角色有关的控制器群集问题。

有关解决控制层面问题的详细信息,请参见NSX Controller 故障排除