最常见的故障情况分为两类。
它们是配置和控制层面问题。也可能是管理层面问题,但并不常见。
配置问题和修复
常见配置问题和影响 中介绍了常见配置问题及其影响。
问题 | 影响 |
---|---|
动态路由的协议和转发 IP 地址是相反的 | 没有建立动态协议邻接 |
传输区域与 DVS 边界不对齐 | 分布式路由在一部分 ESXi 主机上无法正常工作(在传输区域中缺少这些主机) |
动态路由协议配置不匹配(计时器、MTU、BGP ASN、密码、接口到 OSPF 区域的映射) | 没有建立动态协议邻接 |
为 DLR HA 接口分配了 IP 地址并允许重新分发连接的路由 | DLR 控制虚拟机可能会吸收 HA 接口子网的流量并产生流量黑洞 |
要解决这些问题,请查看配置并根据需要进行更正。
如果需要,请使用 debug ip ospf 或 debug ip bgp CLI 命令,并观察 DLR 控制虚拟机或 ESG 控制台(而不是通过 SSH 会话)上的日志以检测协议配置问题。
控制层面问题和修复
发现的控制层面问题通常是以下问题造成的:
- 主机控制层面代理 (netcpa) 无法通过 vsfwd 提供的消息总线通道连接到 NSX Manager
- 控制器群集在处理 DLR/VXLAN 实例的主角色时出现问题
通常,可以重新启动某个 NSX Controller(控制器的 CLI 上的 restart controller)以解决与处理主角色有关的控制器群集问题。
有关解决控制层面问题的详细信息,请参见NSX Controller 故障排除。