NSX Edge
问题
原因
解决方案
- 运行 admin cli get bfd-sessions 以查找在 Edge 传输节点上关闭的 VTEP BFD 隧道会话。为防止出现 VTEP 配置错误,当 Edge 丢失其到 Hypervisor 的所有 BFD 时,会自行关闭。
- 对于关闭的会话,使用 ICMP ping 验证 TEP 之间的 IP 连接。
注: TEP 接口位于隧道 VRF(对于 Edge)和 vxlan 网络栈(对于 ESXi)上。因此,请从 Edge 上的隧道 VRF 中启动 ping 操作,如果有多个 TEP,请确保指定用于执行 ping 操作的源 IP 地址或接口。
- 运行 admin cli“get logical-routers”以获取隧道 VRF。
vrf 0 ping 48.13.47.8 source 48.13.46.1 repeat 3
- ESXi:ping ++netstack=vxlan <remote-vtep-ip=-address> -I vmk10 -d -s 1600
- 如 CLI 中所示,应通过指定与 BFD 会话相关的远程和本地 IP 地址来启动 ping 操作。虽然不需要测试简单连接,但请指定比 TEP 配置的 MTU 少 100 字节的负载大小,并将 dfbit 设置为“启用”,以防止底层网络对数据包进行分片。当使用更大的负载进行测试时,将会验证底层网络是否已正确设置为支持 NSX Geneve 覆盖网络配置。
- 验证是否为邻居 VTEP 地址解析 ARP。
edge-1(vrf)> get neighbor Logical Router UUID : 736a80e3-23f6-5a2d-81d6-bbefb2786666 VRF : 0 LR-ID : 0 Name : Type : TUNNEL Neighbor Interface : 4d9091fe-b971-5d3c-9201-4cb9c7f455fe IP : 202.1.1.2 <------------ peer TN VTEP IP MAC : 00:50:56:a6:7d:9b <---- resolved State : reach <---------- ARP reachable state Timeout : 37
- 运行 get interface cmd,然后运行 get logical-router interface <uuid> status,以获取 VTEP 接口状态。
Interface : ac80718b-72d3-5028-bb07-8f3c4ea2231a Ifuid : 258 Name : Fwd-mode : IPV4_AND_IPV6 Internal name : uplink-258 Mode : lif Port-type : uplink IP/Mask : 71.23.46.1/24 MAC : 00:50:56:b8:2c:c4 VLAN : 2046 Access-VLAN : untagged LS port : d31578e5-bc91-5466-97c1-8e4a6aa1b2e8 Urpf-mode : PORT_CHECK DAD-mode : LOOSE RA-mode : RA_INVALID Admin : up Op_state : up Enable-mcast : True MTU : 8800 arp_proxy
- 运行 get bfd-session stats 以查找“RX 丢弃数”和“TX 丢失数”计数器值。
- 如果 ICMP ping 失败或无法访问 ARP,请验证底层网络连接和对等主机 TEP 接口地址是否有效。如果大数据包 MTU ping 失败,请修复 NSX Fabric 和/或底层基础架构 MTU 以更正值。
- 确认 Edge TEP 地址未被其他传输节点使用,并确认 Edge TEP VLAN 和主机 TEP VLAN 未使用相同的 VLAN 和上行链路。