NSX Edge

问题

原因

解决方案

  1. 运行 admin cli get bfd-sessions 以查找在 Edge 传输节点上关闭的 VTEP BFD 隧道会话。为防止出现 VTEP 配置错误,当 Edge 丢失其到 Hypervisor 的所有 BFD 时,会自行关闭。
  2. 对于关闭的会话,使用 ICMP ping 验证 TEP 之间的 IP 连接。
    注: TEP 接口位于隧道 VRF(对于 Edge)和 vxlan 网络栈(对于 ESXi)上。因此,请从 Edge 上的隧道 VRF 中启动 ping 操作,如果有多个 TEP,请确保指定用于执行 ping 操作的源 IP 地址或接口。
  3. 运行 admin cli“get logical-routers”以获取隧道 VRF。
    vrf 0 
    	ping 48.13.47.8 source 48.13.46.1 repeat 3  
  4. ESXi:ping ++netstack=vxlan <remote-vtep-ip=-address> -I vmk10 -d -s 1600
  5. 如 CLI 中所示,应通过指定与 BFD 会话相关的远程和本地 IP 地址来启动 ping 操作。虽然不需要测试简单连接,但请指定比 TEP 配置的 MTU 少 100 字节的负载大小,并将 dfbit 设置为“启用”,以防止底层网络对数据包进行分片。当使用更大的负载进行测试时,将会验证底层网络是否已正确设置为支持 NSX Geneve 覆盖网络配置。
  6. 验证是否为邻居 VTEP 地址解析 ARP。
    edge-1(vrf)> get neighbor 
    Logical Router 
    UUID    : 736a80e3-23f6-5a2d-81d6-bbefb2786666 
    VRF     : 0 
    LR-ID   : 0 
    Name    : 
    Type    : TUNNEL 
    Neighbor 
       Interface : 4d9091fe-b971-5d3c-9201-4cb9c7f455fe 
       IP        : 202.1.1.2 <------------ peer TN VTEP IP 
       MAC       : 00:50:56:a6:7d:9b <---- resolved 
       State     : reach <---------- ARP reachable state 
       Timeout   : 37 
  7. 运行 get interface cmd,然后运行 get logical-router interface <uuid> status,以获取 VTEP 接口状态。
      Interface    : ac80718b-72d3-5028-bb07-8f3c4ea2231a 
       Ifuid        : 258 
       Name         : 
       Fwd-mode     : IPV4_AND_IPV6 
       Internal name : uplink-258 
       Mode         : lif 
       Port-type    : uplink 
       IP/Mask      : 71.23.46.1/24 
       MAC          : 00:50:56:b8:2c:c4 
       VLAN         : 2046 
       Access-VLAN  : untagged 
       LS port      : d31578e5-bc91-5466-97c1-8e4a6aa1b2e8 
       Urpf-mode    : PORT_CHECK 
       DAD-mode     : LOOSE 
       RA-mode      : RA_INVALID 
       Admin        : up 
       Op_state     : up 
       Enable-mcast : True 
       MTU          : 8800 
       arp_proxy  

  8. 运行 get bfd-session stats 以查找“RX 丢弃数”和“TX 丢失数”计数器值。
  9. 如果 ICMP ping 失败或无法访问 ARP,请验证底层网络连接和对等主机 TEP 接口地址是否有效。如果大数据包 MTU ping 失败,请修复 NSX Fabric 和/或底层基础架构 MTU 以更正值。
  10. 确认 Edge TEP 地址未被其他传输节点使用,并确认 Edge TEP VLAN 和主机 TEP VLAN 未使用相同的 VLAN 和上行链路。