NSX Edge

Problem

Ursache

Lösung

  1. Führen Sie die Admin-CLI get bfd-sessions aus, um VTEP-BFD-Tunnelsitzungen zu finden, die auf dem Edge-Transportknoten inaktiv sind. Als Schutz vor VTEP-Fehlkonfigurationen führt dies dazu, dass sich der Edge selbst herunterfährt, wenn der Edge seine gesamte BFD an den Hypervisor verliert.
  2. Validieren Sie bei inaktiven Sitzungen die IP-Konnektivität zwischen den TEPs mithilfe des ICMP-Pings.
    Hinweis: Die TEP-Schnittstellen befinden sich auf der Tunnel-VRF für Edges und auf dem vxlan-Netstack für ESXi. Initiieren Sie daher einen Ping-Befehl über die Tunnel-VRF auf Edges. Wenn Sie mehr als einen TEP haben, müssen Sie die Quell-IP-Adresse oder die Schnittstelle angeben, die bzw. die für den Ping verwendet wird.
  3. Führen Sie die Admin-CLI "get logical-routers" aus, um Tunnel-VRF abzurufen.
    vrf 0 
    	ping 48.13.47.8 source 48.13.46.1 repeat 3  
  4. ESXi: ping ++netstack=vxlan <remote-vtep-ip=-address> -I vmk10 -d -s 1600
  5. Wie in der CLI dargestellt, sollte der Ping initiiert werden, indem sowohl die Remote- als auch die lokale IP-Adresse angegeben wird, die für die BFD-Sitzung relevant ist. Auch wenn dies zum Testen der einfachen Konnektivität nicht erforderlich ist, geben Sie eine Nutzlastgröße an, die 100 Byte unter der konfigurierten MTU des TEP ist, und legen Sie dfbit so fest, dass es aktiviert wird, um zu verhindern, dass das Underlay-Netzwerk das Paket fragmentiert. Beim Testen mit größeren Nutzlasten wird überprüft, ob Ihr Underlay-Netzwerk ordnungsgemäß eingerichtet wurde, um die NSX Geneve-Overlay-Konfiguration zu unterstützen.
  6. Überprüfen, ob ARP für die Nachbar-VTEP-Adresse aufgelöst wird.
    edge-1(vrf)> get neighbor 
    Logical Router 
    UUID    : 736a80e3-23f6-5a2d-81d6-bbefb2786666 
    VRF     : 0 
    LR-ID   : 0 
    Name    : 
    Type    : TUNNEL 
    Neighbor 
       Interface : 4d9091fe-b971-5d3c-9201-4cb9c7f455fe 
       IP        : 202.1.1.2 <------------ peer TN VTEP IP 
       MAC       : 00:50:56:a6:7d:9b <---- resolved 
       State     : reach <---------- ARP reachable state 
       Timeout   : 37 
  7. Führen Sie den Befehl get interface gefolgt von get logical-router interface <uuid> status aus, um den VTEP-Schnittstellenstatus abzurufen.
      Interface    : ac80718b-72d3-5028-bb07-8f3c4ea2231a 
       Ifuid        : 258 
       Name         : 
       Fwd-mode     : IPV4_AND_IPV6 
       Internal name : uplink-258 
       Mode         : lif 
       Port-type    : uplink 
       IP/Mask      : 71.23.46.1/24 
       MAC          : 00:50:56:b8:2c:c4 
       VLAN         : 2046 
       Access-VLAN  : untagged 
       LS port      : d31578e5-bc91-5466-97c1-8e4a6aa1b2e8 
       Urpf-mode    : PORT_CHECK 
       DAD-mode     : LOOSE 
       RA-mode      : RA_INVALID 
       Admin        : up 
       Op_state     : up 
       Enable-mcast : True 
       MTU          : 8800 
       arp_proxy  

  8. Führen Sie get bfd-session stats aus, um nach Indikatorwerten für RX-Abbrüche und verpassten TX zu suchen.
  9. Wenn der ICMP-Ping fehlschlägt oder ARP nicht erreichbar ist, stellen Sie sicher, dass Ihre Underlay-Konnektivität und die Adresse der Peer-Host-TEP-Schnittstelle gültig sind. Wenn der MTU-Ping für große Pakete fehlschlägt, korrigieren Sie die NSX-Fabric- und/oder Infrastruktur-MTU auf korrekte Werte.
  10. Überprüfen Sie, ob die Edge-TEP-Adresse nicht von einem anderen Transportknoten verwendet wird, und überprüfen Sie, ob Edge-TEP-VLAN und Host-TEP-VLAN nicht dasselbe VLAN und denselben Uplink verwenden.