本主题提供了关于了解 NSX Edge 和对其进行故障排除的信息。

要对 NSX Edge 设备问题进行故障排除,请验证下面的每个故障排除步骤是否适用于您的环境。每个步骤提供了相应说明或指向文档的链接,以消除可能的根源并在必要时采取纠正措施。这些步骤按最适当的顺序进行排列,以查找问题并确定相应的解决方案。不要跳过某个步骤。

请参阅当前版本的发行说明以查看是否解决了该问题。

确保在安装 NSX Edge 时满足最低系统要求。请参见NSX 安装指南

安装和升级问题

  • 验证遇到的问题是否与“Would Block”问题无关。有关详细信息,请参见https://kb.vmware.com/kb/2107951

  • 如果升级或重新部署成功,但 Edge 接口没有连接,请验证后端 2 层交换机上的连接。请参见https://kb.vmware.com/kb/2135285

  • 如果 Edge 部署或升级失败并出现以下错误:
    /sbin/ifconfig vNic_1 up failed : SIOCSIFFLAGS: Invalid argument

  • 如果部署或升级成功,但在 Edge 接口上没有连接:

  • 运行 show interface 命令以及 Edge 支持日志将显示类似下面的条目:
    vNic_0: <NO-CARRIER,BROADCAST,MULTICAST,UP> mtu 1500 qdisc mq state DOWN qlen 1000
        link/ether 00:50:56:32:05:03 brd ff:ff:ff:ff:ff:ff
        inet 21.12.227.244/23 scope global vNic_0
        inet6 fe80::250:56ff:fe32:503/64 scope link tentative dadfailed 
           valid_lft forever preferred_lft forever
    

    在这两种情况下,主机交换机未就绪或出现某些问题。要解决该问题,请调查主机交换机。

配置问题

  • 收集 NSX Edge 诊断信息。请参见https://kb.vmware.com/kb/2079380

    搜索字符串 vse_die 以筛选 NSX Edge 日志。包含该字符串的日志条目可能会提供有关配置错误的信息。

较高的 CPU 占用率

如果 NSX Edge 上的 CPU 占用率较高,请在 ESXi 主机上使用 esxtop 命令验证设备的性能。请参阅以下知识库文章:

另请参见https://communities.vmware.com/docs/DOC-9279

较高的 ksoftirqd 进程值表示传入数据包率较高。检查是否在数据路径上启用日志记录,例如,为防火墙规则启用。运行 show log follow 命令以确定是否记录了大量的日志命中数。

显示数据包丢弃统计信息

NSX Data Center for vSphere 6.2.3 开始,您可以使用 show packet drops 命令显示以下内容的数据包丢弃统计信息:

  • 接口
  • 驱动程序
  • L2
  • L3
  • 防火墙
要运行该命令,请登录到 NSX Edge CLI 并进入基本模式。有关详细信息,请参见 《NSX 命令行界面参考》。例如:
show packet drops

vShield Edge Packet Drop Stats:

Driver Errors
=============
          TX      TX    TX   RX   RX      RX
Interface Dropped Error Ring Full Dropped Error Out Of Buf
vNic_0    0       0     0    0    0       0
vNic_1    0       0     0    0    0       0
vNic_2    0       0     0    0    0       2
vNic_3    0       0     0    0    0       0
vNic_4    0       0     0    0    0       0
vNic_5    0       0     0    0    0       0

Interface Drops
===============
Interface RX Dropped TX Dropped
vNic_0             4          0
vNic_1          2710          0
vNic_2             0          0
vNic_3             2          0
vNic_4             2          0
vNic_5             2          0

L2 RX Errors
============
Interface length crc frame fifo missed
vNic_0         0   0     0    0      0
vNic_1         0   0     0    0      0
vNic_2         0   0     0    0      0
vNic_3         0   0     0    0      0
vNic_4         0   0     0    0      0
vNic_5         0   0     0    0      0

L2 TX Errors
============
Interface aborted fifo window heartbeat
vNic_0          0    0      0         0
vNic_1          0    0      0         0
vNic_2          0    0      0         0
vNic_3          0    0      0         0
vNic_4          0    0      0         0
vNic_5          0    0      0         0

L3 Errors
=========
IP:
 ReasmFails : 0
 InHdrErrors : 0
 InDiscards : 0
 FragFails : 0
 InAddrErrors : 0
 OutDiscards : 0
 OutNoRoutes : 0
 ReasmTimeout : 0
ICMP:
 InTimeExcds : 0
 InErrors : 227
 OutTimeExcds : 0
 OutDestUnreachs : 152
 OutParmProbs : 0
 InSrcQuenchs : 0
 InRedirects : 0
 OutSrcQuenchs : 0
 InDestUnreachs : 151
 OutErrors : 0
 InParmProbs : 0

Firewall Drop Counters
======================

Ipv4 Rules
==========
Chain - INPUT
rid pkts bytes target prot opt in out source    destination
0    119 30517 DROP   all  --   *   * 0.0.0.0/0 0.0.0.0/0    state INVALID
0      0     0 DROP   all  --   *   * 0.0.0.0/0 0.0.0.0/0
Chain - POSTROUTING
rid pkts bytes target prot opt in out source    destination
0    101 4040  DROP   all   --  *   * 0.0.0.0/0 0.0.0.0/0    state INVALID
0      0    0  DROP   all   --  *   * 0.0.0.0/0 0.0.0.0/0

Ipv6 Rules
==========
Chain - INPUT
rid pkts bytes target prot opt in out source destination
0      0     0   DROP  all      *   * ::/0   ::/0            state INVALID
0      0     0   DROP  all      *   * ::/0   ::/0
Chain - POSTROUTING
rid pkts bytes target prot opt in out source destination
0      0     0   DROP  all       *   * ::/0   ::/0           state INVALID
0      0     0   DROP  all       *   * ::/0   ::/0

管理 NSX Edge 时的预期行为

  • 在 vSphere Web Client 中,在 NSX Edge 上配置 L2 VPN 以及添加、移除或修改站点配置详细信息 (Site Configuration Details)时,此类操作会导致所有现有的连接断开然后重新连接。这是预期的行为。
  • NSX Edge 是一个虚拟机 (VM) 并包含一些存储在存储设备上的文件。关键文件包括配置文件、虚拟磁盘文件、NVRAM 设置文件、交换文件和日志文件。根据应用的虚拟机存储配置文件或手动放置方式,虚拟机配置文件、虚拟磁盘文件和交换文件可能放置在相同的位置,也可能放置在不同数据存储上的不同位置中。如果虚拟机文件位于不同的位置,NSX Manager 显示并使用包含 VMX 文件的数据存储进行虚拟机部署。在重新部署或升级操作期间,NSX Manager 在配置的数据存储或托管 VMX 文件的实时数据存储上部署 NSX Edge 虚拟机。数据存储名称数据存储 ID(托管虚拟机的 VMX 文件)是作为 Appliance 参数的一部分返回的,并显示在 UI 上或作为 REST API 响应提供。您必须参阅 vCenter Server 以了解每个 NSX Manager 虚拟机文件的确切布局以及放置这些文件的一个或多个数据存储的详细信息。有关详细信息,请参阅以下文档:
    • vSphere 虚拟机管理
    • vSphere 资源管理
    • vCenter Server 和主机管理