将 Telegraf 与 SD-WAN 网关 集成后,可以从配置的输入插件收集计数器,并将数据导出到输出插件。

下表列出了可从 SD-WAN 网关 中导出的受支持计数器。

计数器名称 描述 可用性 支持的最低 SD-WAN 版本
number_of_edges 连接到网关的 Edge 数。 全局 4.3.0
number_of_tunnels 与网关关联的隧道数。 全局 4.3.0
IPv4、IPv6 4.5.0
number_of_routes 网关中安装的路由数。 全局 4.3.0
number_of_flows 网关中的活动流量总数。 全局 4.3.0
active_NAT_entries 每个对等体的有效 NAT 条目数。 全局 4.3.0
free_NAT_entries 为 NAT 分配的可用共享内存条目数。 全局 4.3.0
stale_NAT_entries 系统中失效的 NAT 条目数。此计数器仅跟踪由于引用计数泄漏而失效的条目。 全局 4.3.0
stale_tunnel_entries 网关中失效的隧道条目数。 全局 4.3.0
stale_peer_objects 网关中失效的对等体对象数。 全局 4.3.0
stale_flow_entries 网关中失效的流量条目数。 全局 4.3.0
sched_drop 由于带宽限制,调度程序中丢弃的数据包数。 全局 4.3.0
flow_drop 由于流量查找失败和流量创建失败而丢弃的数据包数。 全局 4.3.0
route_drop 由于路由查找失败和路由完整性问题而丢弃的数据包数。还会考虑由于异常而丢弃的路由控制数据包数。 全局 4.3.0
nat_drop 由于 NAT 查找失败和 NAT 创建失败而丢弃的数据包数。 全局 4.3.0
over_capacity_drop 由于内部切换队列丢弃限制以及系统中数据包缓冲区不足而丢弃的数据包数。 全局 4.3.0
vcmp_drop 由于 VCMP 完整性检查和异常而丢弃的 VCMP 控制和数据包数。 全局 4.3.0
invalid_pkt_drop 由于校验和、TTL 和数据包大小无效而丢弃的数据包数。 全局 4.3.0
misc_drop 由于其他错误和异常而丢弃的数据包数。 全局 4.3.0
num_nsd_paths_up/down 网关中处于“启动”(UP)/“关闭”(DOWN) 状态的 NSD 隧道数。 全局 4.3.0
num_paths_INITIAL

处于“初始”(INITIAL) 状态的隧道数。

“初始”(INITIAL) 状态表示 Edge 刚刚向网关发起了隧道请求。

全局 4.3.0
IPv4、IPv6 4.5.0

num_paths_MEASURING_TX_BW

num_paths_MEASURING_RX_BW

发起隧道请求后,将在从 Edge 到网关的隧道进入“稳定”(STABLE) 状态之前测量其 tx 和 rx 带宽。将在相应计数器下跟踪测量了其 tx 和 rx 带宽的隧道的数量。 全局 4.3.0
IPv4、IPv6 4.5.0
num_paths_STABLE

处于“稳定”(STABLE) 状态的隧道数。

“稳定”(STABLE) 状态表示在 Edge 和网关之间建立了隧道,并且隧道保持稳定。

要确定稳定隧道的百分比,请将稳定的隧道数乘以 100,然后将该值除以隧道总数。

全局 4.3.0
IPv4、IPv6 4.5.0
num_paths_UNSTABLE

处于“不稳定”(UNSTABLE) 状态的隧道数。

如果丢失率、延迟和抖动值超过定义的阈值,隧道将进入“不稳定”(UNSTABLE) 状态。

要确定不稳定隧道的百分比,请将不稳定的隧道数乘以 100,然后将该值除以隧道总数。

全局 4.3.0
IPv4、IPv6 4.5.0
num_paths_QUIET 如果在定义的时间间隔内未在路径中收到任何数据包,则路径将变为“静默”(QUIET) 状态,并在此计数器中跟踪此类路径的数量。 全局 4.3.0
IPv4、IPv6 4.5.0
nat_cnt 每个企业的有效 NAT 条目数。 按企业 4.3.0
route_cnt 每个企业的网关中安装的路由条目数。 按企业 4.3.0
flow_cnt 每个企业的活动流量总数。 按企业 4.3.0
tx_packets 从网关传输的数据包数。 按企业, 4.3.0
按 Edge 隧道 5.0.1
非 SD-WAN 目标 4.5.0
tx_bytes 从网关传输的字节数。 按企业 4.3.0
按 Edge 隧道 5.0.1
非 SD-WAN 目标 4.5.0
tx_errors 由于数据包错误而在发送时丢弃的数据包数。 按非 SD-WAN 目标 5.1.0
rx_packets 网关接收的数据包数。 按企业 4.3.0
非 SD-WAN 目标 4.5.0
按 Edge 隧道 5.0.1
rx_bytes 网关接收的字节数。 按企业 4.3.0
非 SD-WAN 目标 4.5.0
按 Edge 隧道 5.0.1
rx_errors 由于数据包错误而在接收时丢弃的数据包数。 按非 SD-WAN 目标 5.1.0
vc_queue_<queue_name>_len 加入网关组件的容量中列出的每个切换队列的数据包数。 全局 4.3.0
vc_queue_<queue_name>_drop 网关组件的容量中列出的每个切换队列中丢弃的数据包数。 全局 4.3.0
vc_queue_<queue_name>_wmark 任意时间点在相应队列中加入队列的最大数据包数。 全局 4.5.1
vc_queue_<queue_name>_wmark_1min 过去一分钟内在相应队列中加入队列的最大数据包数。 全局 4.5.1
vc_queue_<queue_name>_wmark_5min 过去 5 分钟内在相应队列中加入队列的最大数据包数。 全局 4.5.1
dpdk_mbuf_pending 已处理并等待释放的缓冲区数。 全局 4.3.0
dpdk_mbuf_locked_fail 从锁定池检索缓冲区时 GET 缓冲区操作失败的次数。 全局 4.3.0
dpdk_mbuf_locked_free 锁定池中的可用缓冲区数。 全局 4.3.0
dpdk_mbuf_pool_free 可用缓冲区数。 全局 4.3.0
nombuf RX mbuf 分配失败总次数。 全局 4.3.0
mbuf_low 达到 mbuf_low 阈值的次数。 全局 4.3.0
net_sch.pkt_cnt Net Scheduler 使用的缓冲区数。 全局 4.3.0
link_sch.pkt_cnt 链路调度程序使用的缓冲区数。 全局 4.3.0
link_sch_cosq.pkt_cnt 链路 Cos 调度程序使用的缓冲区数。 全局 4.3.0
mp.rt_pkts_stored 用于 VCMP 重传存储的缓冲区数。 全局 4.3.0
mp.reseq_qlen 用于 VCMP 重新排序的缓冲区数。 全局 4.3.0
mp.jitter_pkt_bufs 用于 VCMP 抖动管理的缓冲区数。 全局 4.3.0
ipfrag.current_cnt 分配的用于存储分段数据包的缓冲区数。 全局 4.3.0
crypto_drop 由于加密失败而观察到的丢弃数据包数。 全局 4.3.0
frag_drop 由于碎片相关问题而丢弃的数据包数。 全局 4.3.0
link_drop 由于特定链路问题而观察到的丢弃数据包数。 全局 4.3.0
nat_over_capacity_drop 因为端口分配失败,NAT 由于超过容量而丢弃的数据包数。 全局 4.3.0
interface_over_capacity_drop 由于超过容量而在接口级别丢弃的数据包数。 全局 4.3.0
misc_over_capacity_drop 由于内部切换队列丢弃限制以及系统中数据包缓冲区不足而丢弃的数据包数。 全局 4.3.0
<tx/rx>_pktsize_0_63 在网关中传输/接收的大小为 0-63 字节的数据包数。 按接口 4.5.0
<tx/rx>_pktsize_64_127 在网关中传输/接收的大小为 64-127 字节的数据包数。 按接口 4.5.0
<tx/rx>_pktsize_128_255 在网关中传输/接收的大小为 128-255 字节的数据包数。 按接口 4.5.0
<tx/rx>_pktsize_256_511 在网关中传输/接收的大小为 256-511 字节的数据包数。 按接口 4.5.0
<tx/rx>_pktsize_512_1023 在网关中传输/接收的大小为 512-1023 字节的数据包数。 按接口 4.5.0
<tx/rx>_pktsize_1024_1499 在网关中传输/接收的大小为 1024-1499 字节的数据包数。 按接口 4.5.0
<tx/rx>_pktsize_1500 在网关中传输/接收的大小超过 1500 字节的数据包数。 按接口 4.5.0
over_capacity_status 指示 VMware SD-WAN 网关是否由于内部切换队列丢弃限制以及系统中数据包缓冲区不足而进入超过容量状态。 全局 5.1.0
auto_rate_limit_drop 由于自动限制速率以从超过容量状况中恢复网关,在网关上丢弃的数据包。 全局 5.2.0
red_factor 根据应用的 RED,在 VCMP 对等体上设置的速率限制因子。 按 Edge 隧道 5.2.0
capacity_metric_edge_count_value 连接到网关的 Edge 数。 全局 5.2.0
capacity_metric_edge_count_warning_threshold 根据 Edge 计数设置警告警示的建议阈值 (1500)。 全局 5.2.0
capacity_metric_edge_count_critical_threshold 根据 Edge 计数设置严重警示的建议阈值 (2000)。 全局 5.2.0
capacity_metric_tunnel_count_value 与网关关联的隧道数。 全局 5.2.0
capacity_metric_tunnel_count_warning_threshold 根据隧道计数设置警告警示的建议阈值 (2625)。 全局 5.2.0
capacity_metric_tunnel_count_critical_threshold 根据隧道计数设置严重警示的建议阈值 (3500)。 全局 5.2.0
capacity_metric_pki_enabled_tunnel_count_value 与网关关联的隧道(具有证书)数。 全局 5.2.0
capacity_metric_pki_enabled_tunnel_count_warning_threshold 根据具有证书的隧道计数设置警告警示的建议阈值 (1875)。 全局 5.2.0
capacity_metric_pki_enabled_tunnel_count_critical_threshold 根据具有证书的隧道计数设置严重警示的建议阈值 (2250)。 全局 5.2.0
capacity_metric_flow_count_value 网关中的流量数。 全局 5.2.0
capacity_metric_flow_count_warning_threshold 根据流量计数设置警告警示的建议阈值 (475410)。 全局 5.2.0
capacity_metric_flow_count_critical_threshold 根据流量计数设置严重警示的建议阈值 (713115)。 全局 5.2.0
capacity_metric_nat_count_value 网关中的 NAT 条目数。 全局 5.2.0
capacity_metric_nat_count_warning_threshold 根据 NAT 计数设置警告警示的建议阈值 (475410)。 全局 5.2.0
capacity_metric_nat_count_critical_threshold 根据 NAT 计数设置严重警示的建议阈值 (713115)。 全局 5.2.0
capacity_metric_pktq_wmark_value 网关中的数据包队列水印数。 全局 5.2.0
capacity_metric_pktq_wmark_warning_threshold 根据数据包队列水印计数设置警告警示的建议阈值 (2000)。 全局 5.2.0
capacity_metric_pktq_wmark_critical_threshold 根据数据包队列水印计数设置严重警示的建议阈值 (6000)。 全局 5.2.0
capacity_metric_pkt_drop_value 网关中丢弃的数据包数。 全局 5.2.0
capacity_metric_pkt_drop_warning_threshold 根据丢弃的数据包设置警告警示的建议阈值 (500)。 全局 5.2.0
capacity_metric_pkt_drop_critical_threshold 根据丢弃的数据包设置严重警示的建议阈值 (2000)。 全局 5.2.0