This site will be decommissioned on January 30th 2025. After that date content will be available at techdocs.broadcom.com.

VMware SASE 5.1.0 | 2023 年 12 月 18 日

  • VMware SASE™ Orchestrator 版本 R51010-20231215-GA

  • VMware SD-WAN™ 网关版本 R5103-20230621-GA

  • VMware SD-WAN™ Edge 版本 R5102-20230310-GA

请查看发行说明以了解新增内容及更新。

发行说明内容

本发行说明包含以下主题:

建议的用途

对于需要使用最初在 5.1.0 版本中提供的特性和功能的所有客户,建议使用该版本。

兼容性

5.1.0 版本 Orchestrator、网关和 Hub Edge 支持以前发行的所有 3.4.0 或更高版本的 VMware SD-WAN Edge。

已明确测试了以下 SD-WAN 互操作性组合:

Orchestrator

网关

Edge

Hub

分支

5.1.0 

5.1.0 

3.4.5 

3.4.5 

5.1.0 

5.1.0 

3.4.6 

3.4.6 

5.1.0 

5.1.0 

5.1.0 

3.4.5 

5.1.0 

5.1.0 

3.4.6 

5.1.0 

5.1.0 

4.2.2 

4.2.2 

4.2.2 

5.1.0 

5.1.0 

4.2.2 

4.2.2 

5.1.0 

5.1.0 

5.1.0 

4.2.2 

5.1.0 

5.1.0 

4.2.2 

5.1.0 

5.1.0 

4.3.0 

4.3.0 

4.3.0 

5.1.0 

5.1.0 

4.3.0 

4.3.0 

5.1.0 

5.1.0 

5.1.0 

4.3.0 

5.1.0 

5.1.0 

4.3.0 

5.1.0 

5.1.0 

4.3.1 

4.3.1 

4.3.1 

5.1.0 

5.1.0 

4.3.1 

4.3.1 

5.1.0 

5.1.0 

5.1.0 

4.3.1 

5.1.0 

5.1.0 

4.3.1 

5.1.0 

5.1.0 

4.5.0 

4.5.0 

4.5.0 

5.1.0 

5.1.0 

4.5.0 

4.5.0 

5.1.0 

5.1.0 

5.1.0 

4.5.0 

5.1.0 

5.1.0 

4.5.0 

5.1.0 

5.1.0 

4.5.1 

4.5.1 

4.5.1 

5.1.0 

5.1.0 

4.5.1 

4.5.1 

5.1.0 

5.1.0 

5.1.0 

4.5.1 

5.1.0 

5.1.0 

4.5.1 

5.1.0 

5.1.0 

5.0.1 

5.0.1 

5.0.1 

5.1.0 

5.1.0 

5.0.1 

5.0.1 

5.1.0 

5.1.0 

5.1.0 

5.0.1 

5.1.0 

5.1.0 

5.0.1 

5.1.0 

注:

上表仅对使用 SD-WAN 服务的客户完全适用。需要访问 VMware Cloud Web Security 或 VMware Secure Access 的客户需要将其 Edge 升级到 4.5.0 或更高版本。

小心:

VMware SD-WAN 版本 3.2.x、3.3.x 和 3.4.x 已终止支持。

  • 版本 3.2.x 和 3.3.x 已于 2021 年 12 月 15 日终止常规支持 (EOGS),并于 2022 年 3 月 15 日终止了技术指导 (EOTG)。

  • Orchestrator 和网关版本 3.4.x 已于 2022 年 3 月 30 日终止常规支持 (EOGS),并于 2022 年 9 月 30 日终止了技术指导 (EOTG)。

  • Edge 版本 3.4.x 已于 2022 年 12 月 31 日终止支持 (EOGS),并于 2023 年 3 月 31 日终止了技术指导 (EOTG)。

  • 有关详细信息,请参阅知识库文章:公告:VMware SD-WAN 3.x 版本的支持期终止 (84151)

重要事项:

VMware SD-WAN 版本 4.0.x 已终止支持;版本 4.2.x 和 4.3.x 已终止对网关和 Orchestrator 的支持;版本 4.5.x 即将终止对网关和 Orchestrator 的支持。

  • 版本 4.0.x 于 2022 年 9 月 30 日终止常规支持 (EOGS),并于 2022 年 12 月 31 日终止技术指导 (EOTG)。 

  • 4.2.x 版本的 Orchestrator 和网关已于 2022 年 12 月 30 日终止常规支持 (EOGS),并于 2023 年 3 月 30 日终止技术指导 (EOTG)。

  • 4.2.x 版本的 Edge 于 2023 年 6 月 30 日终止常规支持 (EOGS),并于 2025 年 9 月 30 日终止技术指导 (EOTG)。

  • 4.3.x 版本的 Orchestrator 和网关已于 2023 年 6 月 30 日终止常规支持 (EOGS),并于 2023 年 9 月 30 日终止技术指导 (EOTG)。

  • 4.3.x 版本的 Edge 于 2023 年 6 月 30 日终止常规支持 (EOGS),并于 2025 年 9 月 30 日终止技术指导 (EOTG)。

  • 4.5.x 版本的 Orchestrator 和网关已于 2023 年 9 月 30 日终止常规支持 (EOGS),并将于 2023 年 12 月 31 日终止技术指导 (EOTG)。

  • 有关详细信息,请参阅知识库文章:公告:VMware SD-WAN 4.x 版本的支持期终止 (88319)

注:

3.x 版本无法正确支持 AES-256-GCM,这意味着,使用 AES-256 的客户始终要在停用 GCM 的情况下应用 Edge (AES-256-CBC)。如果客户使用的是 AES-256,他们必须先从 Orchestrator 中明确停用 GCM,然后再将其 Edge 升级到 4.x 或 5.x 版本。在所有 Edge 运行 4.x/5.x 版本后,客户可以在 AES-256-GCM 和 AES-256-CBC 之间进行选择。

Orchestrator、网关和 Edge 的升级途径

对于想要将 Orchestrator、网关或 Edge 从较低版本升级到 5.1.0 版本的客户,下面列出了相应的途径。

Orchestrator

使用 4.0.0 或更高版本的 Orchestrator 可以直接升级到 5.1.0。 

网关

所有网关类型均完全支持将使用 4.0.0 或更高版本的网关升级到 5.1.0 版本。

重要事项:

部署使用 5.1.0 的新网关时,VMware ESXi 实例必须至少为版本 6.7 Update 3 至版本 7.0。在尝试运行 5.1.0 或更高版本时,使用较低版本的 ESXi 实例将会导致网关的数据平面服务发生故障。

重要事项:

在将网关升级到 5.1.0 之前,必须将 ESXi 实例至少升级到版本 6.7 Update 3 至版本 7.0。在尝试运行 5.1.0 或更高版本时,使用较低版本的 ESXi 实例将会导致网关的数据平面服务发生故障。

Edge

Edge 可以直接从任何版本 3.x 或更高版本升级到版本 5.1.0。

SD-WAN 新增功能

Hub 或集群互连

多个 Hub Edge 或 Hub 集群首次可以通过覆盖网络而不是底层网络互连,并扩大可以相互通信的分支 Edge 的范围。Hub 现在可以彼此共享路由,从而允许连接到一个 Hub Edge 或 Hub 集群的分支 Edge 通过覆盖网络与连接到另一个 Hub Edge 或 Hub 集群的分支 Edge 进行通信。多 Hub 部署中的分支 Edge 现在可以利用动态多路径优化 (DMPO) 提高流量质量,同时提供网络中所有流量的完整端到端可见性。Hub 或集群互连增强了客户多 Hub Edge 或 Hub 集群网络中的可扩展性、可靠性和可用性。

重要事项:

启用 Hub 或集群互连会从根本上更改 VMware SD-WAN 路由协议,其中,该功能允许数据包遍历网络中的多个跃点。虽然已在代表性拓扑中对此更改进行了测试,但无法测试在进行此类允许分发远程路由的更改时可能遇到的所有路由方案。因此,VMware 将该功能作为抢先使用版本发布,并将密切监控启用了该功能的部署中的意外路由行为。

新的 Orchestrator 用户界面

Orchestrator 版本 5.1.0 完整实现了在版本 4.0.0 中首次引入的新用户界面。新 UI 提高了可用性,并在所有 VMware SASE 服务中具有统一外观。此外,新 UI 还添加了集成式产品内帮助,以将用户指向可协助使用 SD-WAN 服务的相关文档和其他资料。

新 UI 是 5.1.0 版本 Orchestrator 上的默认界面,用户在使用 SD-WAN 时仍然可以选择切换到经典 Orchestrator UI。

注:

经典用户界面将在 VMware SASE Orchestrator 的下一个次要版本中被弃用。强烈建议客户使用并熟悉新 Orchestrator UI。

流量可见性

在以前的版本中,Orchestrator UI 仅从应用程序 (Application)源 (Source)目标 (Destination) 角度分别显示汇总的流量信息和统计信息,而不会将所有这些信息组合在一个屏幕上以提供一个单独的端到端视图。因此,由于缺少每个流量的详细可见性,监控、故障排除和报告受到阻碍。

在版本 5.1.0 中,新 Orchestrator UI 包含一个“流量”(Flows) 选项卡,用于显示每个流量的合并数据。Orchestrator UI 在单个视图中显示每个流量的关键参数。此外,通过流量可见性功能,客户还可以查看历史流量数据、基于匹配的参数筛选数据以及下载端到端流量统计信息。

本地 DNS 条目

版本 5.1.0 支持 Edge 上的本地 DNS 条目,以将流量指向特定域。配置本地 DNS 后,Edge 会先查找本地主机文件,然后再尝试使用 DNS 服务器解析域。

Orchestrator、网关和 Edge 的开机自检 (POST)

版本 5.1.0 通过开机自检 (POST) 改进了设备强化和可见性。POST 是由在设备打开电源或重新引导后立即自动调用的软件例程执行的一个过程。POST 过程包括:

  • 软件完整性验证。

  • 加密模块算法已知答案测试验证。

  • 熵(噪声)源测试。

  • POST 结果显示为:通过/失败。只有在 POST 通过后,系统才会继续启动其余应用程序。如果 POST 失败,系统将显示错误消息以指示测试失败的位置,并且系统引导序列会停止。

对于 Orchestrator 和网关,该功能仅在绿地部署中可用。默认情况下,Edge 未激活该功能,用户需要通过 Orchestrator UI 将其激活。

SD-WAN 的新增强功能

高可用性 (HA) 本地路由同步和 BGP 平滑重启

对于部署在高可用性拓扑中并且还使用 BGP 或 OSPF 的站点,在备用 Edge 同步路由时,HA 故障切换可能会较慢,并因数据包丢失率较高导致客户流量中断。为确保 HA 故障切换更快、破坏性更低,VMware 引入了两项增强功能:HA 本地路由同步BGP 平滑重启

HA 本地路由同步功能可自动在活动和备用 Edge 之间同步路由,并使用这些路由在活动 Edge 上进行转发,同时还可确保路由表在 HA 故障切换后立即可用。

BGP 平滑重启功能通过让相邻 BGP 设备参与重新启动来确保重新启动期间网络中不会发生路由更改,从而确保可更快完成 Edge 重新启动和 HA 故障切换。如果没有“BGP 平滑重启”功能,在 BGP 对等体之间的 TCP 会话终止后,对等 Edge 会删除所有路由,因此需要在 Edge 重新启动或 HA 故障切换后重新构建这些路由。“BGP 平滑重启”功能更改了此行为,因为当在可配置的重新启动定时器内建立新会话时,该功能可确保对等 Edge 不会删除路由。

重要事项:

为获得最佳性能,还应在客户企业中激活动态成本计算 (DCC)。激活 DCC 后,首选项和通告决策将在 Edge 本地生效,而且在 Edge 从路由过程中学习路由后,即会将这些路由从活动设备同步到备用设备。有关 DCC 的详细信息,请参见 VMware SD-WAN 路由概述配置分布式成本计算

注:

“HA 本地路由同步”功能目前仅适用于使用 BGP 的企业。将在未来版本中提供使用 OSPF 的“HA 本地路由同步”功能。

交换接口上的 RADIUS 身份验证

客户可以在交换端口上进行使用 802.1x 协议的 RADIUS 身份验证,而以前仅限于在路由端口上使用。交换端口 RADIUS 身份验证通过与该端口关联的 VLAN 来配置。对于没有其他路由器可用于扩展本地访问,但需要通过 802.1x 进行安全设备身份验证的客户站点,该增强功能十分有益。

MAC 地址绕过 (MAB)

在路由接口上,客户现在可以根据 RADIUS 服务器上的列表检查 MAC 地址,以绕过不支持 802.1x 身份验证的 LAN 设备的 802.1x。MAB 不再要求客户手动配置可能需要身份验证的每个 MAC 地址,从而简化了 IT 运营、节省了时间并增强了可扩展性。

重要事项:

基于 RADIUS 的 MAB 不受 VLAN 支持,因此不能用于交换端口。仅路由接口支持基于 RADIUS 的 MAB。

导致 Edge 重新启动的配置更改

以前触发 Edge 服务重新启动的一些 Edge 配置更改在版本 5.1.0 中不再触发。特别是,频繁使用的 Edge 接口配置更改(如修改交换接口上的 Edge LAN IP 地址或者修改 CIDR IP、CIDR 前缀或固定 IP)不会再导致 Edge 重新启动中断。要查看完整列表,请查阅知识库文章可触发 Edge 服务重新启动的 VMware SD-WAN Edge 配置更改 (60247)

SNMP

版本 5.1.0 在 SNMP 中添加了以下增强功能:

  • SNMPv2,支持其他社区字符串和 64 位计数器。

  • SNMPv3,支持 SHA2、其他用户名和密码,以及单独的身份验证和私钥。

  • MIB 添加了以下遥测:

    • 链路 UUID 到接口名称的映射。

    • 链路带宽/容量。

    • 链路吞吐量。

Edge 2000、3800 和 3810 流量容量增加

在使用 5.1.0 版本 Edge 软件时,Edge 型号 2000、3800 和 3810 均会将其流量容量的最大值从 1.9M 流量增加到 3.8M 流量。

注:

Edge 型号 3400 不受此更改的影响,该型号的流量容量最大值仍为 1.9M 流量。

网关上的数据包捕获 (PCAP)

用户可以通过 Orchestrator UI 在网关上启动 PCAP。可以通过定义简单或复杂筛选器的选项来捕获最长 120 秒的网关流量,以确保用户仅捕获所需的内容。用户可按以下方式访问此功能:

  • 合作伙伴管理员只能在自己的合作伙伴网关上启动 PCAP。

  • 操作员可以在合作伙伴网关和托管网关上启动 PCAP。

外部证书颁发机构 (CA)

在外部 CA 功能中添加了两种新的 API 就绪模式:

  • 手动模式,支持任何证书颁发机构,并通过用户手动执行证书过程中的每个步骤,提供灵活性和控制。

  • 异步模式,支持任何证书颁发机构,能够编写手动步骤的脚本并自动执行周期性任务。

非 SD-WAN 目标 (NSD) 和云安全服务 (CSS) 隧道

在以前的 SD-WAN 版本中,只有在流量通过 NSD 或 CSS 时,才会建立 NSD 或 CSS 的隧道,并且只要有流量通过 NSD 或 CSS,隧道就会持续存在。如果一段时间内没有流量,隧道将被拆除,则下次向任一方向发送流量时必须重建隧道,这会导致该流量在重新建立隧道时出现延迟。从版本 5.1.0 开始,将在最初配置任一服务时触发并建立所有 NSD 和 CSS 隧道,并且不管在任何时间段内是否有流量通过都会保留该隧道,从而改善了各个服务的用户体验。

重要说明

附加到 BGP 前缀的 BGP 扩展社区字符串

集群内部的 BGP 路由会自动使用一个内部 BGP 社区进行标记,该社区将由每个 Edge 附加到现有的 BGP 社区。此额外的社区字符串将跃点计数的 1 个字节和派生自 Edge 逻辑 ID 的 3 个字节组合在一起。因此,在分支/Hub LAN 端使用 BGP 对等连接的客户不应使用新的 BGP 社区字符串筛选由 Edge 通告的 BGP 前缀。

非 SD-WAN 目标的不活动对等体超时 (DPD)

版本 5.1.0 对非 SD-WAN 目标的不活动对等体超时 (DPD) 进行了重大更改。在以前的版本中,DPD 的默认值为 20 秒,用户可以通过将 DPD 超时定时器配置为 0 秒来停用 DPD。VMware SD-WAN 移至 QuickSec IPsec 工具包后,DPD 将进行如下更改:

  • 探测间隔:指数(0.5 秒、1 秒、2 秒、4 秒、8 秒、16 秒)。

  • 默认最小 DPD 间隔:47.5 秒(QuickSec 在上次重试后等待 16 秒。因此,0.5+1+2+4+8+16+16 = 47.5)。

  • 默认最小 DPD 间隔 + DPD 超时(秒):67.5 秒。

由于上述更改,用户无法通过将 DPD 超时定时器配置为 0 秒来停用 DPD。DPD 超时值(以秒为单位)会添加到默认最小值 47.5 秒。因此,即使用户将 DPD 配置为 0 秒,DPD 实际上也是 47.5 秒。

必须在经典 Orchestrator 上配置的功能

在版本 5.1.0 中,VMware 将新用户界面设置为 Orchestrator 的默认界面,以使用户清晰了解可以在其中执行的所有监控和配置任务。但是,一些功能并未完全集成到新 UI 中:

  • Secure Access - Edge 和配置文件设置

  • Zscaler - Edge 和配置文件设置

  • TACACS - Edge 设置和“网络服务”(Network Services) 页面

  • 合作伙伴设置 -“合作伙伴”(Partner) 页面

要配置上述功能,客户可以选择 Orchestrator 屏幕顶部的打开经典 Orchestrator (Open Classic Orchestrator) 选项,该选项将在新的浏览器标签页中打开经典 UI。


在以后的 Orchestrator 软件版本中,这些功能将完全集成到新用户界面中。

不支持在高可用性模式中混合使用支持 Wi-Fi 的 Edge 和不支持 Wi-Fi 的 Edge 

从 2021 年开始,VMware SD-WAN 引入了不包含 Wi-Fi 模块的 Edge 型号:Edge 型号 510N、610N、620N、640N 和 680N。虽然除了不包含 Wi-Fi 模块之外,这些型号在其他方面均与支持 Wi-Fi 的对应型号相同,但是不支持将同一型号支持 Wi-Fi 的 Edge 和不支持 Wi-Fi 的 Edge(例如,Edge 640 和 Edge 640N)部署为高可用性对。客户应确保部署为高可用性对的 Edge 属于同一类型:均支持 Wi-Fi 或均不支持 Wi-Fi。

用于 AS 路径前置的 BGPv4 筛选器配置的分隔符更改

在版本 3.x 中,用于 AS 路径前置的 VMware SD-WAN BGPv4 筛选器配置支持基于逗号和空格的分隔符。但是,从版本 4.0.0 开始,VMware SD-WAN 在 AS 路径前置配置中仅支持基于空格的分隔符。从 3.x 升级到 4.x 或 5.x 的客户需要在升级之前对其 AS 路径前置配置进行编辑以“将逗号替换为空格”,从而避免选择错误的 BGP 最佳路由。

Edge 3x00 型号的升级时间延长

如果 Edge 直接从版本 4.0.0、4.0.1 或 4.2.0 进行升级,则在 Edge 3x00 型号(即 3400、3800 和 3810)上,升级到此版本所需的时间将比正常时间(3-5 分钟)长。这是由于为解决问题 53676 而进行的固件升级所致。如果使用任何其他 Edge 版本将 Edge 3400 或 3800 升级到版本 5.1.0,Edge 将按预期升级。有关详细信息,请查阅相应发行说明中的修复的问题 53676

Edge 和网关上的“IPSec 上的 BGP”和 Azure 虚拟 WAN 自动化的限制

Edge 和网关上的“IPSec 上的 BGP”功能与 Edge 或网关中的 Azure 虚拟 WAN 自动化不兼容。在自动从 Edge 或网关连接到 Azure vWAN 时,仅支持静态路由。

在 VMware SD-WAN Edge 型号 520、540、620、640、680、3400、3800 和 3810 上停用自动协商时的限制

在 VMware SD-WAN Edge 型号 620、640 或 680 的端口 GE1 - GE4 上,Edge 3400、3800 或 3810 的端口 GE3 或 GE4 上,或者 Edge 520/540 的端口 SFP1 或 SFP2 使用了具有铜缆接口的 SFP 时,如果用户停用自动协商机制以强制指定速度和双工模式,则可能会发现即使重新引导后,链路也不会建立连接。

这是由于列出的每个 Edge 型号使用 Intel 以太网控制器 i350 所致,该控制器存在一个限制,即当链路两端均未使用自动协商时,它无法动态检测用于进行传输和接收的相应线路(自动 MDIX)。如果连接的两端在同一线路上进行传输和接收,则检测不到该链路。如果对等端也不支持未使用自动协商的自动 MDIX,并且链路不是使用直连电缆连接,则需要使用交叉以太网电缆来连接链路。

有关详细信息,请参阅知识库文章在 VMware SD-WAN Edge 型号 520、540、620、640、680、3400、3800 和 3810 上停用自动协商时的限制 (87208)

可用语言

VMware SASE Orchestrator 5.1.0 包括以下语言版本:捷克语、英语、欧洲葡萄牙语、法语、德语、希腊语、意大利语、西班牙语、日语、韩语、简体中文和繁体中文。

Orchestrator API 更改

自 5.0.0 以来所做的 Orchestrator API 更改

对 VMware SASE Orchestrator 门户 API(“API v1”)所做的更改

可从 developer.vmware.com 下载完整的 API 更改日志(请参阅“VMware SD-WAN Orchestrator API v1”)。

我们预计以下更改可能需要开发人员执行相应的操作:

  • 问题 66795:该修复引入了一种机制,通过这种机制,只有当非本机用户处于已启用状态并且 SSO 用户在其各自的身份提供程序中处于活动状态时,API 令牌才有效并被 Orchestrator 接受。如果非本机用户变为不活动状态(换言之,在 IdP 中被删除或不具备有效的刷新令牌),则将通过后端作业吊销该用户的所有 API 令牌。

注:
  • 在进行该修复之前,代表启用了 SSO 的用户颁发的令牌受旧版行为的约束,即 Orchestrator 将继续使用这些令牌,直到令牌过期。

  • 不支持刷新令牌或侦测端点的身份提供程序中的 SSO 用户将不允许使用基于令牌的身份验证功能。 

  • 问题 87878vcoInventory/getPendingInventory 更改了响应负载。移除了字段 token、vcoInstanceLogicalId、vcoUrl、edgeMappingId、enterpriseId、enterpriseProxyId、uuid、mac、imei、owner。这些字段不会在前端使用;由于这些字段未在 UI 上使用,因此这不会影响 UI。此 API 旨在用于获取 ZTP 可用 Edge 的列表,并且 Edge 分配不需要这些字段(仅 serialNumber 是必需字段)。因此,如果客户将此 API 用于 ZTP,并且他们在某个位置执行严格的负载验证,这可能会对其产生影响(具体取决于其实施)。通常,返回的信息足以成功传输 ZTP 流。

  • 问题 84303:添加了对 BGP 邻居 maxHop 属性的验证,以便在存在邻居 localIP 时,不允许配置小于 2 的 maxHop 值。以前,无论是否存在邻居 localIP,都允许将 maxHop 值配置为 1。现在,根据所做的更改,当存在邻居 localIP 时,允许的最大跳数最小值为 2;如果用户尝试配置小于 2 的 maxHop 值,他们会收到一条错误,指出“邻居的 MaxHop 无效。当存在 localIp 时,MaxHop 值的范围是 2 到 255”(Invalid MaxHop for Neighbor. MaxHop value ranges from 2 to 255 when localIp is present.)。我们正在编写修补程序来处理现有配置。

  • 问题 84114:将客户端设备从 MySQL 迁移到 ClickHouse 会消除 clientDeviceId 字段。由于我们未使用 clientDeviceId 字段标识外部客户端,因此所造成的影响应该可以忽略不计。将客户端设备端点与 clientDeviceId 一起使用的唯一客户端似乎为经典 Orchestrator UI。UI 已得到增强,可使用 logicalIdipAddressmacAddress 组合更新或获取 ClickHouse 中的记录。使用客户端设备端点更新主机名或按 ID 获取特定设备时,外部客户端应遵循此做法。

对 VMware SASE Orchestrator API v2 所做的更改

  • 问题 98750:Edge 相关 API 返回的 Edge 记录中的 lastContact 字段已弃用,不应再使用。响应中的 edgeState 字段而是应该用于确定作为单一数据源的 Edge 实际状态。如果任何客户端代码曾经使用 lastContact,且无法将其替换为 edgeState,API v1 仍会在响应中提供准确的 lastContact,这可以作为一种权宜之计,但不建议使用。

  • 问题 30901:在版本 5.1.0 中引入流量可见性功能后,flowstats 不再需要必需的 groupBy 子句。如果未提及 groupBy 子句,则默认情况下,我们认为 API 端点正在查询或调用流量可见性 API 端点,该端点进而会解析应用程序、客户端设备等所有解析器。但是,这仅适用于流量统计信息衡量指标 API 调用,而流量统计信息系列 API 仍然保持不变,没有进行任何修改。

  • 问题 95089:APIv2 速率限制模块一直未执行门户 API 速率限制器执行的相同默认策略,这是我们有意为之。此版本做出了相应更改,以对 APIv2 执行该策略。我们建议用户查阅关于如何避免触发速率限制器以及如何在触发速率限制后处理响应的最佳做法。

开发人员文档说明

以前,VMware SASE/SD-WAN API 文档托管在 VMware {code} 上,网址为 code.vmware.com。最近,VMware {code} 迁移到新域 developer.vmware.com。迁移后,某些指向以前托管在 code.vmware.com 上的特定页面的永久链接可能无法按预期正常使用。

为了配合此迁移,VMware 将继续使用开发人员文档门户,网址为 https://developer.vmware.com/apis,所有 VMware SASE/SD-WAN API 文档现在都位于该门户中。

文档修订历史

2023 年 12 月 18 日。第二十四版。

  • 在“解决的 Orchestrator 问题”部分中添加了新的 Orchestrator 汇总内部版本 R51010-20231215-GA。这是第十个 Orchestrator 汇总内部版本,也是 5.1.0 版本的新默认 Orchestrator GA 内部版本。

  • Orchestrator 内部版本 R51010-20231215-GA 修复了问题 117941125006128310129239131789,这些问题均已记录在该部分中。

2023 年 10 月 9 日。第二十三版。

  • 在“解决的 Orchestrator 问题”部分中添加了新的 Orchestrator 汇总内部版本 R5109-20231003-GA。这是第九个 Orchestrator 汇总内部版本,也是 5.1.0 版本的新默认 Orchestrator GA 内部版本。

  • Orchestrator 内部版本 R5109-20231003-GA 修复了问题 119938128310,这两个问题均已记录在该部分中。

  • 在“Edge/网关已知问题”部分中添加了未解决的问题 105933

2023 年 9 月 20 日。第二十二版。

  • 在“解决的 Orchestrator 问题”部分中添加了新的 Orchestrator 汇总内部版本 R5108-20230916-GA。这是第八个 Orchestrator 汇总内部版本,也是 5.1.0 版本的新默认 Orchestrator GA 内部版本。

  • Orchestrator 内部版本 R5108-20230916-GA 修复了问题 94610104775105580106191115981116531117822118728121085121441121469124778,这些问题均已记录在该部分中。

  • 将未解决的问题 62701Edge 网关已知问题移到了原始 GA 内部版本 R5100-20221204-GA解决的 Edge/网关问题部分。应在这些发行说明的第 1 版中执行此操作。

  • 在“Edge 和网关已知问题”部分中添加了未解决的问题 115136117037

  • 文档修订历史进行了重新组织,可按最新条目到最旧条目的顺序阅读,从而改善了用户体验。

2023 年 8 月 22 日。第二十一版。

2023 年 8 月 3 日。第二十版。

2023 年 7 月 26 日。第十九版。

  • 在“解决的 Edge/网关问题”部分中为第二个 Edge 汇总内部版本 R5102-20230310-GA 添加了修复的问题 103708。第十版 5.0.1 发行说明中遗漏了此问题。

2023 年 7 月 23 日。第十八版。

  • 在“解决的 Orchestrator 问题”部分中添加了新的 Orchestrator 汇总内部版本 R5107-20230722-GA。这是第七个 Orchestrator 汇总内部版本,也是 5.1.0 版本的新默认 Orchestrator GA 内部版本。

  • Orchestrator 内部版本 R5107-20230722-GA 修复了问题 122271,该问题已记录在该部分中。

  • Edge/网关已知问题部分中移除了未解决的问题 53359,因为在 4.3.0 中修复了该问题。

  • Edge 和网关已知问题部分中添加了未解决的问题 103708117775

2023 年 7 月 15 日。第十七版。

2023 年 7 月 6 日。第十六版。

  • 在“解决的 Orchestrator 问题”部分中添加了新的 Orchestrator 汇总内部版本 R5106-20230705-GA。这是第六个 Orchestrator 汇总内部版本,也是 5.1.0 版本的新默认 Orchestrator GA 内部版本。

  • Orchestrator 内部版本 R5106-20230705-GA 修复了问题 84772115411115433116633117772117988117993118074118544118733119733120606,这些问题已记录在该部分中。

  • 在“解决的 Edge/网关问题”部分中为原始内部版本 R5100-20221204-GA 添加了修复的问题 95565。原始 5.1.0 发行说明中错误地忽略了此问题。

  • Edge/网关已知问题部分中添加了未解决的问题 107994

  • Orchestrator 已知问题部分中添加了未解决的问题 112826

2023 年 6 月 23 日。第十五版。

  • 在“解决的 Edge/网关问题”部分中添加了新的网关汇总内部版本 R5103-20230621-GA。这是第三个网关汇总内部版本,也是 5.1.0 版本的新网关 GA 内部版本。

  • 网关内部版本 R5103-20230621-GA 修复了问题 82808100172101536104619107309108473111646111888111924112016112017112019112020112800114052114084114282114932115604115692116182,这些问题已记录在该部分中。

  • Edge/网关已知问题部分中添加了未解决的问题 115148119033

2023 年 6 月 13 日。第十四版。

  • 在“解决的 Orchestrator 问题”部分中添加了新的 Orchestrator 汇总内部版本 R5105-20230611-GA。这是第五个 Orchestrator 汇总内部版本,也是版本 5.1.0 的新 Orchestrator GA 内部版本。

  • Orchestrator 内部版本 R5105-20230611-GA 修复了问题 87089105861106295107180107766110826111957112044112333112451112500112605112809112906112912112992113209113254113366113375113963114240114291114564114602114912115307115439115624115653115719116141116523116770116790116976117527117800118071

  • Edge/网关已知问题部分中添加了以下未解决的问题:82808107309111924112016112017112019114084114282115692116182。以上所有问题都会影响 VMware SD-WAN 网关。

2023 年 5 月 11 日。第十三版。

  • Edge/网关已知问题部分中添加了以下未解决的问题:108473111646111888112020112800114052114932。以上所有问题都会影响 VMware SD-WAN 网关。

2023 年 4 月 27 日。第十二版。

  • 在“解决的 Orchestrator 问题”部分中添加了新的 Orchestrator 汇总内部版本 R5104-20230426-GA。这是版本 5.1.0 的第四个 Orchestrator 汇总内部版本。

  • Orchestrator 内部版本 R5104-20230426-GA 修复了问题 95631104785106327、106929107071107349107980108072108363109284109300109532109533109715109788109836109911110094110330110946111104111407111444111665111934111944111946112094112201112224112437112458112885114475。所有问题均已记录在该部分中。

  • 修复的两个请求单(106907106929)最初在 Orchestrator 版本 5.1.0.2 中标记为“已修复”。但是,这些修复在 5.1.0.2 中并不完整,仅在 Orchestrator 版本 5.1.0.4 中才得到完全解决。因此,这些请求单已从 Orchestrator 版本 5.1.0.2“解决的问题”部分中移除,并移到 5.1.0.4 中。

  • 在“解决的 Edge/网关问题”部分中为原始内部版本 R5100-20221204-GA 添加了 94612。原始 5.1.0 发行说明中错误地忽略了此问题。

  • 更新了兼容性部分,将所有 3.x 版本标记为有效期限已结束 (EOSL)。此外,还更新了 4.x 部分,将 4.2.x Orchestrator 和网关标记为有效期限已结束 (EOSL)。

  • 添加了标题为附加到 BGP 前缀的 BGP 扩展社区字符串重要说明,请查看该说明以了解更多详细信息。

2023 年 3 月 15 日。第十一版。

  • 在“解决的 Orchestrator 问题”部分中添加了新的 Orchestrator 汇总内部版本 R5103-20230315-GA。这是版本 5.1.0 的第三个 Orchestrator 汇总内部版本。

  • Orchestrator 内部版本 R5103-20230315-GA 修复了问题 107587107725108533、108833109064。所有问题均已记录在该部分中。R5104-202304xx-GA

2023 年 3 月 14 日。第十版。

  • 在“解决的 Edge/网关问题”部分中添加了新的 Edge 和网关汇总内部版本 R5102-20230310-GA。这是第二个 Edge/网关汇总内部版本,也是版本 5.1.0 的新 Edge 和网关 GA 内部版本。

  • Edge 和网关内部版本 R5102-20230310-GA 修复了问题 98782104141105744106587,这些问题均已记录在该部分中。

2023 年 3 月 6 日。第九版。

  • SD-WAN 的新增强功能部分中,修订了 Edge 3x00 流量容量增加条目。最初的条目排除了 2000,并错误地包括 Edge 3400。修订后的条目现在显示为:

    • Edge 2000、3800 和 3810 流量容量增加

    • 在使用 5.1.0 版本 Edge 软件时,Edge 型号 2000、3800 和 3810 均会将其流量容量的最大值从 1.9M 流量增加到 3.8M 流量。

    • 添加了一条说明,以明确指出 Edge 型号 3400 不受此更改的影响,该型号的流量容量最大值仍为 1.9M 流量。

2023 年 2 月 28 日。第八版。

  • 将 Orchestrator 汇总内部版本 R5102-20230216-GA 替换为 R5102-20230222-GA。新的 Orchestrator 内部版本更正了 VMware 运维团队在将 Orchestrator 升级到内部版本 R5102-20230216-GA 时发现的升级问题。该升级问题是由升级软件包清单中的版本不匹配所致。

  • 新的内部版本还修复了以下问题:106907108074108309

2023 年 2 月 17 日。第七版。

  • 在“解决的 Orchestrator 问题”部分中添加了新的 Orchestrator 汇总内部版本 R5102-20230216-GA。这是版本 5.1.0 的第二个 Orchestrator 汇总内部版本。

  • Orchestrator 内部版本 R5102-20230216-GA 修复了问题 40584105610106159106242106592、106806、106929、107410、107637107885。所有问题均已记录在该部分中。

  • 在“解决的 Edge/网关问题”部分中为原始内部版本 R5100-20221204-GA 添加了 89725。原始 5.1.0 发行说明中错误地忽略了此问题。

  • 从“Edge/网关已知问题”部分中移除了问题 39659,因为此请求单与另一个请求单 39501 重复,而后者已在版本 4.3.0 中解决。

2023 年 1 月 29 日。第六版。

  • 兼容性部分中,修订了有关终止支持 4.2.x 的“重要说明”,并添加了版本 4.3.x,以反映 SD-WAN Edge 软件的新修订日期。

  • 新的 SD-WAN 增强功能部分中,添加了非 SD-WAN 目标 (NSD) 和云安全服务 (CSS) 隧道增强功能。第一版发行说明中错误地忽略了此内容。

  • 重要说明部分中,添加了有关非 SD-WAN 目标的不活动对等体超时 (DPD) 的说明。本说明介绍了由于 VMware SD-WAN 软件更改到 Qcksec IPsec 工具包而导致 DPD 行为的变化。第一版发行说明中错误地忽略了此内容。

2023 年 1 月 20 日。第五版。

  • 在“解决的 Edge/网关问题”部分中添加了新的网关汇总内部版本 R5101-20230112-GA。这是第一个网关汇总内部版本,也是版本 5.1.0 的新网关 GA 内部版本。

  • 网关内部版本 R5101-20230112-GA 修复了问题 97272104487,这两个问题均已记录在该部分中。

  • 修改了增强功能 MAC 地址绕过 (MAB) 的语言,明确表示 VLAN 不支持此功能,因此不能用于依赖 VLAN 进行 802.1x 身份验证的交换端口。因此,从此版本 5.1.0 起,仅在路由接口上支持 MAB。

2023 年 1 月 12 日。第四版。

  • 添加了关于以下两项 5.1.0 增强功能的内容:HA 本地路由同步BGP 平滑重启

2023 年 1 月 5 日。第三版。

  • 在“解决的 Orchestrator 问题”部分中添加了新的 Orchestrator 汇总内部版本 R5101-20221220-GA。这是版本 5.1.0 的第一个 Orchestrator 汇总内部版本。

  • Orchestrator 内部版本 R5101-20221220-GA 修复了问题 100133101835102806103622,这些问题均已记录在该部分中。

2022 年 12 月 15 日。第二版。

  • 从“Edge/网关已知问题”中移除了未解决的问题 39134,因为工程部门得出的结论是该问题已修复,并且针对该问题的请求单已被错误添加到第一版 5.1.0 发行说明中的“解决的 Edge/网关问题”部分。

2022 年 12 月 8 日。第一版。

解决的 Edge/网关问题

网关版本 R5103-20230621-GA 中解决的问题

网关内部版本 R5103-20230621-GA 在 2023 年 6 月 23 日发布,它是 5.1.0 版本的第 3 个网关汇总内部版本。

该网关汇总内部版本解决了自第 2 个网关汇总内部版本 R5102-20230310-GA 以来存在的以下严重问题。

  • 修复的问题 82808:对于使用云安全服务 (CSS) 并启用了 L7 运行状况检查的 VMware SD-WAN Edge,即使 VMware SASE Orchestrator 继续将隧道标记为“已启动”(UP),客户也可能会观察到使用这些 CSS 隧道的流量出现故障。

    即使 L7 探测失败并显示 4XX HTTP 错误,VMware SD-WAN 网关也不会确认失败,而且也不会通知 Orchestrator 将 CSS 隧道标记为“关闭”(DOWN)。

  • 修复的问题 100172:如果用户尝试使用 SSH 通过 VMware SD-WAN 网关访问 Edge,网关可能会发生数据平面服务故障并生成核心文件,然后重新启动以进行恢复。

    如果用户尝试使用 SSH 通过网关访问 Edge,并且该 SSH 会话生成 FRAG_NEEDED ICMP 错误消息,则网关可能会遇到该问题。

  • 修复的问题 101536:VMware SD-WAN 网关可能会发生数据平面服务故障,生成核心文件并重新启动以进行恢复。

    在查看核心文件时,用户将发现与网关的互斥监控器相关的日志记录;在连接到该网关的客户企业使用 Hub 和集群互连时,可能会出现该问题。

  • 修复的问题 104619:当两个或更多企业共享同一个合作伙伴网关,并且所有企业都具有使用 IPv4 的合作伙伴切换配置时,如果移除一个企业中的合作伙伴切换,则为连接到该合作伙伴网关的其他企业建立安全关联 (SA) 将失败。

    例如,如果有名为 Enterprise-1 和 Enterprise-2 的两个企业使用合作伙伴网关,并在这两个企业上都配置了合作伙伴切换,则 SD-WAN 服务将在网关的虚拟网络接口中设置单个 IP 地址。如果用户在 Enterprise-2 中禁用合作伙伴切换,那么 SD-WAN 服务将进入下一个流量,并将从虚拟网络接口中删除 IP 地址,即使正在 Enterprise-1 切换中使用相同的 IP 地址。因此,Enterprise-1 无法与其 Edge 建立 IPsec 隧道。

    如果网关出现该问题而未进行修复,重新引导网关将修复该问题。

  • 修复的问题 107309:当客户在 4.x Orchestrator 上为通过 Edge 的非 SD-WAN 目标配置 L7 运行状况检查,并将 Orchestrator 升级到版本 5.x 时,如果客户尝试修改 L7 探测重试值,则 Edge 不会应用新值。

    例如,如果 L7 运行状况检查探测重试值为 3(3 次探测失败后隧道被标记为关闭),并且客户将此值更改为 1,则在隧道被标记为关闭之前,L7 运行状况检查将继续使用原始重试值 3。

  • 修复的问题 108473:VMware SD-WAN 网关可能会发生数据平面服务故障、生成核心文件并重新启动以恢复该服务。

    网关可能会出现序列号溢出的情况,这会触发删除所有 SA(IPsec 安全关联)的操作。如果尝试删除所有 SA,网关进程会尝试根据隧道 ID 查找隧道,但该隧道不存在,从而导致网关服务失败。

  • 修复的问题 111646:CPU 负载较高的 VMware SD-WAN 网关可能会发生数据平面服务故障,并且需要重新启动才能恢复。

    用户查看网关生成的核心时,会看到互斥监控器异常和消息“程序被终止并返回信号 SIGXCPU,已超出 CPU 时间限制”(Program terminated with signal SIGXCPU, CPU time limit exceeded message)。该问题与释放较低优先级线程锁定的网关进程有关。

  • 修复的问题 111888:如果 VMware SD-WAN 网关部署了 4 个内核并且连接了超过 2000 个隧道,则该网关可能会遇到 CPU 使用率过高的问题,并且连接到该网关的隧道可能不稳定。

    其中一个网关线程在 4 核网关中占用了过多的 CPU 容量,这会使网关无法保持隧道稳定。

  • 修复的问题 111924:客户可能会观察到,在所有站点中,即使 VMware SD-WAN Edge 到 VMware SD-WAN 网关的隧道已启动并处于稳定状态,仍会丢弃多路径流量(即,流经该网关的流量)。

    网关可重新传输 VCMP 数据包(SD-WAN 的管理协议)的最大次数是没有限制的,这种重新传输可能会使低带宽链路不堪重负。在 Edge 具有低带宽链路时,由于重新传输的处理速度不够快,这些重新传输还会导致在调度程序上积压数据包。最终,调度程序队列会变满,并导致调度程序丢弃来自所有 Edge 的数据包。不使用网关的直接流量将不受此问题影响。

    如果发布的网关未修复此问题,在遇到此问题时,唯一的修复方法是:操作员用户使用 debug.py --qos_dump_net 命令识别导致数据包在调度程序上堆积的 Edge,并在受影响的网关中阻止这些 Edge。

  • 修复的问题 112016:启动网关重新启动后,VMware SD-WAN 网关可能会发生多个数据平面服务故障,并生成核心文件。

    检查核心文件时,操作员会发现每个故障都是由互斥监控器问题触发的。对于管理 VCMP(SD-WAN 的管理协议)的线程来说,处理的时间明显增加。在网关启动期间,这会导致 VCMP 线程长时间(超过 60 秒)以 100% 使用率持续运行,从而导致多个互斥监控器相关的网关服务出现故障。

  • 修复的问题 112017:操作员可能会观察到部署了 4 个内核的 VMware SD-WAN 网关负载较高,从而导致一个或多个数据平面服务出现故障。

    网关核心日志将指向触发服务故障的互斥监控器。多个请求单消除了上述症状,此处出现该问题的原因是,VCMP(管理协议)线程最大限度利用 4 核网关的 CPU 进程,从而触发互斥监控器。此请求单增加了允许操作员用户将 VCMP 半开连接限制配置为 20 的功能。此操作可以通过网关的命令行界面 (CLI) 使用 debug.py 来完成,也可以通过静态配置文件来完成。

  • 修复的问题 112019:CPU 负载较高的 VMware SD-WAN 网关可能会发生数据平面服务故障,并且需要重新启动才能恢复。

    与 5.1.0.3 汇总内部版本中的其他网关服务故障请求单一样,操作员或合作伙伴会在核心文件中观察到互斥监控器触发器。在此请求单中,修复操作是将 NAT 调试日志移至 NAT 表锁定范围之外,以防止出现导致此问题的其中一个原因。

  • 修复的问题 112020:当部署了 4 个内核的 VMware SD-WAN 网关出现较高的 CPU 负载时,可能会发生数据平面服务故障,并因而重新启动。

    查看网关核心文件时,用户观察到互斥监控器故障,这是由网关进程无法运行所致,因为 CPU 由于隧道计数高而以最大容量运行。

  • 修复的问题 112800:使用 VMware SD-WAN 网关的客户可能会遇到性能不佳问题,包括隧道和路由聚合时间过久的问题。

    在查看网关监控时,用户将发现数据平面内核 (dp-cores) 以 100% 使用率运行,这是由网关无法刷新失效的流量调度程序流量引起的。

  • 修复的问题 114052:VMware SD-WAN 网关可能会发生数据平面服务故障、生成核心文件并因此重新启动该服务。

    出现该问题的原因是,网关 IPsec 进程中的线程超时并触发网关服务故障。

  • 修复的问题 114084:对于已为 VMware SD-WAN Edge 配置了 Zscaler 类型的云安全服务 (CSS) 和 L7 运行状况检查的客户,在 VMware SASE Orchestrator 上更新 Zscaler 云服务器时,更新的详细信息不会应用于 Edge。

    尽管 Orchestrator 会显示新的 Zscaler 云服务器配置,但 Edge 和网关仍会通过旧 Zscaler 服务器而不是此新服务器发送流量或 L7 探测。

  • 修复的问题 114282:重新启动部署了 4 个内核的 VMware SD-WAN 网关时,可能需要长达 20 分钟才能为连接的客户企业融合约 3000 个隧道。

    预期结果是,网关应在大约 5 分钟内融合大约 3000 个隧道,而在本问题中观察到的时间为 20 分钟。在隧道完全恢复之前,较慢的速度会导致客户流量中断。融合速度较慢的原因可追溯到网关 IPsec 进程中的配置,该配置管理着使用此请求单更正的安全关联和密钥。

  • 修复的问题 114932:VMware SD-WAN Edge 客户端用户可能会遇到流经 Edge 主 VMware SD-WAN 网关的流量性能下降的情况。

    操作员用户可能会观察到网关的 CPU 占用率较高问题,即使将隧道计数限制在支持的范围内也是如此。高 CPU 占用率由于失效的 IKE SA(安全关联)在 IKE 表中保留时间过长所致,这会导致隧道需要较长时间才能聚合,进而导致大量流量丢弃和通过网关的客户流量路径不稳定问题。

  • 修复的问题 115604:VMware SD-WAN Edge 或网关可能会发生数据平面服务故障,生成核心文件并在日志中包含断言。

    在 Edge 或网关处理损坏的数据包时,软件可能会触发断言,指出实际用户数据包长度超过内部数据包缓冲区。网关应丢弃这种数据包并禁止将其发送到 Edge,但实际上对其进行了处理,这会导致服务故障和重新启动。

  • 修复的问题 115692:操作员可能会观察到 VMware SD-WAN 网关中的内存使用量不断增加,这可能会导致内存耗尽并重新启动防御性服务以清除内存。

    在这种情况下,通过对等站点续订证书的网关会发生 IKE 内存泄漏。

    如果未修复该问题,操作员只能监控网关上的内存使用情况,并在维护时段内主动重新启动网关,以确保对使用网关的客户站点造成最短暂的中断。

  • 修复的问题 116182:VMware SD-WAN 网关可能会发生数据平面服务故障、生成核心文件并因此重新启动该服务。

    此问题出现在以下网关中:为连接的 SD-WAN Edge 配置了使用 IPv6 或 IPv4/IPv6 混合模式访问通过网关的非 SD-WAN 目标 (NSD) 的 Internet 回传策略。在此场景中,当网关收到发送到使用 IPv4 的 NSD 的 IPv6 数据包时,会触发网关服务故障。

Edge 和网关版本 R5102-20230310-GA 中解决的问题

Edge 和网关内部版本 R5102-20230310-GA 在 2023 年 3 月 14 日发布,它是版本 5.1.0 的第 2 个 Edge 和网关汇总内部版本。

此网关汇总内部版本解决了自第一个 Edge 和网关汇总内部版本 R5101-20230112-GA 以来存在的以下严重问题。

  • 修复的问题 98782:VMware SD-WAN 网关可能会在建立 IPsec 隧道期间发生数据平面服务故障,从而导致生成核心文件并重新启动网关。

    在网关出现此问题时,重新启动可能会导致连接到该网关的两个 Edge 以及使用该网关建立 IPsec 隧道的非 SD-WAN 目标的客户流量短暂中断。出现此问题的原因是,在网关建立 IPsec 隧道时出现的争用情况触发了数据平面服务故障。

  • 修复的问题 103708:在 BGP 筛选器配置中添加新规则时,VMware SD-WAN Edge 可能会接收和发送意外的 BGP 路由。

    从 Orchestrator 将新规则添加到 BGP 筛选器中时,会将前缀列表添加到 Edge 的路由配置中,但不会移除旧条目。该行为导致失效的路由前缀列表和意外的筛选行为。

  • 修复的问题 104141:VMware SD-WAN Edge 后面的用户或连接到 VMware SD-WAN 网关的客户可能会发现使用该 Edge 或经过该网关的所有流量存在重大问题,以致于无法转发任何流量。

    遇到此问题时,由于从对等体收到的管理隧道时间戳不断增加,因此,Edge 或网关中无限数量的内存缓冲区 (mbuf) 正在被抖动缓冲区队列使用。这会在抖动计算中触发整数下溢,从而导致数据包无限期地有效缓冲。最初,这只会影响缓冲的流量,但在足够长的时间段内,用于抖动缓冲区队列的 mbuf 数量会接近可用 mbuf 的总数,并且 SD-WAN 设备(Edge 或网关)可能无法完全转发所有流量。如果此问题影响网关,则只会影响经过网关的多路径流量,而直接传输的客户流量则不会受到影响。

    另一个请求单 105744 也解决了此处发现的症状,但它修复的是不同的原因。这两个请求单之间的差异在于:104141 中包含的修复解决了由于对等体收到的管理时间戳不断增加而导致内存缓冲区由抖动缓冲区队列使用的问题。105744 中包含的修复将抖动缓冲区计数限制为总内存缓冲区的 25%,以便无论发生什么其他情况,都可确保此问题不会再次出现。

    如果 Edge 或网关未修复此问题,用户可以监控 Orchestrator 上的内存缓冲区 (mbuf) 使用情况,并查找由于数据包被排入抖动缓冲区队列而增加的 mbuf 使用量。如果用户确实发现此问题,他们可以为 Edge(通过远程诊断)或网关刷新流量来暂时缓解此问题,但在应用修复之前,此问题最终会再次出现。

  • 修复的问题 105744:VMware SD-WAN Edge 后面的用户或连接到 VMware SD-WAN 网关的客户可能会发现使用该 Edge 或经过该网关的所有流量存在重大问题,以致于无法转发任何流量。

    此请求单与问题 104141 直接相关,并且具有相同的症状和原因,此处将重复这些内容:遇到此问题时,由于从对等体收到的管理隧道时间戳不断增加,因此,Edge 或网关中无限数量的内存缓冲区 (mbuf) 正在被抖动缓冲区队列使用。这会在抖动计算中触发整数下溢,从而导致数据包无限期地有效缓冲。最初,这只会影响缓冲的流量,但在足够长的时间段内,用于抖动缓冲区队列的 mbuf 数量会接近可用 mbuf 的总数,并且 SD-WAN 设备(Edge 或网关)可能无法完全转发所有流量。如果此问题影响网关,则只会影响经过网关的多路径流量,而直接传输的客户流量则不会受到影响。

    这两个请求单之间的差异在于:104141 中包含的修复解决了由于对等体收到的管理时间戳不断增加而导致内存缓冲区由抖动缓冲区队列使用的问题。105744 中包含的修复将抖动缓冲区计数限制为总内存缓冲区的 25%,以确保此问题不会再次出现。

    如果 Edge 或网关未修复此问题,则用户可以在 Orchestrator 上进行监控以查找由于数据包被排入抖动缓冲区队列而增加的 mbuf 使用量,而且用户可以为 Edge 或网关刷新流量以暂时缓解此问题,但在应用修复之前,此问题最终会再次出现。

  • 修复的问题 106587:客户可能会观察到所有流量被随机丢弃,并且这种状态持续存在。

    此问题与响应程序端的 IPsec 安全关联 (SA) 安装有关。在 Edge 启动新 SA 或执行重新加密时,旧 SA 安全参数索引 (SPI) 数据包可能先于新 SA (SPI) 到达。在这种情况下,VMware SD-WAN 网关会删除新创建的 SA (SPI)。添加的修复将阻止删除新创建的 SA (SPI)。

    如果未修复此问题,合作伙伴或操作员用户将需要重新引导网关以重新启动所有受影响的 IPsec 隧道。

网关版本 R5101-20230112-GA 中解决的问题

网关内部版本 R5101-20230112-GA 在 2023 年 1 月 19 日发布,它是版本 5.1.0 的第 1 个网关汇总内部版本。

此网关汇总内部版本解决了自原始网关内部版本 R5100-20221204-GA 以来存在的以下严重问题。

  • 修复的问题 97272:在部署了高可用性拓扑且使用 OSPF 的站点上,当站点出现脑裂情况(两个 SD-WAN Edge 均处于活动状态)时,将移除到核心路由器的默认路由,并且 HA 站点无法访问网络中的对等站点。

    核心路由器会将链路状态通告 (LSA) 使用期限与活动 Edge 同步。在遇到 HA 脑裂情况时,备用 Edge 将变为活动状态,并向核心路由器发送新的 LSA 使用期限。尽管活动 Edge 和备用 Edge 具有相同的路由器 ID,但新的活动 Edge 会发送不同的 LSA 使用期限。这种不匹配会导致核心路由器中的 LSA 使用期限被设置为最大值 3600,而且核心路由器还会移除到 HA 站点的核心路由,从而导致该站点完全中断。

  • 修复的问题 104487:由于数据库服务速度缓慢,VMware SASE Orchestrator 用户可能会遇到整体速度缓慢和一些 API 失败。其他副作用包括 SD-WAN 网关/Edge 在 UI 中显示为脱机状态,通过 Orchestrator UI 所做的配置更改未推送到目标 SD-WAN Edge,以及失去报告功能。

    这些问题都是由于 Orchestrator 的数据库服务失败所致,显示以下错误:打开的文件过多 (too many open files)。VMware SASE Orchestrator 操作员可以通过日志观察到此错误。通过 UI 访问 VMware SASE Orchestrator 的最终用户会遇到速度缓慢以及间歇性 API 失败,从而导致 UI 上显示错误消息。

Edge 和网关版本 R5100-20221204-GA 中解决的问题

Edge 和网关内部版本 R5100-20221204-GA 于 2022 年 12 月 8 日发布,解决了自 Edge 内部版本 R5012-20221107-GA 和网关内部版本 R5011-20221007-GA 以来存在的以下问题。

注:

版本 5.1.0 包含 5.0.0 发行说明中列出的所有 Edge 和网关修复,以及 5.0.1 发行说明中直到上面所列内部版本的所有 Edge 和网关修复。

  • 修复的问题 26085:如果客户使用 Hub/分支拓扑和合作伙伴网关,则从 Hub Edge 取消配置一个网关时,客户可能会观察到流量在 VMware SD-WAN 分支 Edge 上被丢弃。

    丢弃的流量使用的是不再分配的网关的失效路由。从 Hub Edge 取消配置网关时,网关本身并不知道发生了这一事件,并将该事件视为一个简单的隧道关闭事件。因此,网关将继续为分支 Edge 提供其路由,并且分支 Edge 不会移除远程路由(可通过 Hub Edge 访问),因为 Hub Edge 仍然可以访问分支 Edge。

    在没有已修复的内部版本的情况下出现该问题时,修复该问题的唯一方法是将分支 Edge 连接到网关链路。

  • 修复的问题 29929:对于部署了高可用性拓扑的站点,在进行 HA 故障切换时,用户可能无法登录 HA Edge 的本地 UI。

    在 Orchestrator 上修改 HA Edge 的本地凭据时,正确的活动 Edge 会应用更改,但新凭据不会同步到备用 Edge。因此,在进行 HA 故障切换并将备用 Edge 升级为活动 Edge 时,Edge 会使用默认用户/密码凭据;如果使用较新的凭据,用户尝试登录本地 UI 时将失败。

  • 修复的问题 32413:运行状况统计信息或 MIB 中不包含温度。

    该修复将 CPU 温度添加到用于 SNMP 的 MIB 以及监控 (Monitor) > Edge > 系统 (System) 内测量的衡量指标(也称为“Edge 运行状况统计信息”)中。

  • 修复的问题 32654:在关闭了 WAN 接口的 VMware SD-WAN Edge 站点上,用户可能会观察到流量丢弃。

    尽管在连接的接口关闭时,VMware SD-WAN Edge 上的可访问性为 False,但由于连接的路由仍通告到 VMware SD-WAN 网关,因此会发生流量丢弃。

  • 修复的问题 39134:在查看“监控”(Monitor) >“Edge”>“系统”(System) 页面时,CPU 百分比不准确。

    这也称为“Edge 运行状况统计信息”,VMware SASE Orchestrator 无法接收有关 Edge CPU 使用情况的准确信息,它会将接收到的信息输出到“系统”(System) 页面上的图表中,这些信息不准确且会误导尝试对 Edge 问题进行故障排除的客户。

  • 修复的问题 45453:客户无法将 VMware SD-WAN Edge 配置为让 2 个 WAN 接口使用相同的 VLAN。

    如果站点将多个 Edge WAN 端口连接到同一 VLAN 上的相同 L2 交换机,则会出现该问题。此配置的问题是,在发送管理流量时,Edge 有时可能会使用错误的源 MAC 地址。

  • 修复的问题 50920:在连接的隧道数量达到 VMware SD-WAN Edge 的硬件定义限制的 60% 时,该 Edge 型号不发送警告。

    在连接的隧道数量达到 Edge 硬件限制时,它发出警告,指出“建立的隧道数量超过设备容量”(Established tunnel count exceeds the device capacity)。在达到该限制后,在拆除现有隧道之前,Edge 不允许建立额外的动态隧道。不过,不会发送中间警告以提醒客户可能会达到该隧道限制,从而没有为客户留出足够的时间以管理其网络。

  • 修复的问题 53337:在吞吐量高于 3200 Mbps 时,可能会在 VMware SD-WAN 网关的 AWS 实例中观察到数据包丢弃。

    在流量的吞吐量超过 3200 Mbps 并且数据包大小为 1300 字节时,将会在接收和 IPv4 BH 切换时观察到数据包丢弃。

  • 修复的问题 54846:VMware SD-WAN SNMP MIB 将计数器应用于抖动、延迟和丢包率。

    在 VMware SNMP MIB 中,将延迟、抖动和丢包率定义为 Counter64,但此类计数器并不适用于这些类型的数据。计数器适用的数据类型应具有不断增大的值且绝不会像发送/接收字节一样在 SNMP 中重置。相反,延迟、抖动和丢包率等数据的值不是不断增大的,而是动态调整的,因此不应使用计数器。

  • 修复的问题 55327:如果从 VMware SD-WAN Edge 到 VMware SD-WAN 网关的隧道持续抖动,则从网关到 Edge 的 SSH 连接可能无法正常工作。

    如果从 Edge 到网关的隧道持续抖动,则在 Edge 中安装的允许从网关建立 SSH 连接的路由条目可能被删除,从而导致 SSH 连接失败。

  • 修复的问题 56153:对于部署了通过网关的非 SD-WAN 目标并且正在使用 IPsec 上的 BGP 的客户企业,如果客户取消分配入站 BGP 筛选器,并不会在 VMware SD-WAN 网关上移除该筛选器,而是通过该筛选器应用路由映射。

    该问题可能会导致客户出现意外路由,因为他们预计入站 BGP 筛选器处于非活动状态,而此时网关和 Edge 仍在使用该筛选器。

  • 修复的问题 60844:旨在通过将速率限制配置为 0% 来丢弃匹配策略条件的所有流量的业务策略不起作用。

    虽然允许将速率限制配置为 0%,但 Edge 不会将其视为 0%,而是将其视为 100%,这完全违背业务策略的目的。

    在未进行该修复的 Edge 上,解决办法是使用防火墙规则进行匹配并丢弃不符合业务策略的流量。

  • 修复的问题 61804:使用 BGP 的客户企业可能会发现,在 VMware SD-WAN Edge 从对等体学习路由时,这些路由会重新通告到对等体本身。

    Edge 不应将从对等体学习的路由通告到对等体本身,这会导致出现不利的路由行为并丢弃流量。

  • 修复的问题 62701:对于作为 Edge Hub 集群一部分部署的 VMware SD-WAN Edge,如果云 VPN 未在全局分段下激活,而是在非全局分段下激活,则 Orchestrator 发送的控制平面更新可能会导致所有 WAN 链路在 Hub Edge 上抖动。

    Hub Edge 的 WAN 链路连续快速地关闭然后启动(抖动)将影响语音通话等实时流量。此问题出现在以下客户部署中:在 Hub Edge 的全局分段上未激活云 VPN,但集群配置却配置为开启状态,这意味着此 Hub Edge 是集群的一部分(并且集群配置适用于所有分段)。将配置更改推送到 Hub Edge 时,Hub Edge 的数据平面将从全局分段开始解析数据,它将发现全局分段上未激活云 VPN,因而 Hub Edge 错误地认为在此全局分段上停用了集群。因此,Hub Edge 将拆除来自 Hub 的 WAN 链路的所有隧道,这将导致在该 Edge 的所有 WAN 链路上发生链路抖动。对于任何此类事件,WAN 链路仅在每次控制平面更新时关闭并恢复一次。

    在 Edge 未使用修复了该问题的版本的企业中,解决办法是在所有分段(即全局分段和所有非全局分段)上激活云 VPN。

  • 修复的问题 64526:当用户将 VMware SD-WAN Edge 上的 GE2 接口从交换接口更改为路由接口,然后在该接口上配置子接口并尝试保存更改时,Orchestrator 会抛出错误。

    仅当在配置文件级别(而不是 Edge 级别)更改 Edge 接口配置时,才会触发该问题。用户将看到以下错误:“子接口 GE2 的寻址类型 DHCP_STATELESS 未知 - 已忽略”(Unknown addressing type DHCP_STATELESS for subinterface GE2 - ignored),此错误显示在该客户的 Orchestrator“事件”(Events) 页面下。

  • 修复的问题 65530:在 VMware SD-WAN Edge 上部署 Metanoia SFP 的客户可能会发现模块问题。

    出现这些问题的原因是,未使用随 5.1.0 版本更新的较新固件级别。下表中显示了对 CSP 版本和 SFP UPG 固件版本所做的更改:

    Edge 版本

    CSP 版本

    SFP UPG 固件版本

    5.1.0

    3.2.9.13

    1_62_8559

    4.0.0 - 5.0.x

    3.2.8.11

    1_62_8431

    这些更新可确保 Edge 上的 Metanoia SFP 具有更高的稳定性。

  • 修复的问题 65919:对于已配置 Zscaler 云安全服务 (CSS) 的客户,如果 Edge 服务重新启动或删除 DNS,Zscaler 隧道可能会出现故障。

    即使 DNS 查询成功,DNS 也不会显示 Zscaler FQDN,因此隧道不会启动。检查 DNS 的 Edge 日志时,DNS 缓存中将不会有任何 Zscaler 条目。

    要修复该问题,用户需要执行 nslookup 或 ping 操作,之后即会创建 DNS 条目并且 Zscaler 隧道将会启动。 

  • 修复的问题 67900:如果在 VMware SASE Orchestrator 上将 WAN 链路配置为自动检测,Orchestrator 可能会将其标记为专用链路,即使应将其设置为公用链路也是如此。

    Orchestrator 请求将链路设置为专用,即使客户已将该链路的配置设置为公用也是如此。这可能会导致网关出现严重的连接问题,因为该链路将尝试连接到专用 IP 并在该过程中失败。

  • 修复的问题 68335:对于使用 Hub 为集群的 Hub/分支拓扑的客户企业,无法与 Hub 集群连接的 VMware SD-WAN 分支 Edge 可能会消耗大量分类为 SD-WAN 控制流量的带宽。

    当分支 Edge 无法与其数据中心 Hub 集群建立覆盖网络时,Edge 会请求控制器重新分配其他集群成员,从而导致控制器发送持续控制事件并消耗链路带宽。

    在未进行该修复的 Edge 上,该问题的解决办法是创建并分配临时配置文件,而不在其配置文件中分配无法访问的 Hub 集群。

  • 修复的问题 70248:在 Edge 端颁发 CRL 时,隧道关闭并再次重新建立。

    当 Orchestrator 吊销任何证书(例如网关证书)时,Edge 会关闭隧道,但又再次重新建立隧道。

    该问题与 CRL 有效时间相关。如果 CRL 的更新时间早于 Edge 时间,将再次重新建立隧道。

    如果未进行该修复,唯一的解决办法是确保 Edge 和 Orchestrator 的日期和时间匹配。

  • 修复的问题 70311:VMware SD-WAN Edge 可能会发生数据平面服务故障,并因而重新启动。

    在 Edge 服务重新启动期间,客户流量将中断大约 15-30 秒。此问题并不会一直出现,但当它确实发生时,Edge 会拆除 IKE 安全关联 (SA)。此问题通常仅在以下情况下发生:SA 定时器(在 VMware SD-WAN Orchestrator 上配置)到期;或者用户在 Orchestrator 上修改 IPSec 配置。

  • 修复的问题 71302:对于使用通过 Edge 的非 SD-WAN 目标的客户企业,使用的端口为 500 而不是 4500。

    这不是预期行为,如果有某个其他设备阻止端口 500,则可能会导致使用该通过 Edge 的 NSD 的流量出现问题。

  • 修复的问题 71719:不会沿 Edge 到 Cloud 路径建立 PPTP 连接。

    不会与 VMware SD-WAN Edge 后面的 PPTP 服务器建立连接。

  • 修复的问题 75553:如果客户部署通过网关的非 SD-WAN 目标 (NSD) 且该 NSD 使用“基于策略”(Policy Based) 类型,则客户无法配置冗余 VMware SD-WAN 网关。

    在以前的内部版本中,VMware 始终将基于策略的 NSD 路由标记为“可访问”(Reachable),而无论其状态如何,其影响是,NSD 的主网关路由永远不会被标记为“不可访问”(Unreachable),也永远不会触发到冗余网关的故障切换。

    在版本 5.1.0 和更高版本中,网关路径将被标记为“可访问”(Reachable),除非它无法进行 IKE/IPsec 协商,此时会将其标记为“不可访问”(Unreachable),并且 NSD 流量将通过冗余网关进行传输,就像使用基于路由的 NSD 一样。

  • 修复的问题 75668:在将 LAN 端流量路由到内部 LAN 目标时,将为其重置 DSCP 标记。

    对于路由/直接用户流量,Edge 会将 DSCP 标记重置为 0,在同一 Edge 上输入和输出的流量(换言之,保持在 Edge 本地的流量)会将 DSCP 标记修改为 CSP=0DSCP 标记,并且在底层网络流量流经 Edge 时会将 DSCP 标记重置为 CS0

  • 修复的问题 76881:如果使用的 DHCPv6 租约超过 10,000 个,VMware SD-WAN Edge 可能会出现严重的内存使用情况级别,并且可能会触发 Edge 服务重新启动。

    当大量 DHCPv6 客户端连接到 DHCPv6 服务器时,将为每个客户端提供一个租约,并且 DHCPv6 服务器的内存将继续增长。与 5K IPv4 地址的硬限制相反,Edge 不会限制可分配的 DHCPv6 租约数。因此,Edge 可能会分配足够的租约以达到严重的 Edge 内存状态级别并触发服务重新启动。

    该问题的修复将客户端最大数限制为 10,000。

  • 修复的问题 77066:VMware SD-WAN 网关可能会发生数据平面服务故障、触发核心文件生成并重新启动该服务以进行恢复。

    触发该问题的原因是,分别处理传输数据包和接收数据包的两个网关进程同时尝试访问搜索树中的同一节点导致网关内存损坏。

  • 修复的问题 77457:如果用户尝试为备用 VMware SD-WAN Edge 上的接口生成数据包捕获 (PCAP),VMware SASE Orchestrator 会报告 PCAP 失败。

    用户尝试为增强型高可用性部署中的备用 Edge 生成 PCAP 时,Orchestrator UI 会将请求状态 (Request Status) 记录为“失败”(Failed) 并说明“上载诊断包失败: ‘unicode’没有缓冲区接口。”(Failed to upload diagnostic bundle: 'unicode' does not have the buffer interface.)


  • 修复的问题 77611:对于使用高可用性拓扑的客户站点,在将 HA Edge 迁移到不同的配置文件时,两个 Edge 可能会进入活动-活动状态(脑裂),并同时重新启动以进行恢复。

    在此活动-活动状态下,客户端用户会发现因数据包丢失而导致的严重流量质量问题。

    出现该问题的原因是,HA Edge 在移动到新配置文件时未能遵循相应过程,即,备用 Edge 应先重新启动以应用更改并保留为备用 Edge。然后,活动 Edge 将应用配置更改并重新启动,接下来将备用 Edge 升级为活动 Edge,同时将其自身降级为备用 Edge。而实际情况是,备用 Edge 在重新启动后立即将其自身升级为活动 Edge,从而导致出现活动-活动状态。

  • 修复的问题 78037:在 DHCPv6 服务器配置了超过 1000 个地址时,VMware SD-WAN Edge 可能会出现内存使用量激增的情况,然后发生数据平面服务故障。

    路由接口和交换接口都会出现问题。如果在 DHCPv6 服务器上为客户端配置了超过 1000 个地址,则可能会出现问题。在超过 1000 个客户端获取地址时,生成的大量 DHCPv6 请求数据包导致 Edge 内存耗尽和 Edge 服务故障。

  • 修复的问题 78050:当 LAN 端存在 PPTP 服务器时,VMware SD-WAN Edge 可能会发生数据平面服务故障。

    当 LAN 端存在 PPTP 服务器时,如果 Internet 中的 PPTP 客户端通过入站防火墙规则连接到该服务器,则 Edge 服务可能会由于 PPTP 控制通道查找失败而发生故障。需要执行此控制通道查找,以确保通过同一链路将 GRE 数据通道发送回 PPTP 客户端。

    如果 Edge 使用的内部版本未修复该问题,客户唯一的替代解决方法是不使用 PPTP 会话。

  • 修复的问题 78435:通过本地 UI 使用 URL 激活的 VMware SD-WAN Edge 可能会抛出 Edge 激活失败的错误,而实际上已成功激活。

    通过本地 UI 对 Edge 进行 URL 激活会抛出“无法完成 Edge 激活”(edge activation could not be completed) 错误


    出现该问题的原因是,Edge 在响应激活状态请求时引用了参数不正确的较旧激活请求。同时,具有正确参数的当前激活请求实际上正在处理中。因此,即使正确处理了 Edge 激活,本地 UI 也会抛出错误。

  • 修复的问题 79437:对于服务器上部署的 VMware SD-WAN 网关,如果其使用的 Intel X710 网卡为接口启用了 SR-IOV,则可能无法进行部署。

    如果发生该故障,操作员会发现 X710 SR-IOV 接口已从 DPDK 中移除,从而在运行 debug.py --dpdk_ports_d 时看不到这些接口。此外,/opt/vc/etc/dpdk.json 也不会显示 SR-IOV 接口。将网关部署到 5.1.0 版本可确保不会遇到此问题。

  • 修复的问题 79338:大量 DHCPv6 客户端尝试获取新的 IPv6 地址时,一些客户端可能无法获取新地址。

    如果有超过 1024 个客户端同时尝试获取 IPv6 地址,则某些客户端可能无法获取有效的 IPv6 地址。出现该问题的原因是,邻居缓存是固定的,并且不会创建一些客户端的邻居条目。由于不存在邻居条目,续订消息将失败。

    如果客户未使用进行了该修复的内部版本,他们可以在几分钟后重新尝试从客户端获取 IPv6 地址。

  • 修复的问题 79550:VMware SD-WAN 网关或 SD-WAN Edge 可能发生数据平面服务故障并重新启动。

    如果收到重复的管理流量 (VCMP) 分段,而导致进程写入到为该数据包分配的缓冲区以外并触发故障,则可能会出现该问题。

  • 修复的问题 81881:在 VMware SASE Orchestrator 上的“配置”(Configure) >“设备”(Device) 中进行的配置更改可能不会应用于目标 VMware SD-WAN Edge,即使该 Edge 已连接到 Orchestrator 也是如此。

    在频繁快速更改配置的高负载条件下,Edge 可能会出现该问题。在这种场景中,负责配置应用的 Edge 管理线程将停滞,并且不会应用其他更改。

  • 修复的问题 81353:可能会发现使用 Azure 平台部署的 VMware SD-WAN 网关在接口接收时丢弃数据包。

    由于缓冲区较低,数据包被丢弃。环缓冲区设置不属于 Azure 平台使用的非 DPDK 管理的接口,并且网卡接收环缓冲区队列设置为较低数字。

  • 修复的问题 81355:使用 Azure 平台部署的 VMware SD-WAN 网关可能会出现数据包大小大于 1500 字节的问题。

    将丢弃大于 1500 字节的数据包,并显示错误消息:pkt_too_big_drop。将丢弃远大于 1500 字节的数据包,并显示错误消息:sock_too_big_dropp

    出现该问题的原因是,Azure 平台未使用 DPDK 受限接口,这会将网关的 DPDK.json 列表保留为空,并且 DPDK 网络配置不会初始化 Linux 接口的 TSO/GSO 设置。

  • 修复的问题 81377:更新 Secure Access 子网后,不会从 BGP 中撤消旧子网。

    修改 Secure Access 子网配置后,SD-WAN 仅从转发信息库 (FIB) 和其他本地路由表中删除旧子网。问题是,SD-WAN 不会从用于重新分发的 BGP 表中撤消路由,从而导致这些已弃用的路由仍保留在 BGP 中。

  • 修复的问题 81483:对于使用 Hub-分支拓扑的客户,如果用户通过 VMware SASE Orchestrator 延长 IKE 和/或 IPsec 生命周期,客户可能会发现某些隧道保留旧生命周期。因此,某些隧道将比预期更频繁地执行重新加密,因为它们保留了以前的生命周期。

    如果客户缩短生命周期,他们将在技术上遇到此错误(Hub-分支技术的一端可能会保留旧的较长生命周期),但不会发现功能上有任何差异,因为正确接收较短生命周期的 Edge 将首先执行重新加密,从而掩盖了该问题。

    该问题的唯一解决办法是更改生命周期值,直到所有隧道都反映正确的状态,然后重新引导 Edge。

  • 修复的问题 82104:在极少数情况下,在高可用性拓扑中激活的 VMware SD-WAN Edge 可能无法与 VMware SASE Orchestrator 通信,这会导致将站点标记为关闭,并阻止通过 Orchestrator 对站点进行任何干预。

    仅当对 HA Edge 应用了异常和无效配置时,才会出现此问题。这种配置指定将 HA 端口配置为“中继”(应禁止)并设置零个 VLAN(也应禁止),但实际设置了“所有 VLAN”。Orchestrator 不会在这种配置中抛出错误并禁止用户为 Edge 激活 HA,而是允许这样做。允许这种配置会在 HA Edge 上触发管理平面故障,导致 HA Edge 不再向 Orchestrator 发送检测信号。此处的修复允许在 HA Edge 对上使用这种无效配置,而不会中断到 Orchestrator 的管理流量。

  • 修复的问题 82188:对于 VMware SD-WAN LTE 型号(Edge 510-LTE、610-LTE),在关闭 IPv6 设置时,通过 CELL 接口的隧道可能会发生故障。

    在关闭“设备设置”(Device Settings) 中的 IPv6 复选框时,CELL 接口的内部状态将变为“未知”(UNKNOWN)。即使将 CELL 接口的 IPv6 设置切换为开启,也不会更新该状态。因此,通过 CELL 接口的隧道将发生故障。如果 LTE Edge 将 CELL 接口用于流量,这会导致 Edge 脱机并丢弃所有 Edge 流量,从而对客户造成严重中断。

    如果未进行该修复,用户需要在关闭 IPv6 设置后重新启动 Edge 服务。如果 Edge 处于脱机状态,由于它仅使用 CELL 接口提供带宽而,因此本地用户需要重新启动 Edge 以将其恢复。

  • 修复的问题 83040:如果客户企业具有同时使用合作伙伴网关和非 SD-WAN 目标 (NSD) 的 Hub/分支拓扑,则可能会观察到应使用 NSD 的流量改为使用 Hub。

    分支 Edge 将具有一个将流量回传到 NSD 的业务策略,如果还为分支配置了合作伙伴网关切换,则分支会将应使用 NSD 的流量发送到 Hub Edge。Hub 进而将流量直接发送到 Internet。如果禁用合作伙伴网关切换,则可正确路由该 NSD 流量。

  • 修复的问题 83227:如果 VMware SD-WAN Edge 运行 5.0.0 版本且配置了 128 个分段,则该 Edge 的 dnsmasq 进程将停止并退出。

    如果在 128 个分段上激活了 IPv6,并且在每个分段的 LAN 中都配置了 DCPv6 服务器,则 dnsmasq 进程将停止,因为超出了打开的文件描述符总数。dnsmasq 进程将继续运行大约 30 分钟时间,然后再退出,此时 Edge IP 地址的 DHCP 分配将失败。

    重新引导 Edge 将恢复 dnsmasq 进程,但大约 30 分钟过后,dnsmasq 进程将再次失败。能够真正解决该问题的唯一办法是将分段数减少到 128 个以下。

  • 修复的问题 83821:对于使用 NetFlow 的客户,无法在 NetFlow 记录中正确更新 SD-WAN 控制流量的发送和接收数据包/字节。

    导出到 NetFlow 收集器的 SD-WAN 控制数据(发送/接收数据包/字节)始终为零。由于流容器的 chat_stats 中未填充条目,因此 NetFlow 也不会导出数据。

  • 修复的问题 84000:对于连接到在双堆栈 (IPv4/IPv6) 配置中部署的 Edge 的 VMware SD-WAN 网关,如果高度频繁地为 Edge 创建和拆除隧道,则可能会出现内存泄漏,如果内存泄漏足够高,则会触发服务重新启动。

    如果为具有双堆栈配置的 Edge 多次创建和删除 VCMP(加密管理)隧道,则在该 Edge 的网关中,当网关大规模运行时,可能会出现 pi 泄漏。并没有真正的 pi 泄漏,但删除 pi 的速度缓慢,这种缓慢的删除速率可能会导致共享内存问题,最终可能变得严重。

    在未进行该修复的网关上,服务重新启动可暂时清除内存。

  • 修复的问题 84136:在升级到某些 Edge 版本的 VMware SD-WAN Edge 上,客户可能会观察到 CPU 占用率较高,并且流量性能不佳。

    配置 (Configure) > 防火墙 (Firewall) > Edge 访问 (Edge Access) 部分(支持访问或 SNMP 访问允许的 IP 地址)下配置了 400 多条 IP 规则的 Edge 上会出现该问题。在该场景中,如果 Edge 尝试发送防火墙配置时,管理进程会耗尽 CPU 并出现超时,然后重复执行该进程。

    在同时还使用高可用性拓扑的客户站点上,症状包括“HA 未知事件”,因为活动 Edge 未在预期的时段内发送检测信号。

  • 修复的问题 84225:在连接的 VMware SD-WAN Edge 接口关闭时,配置的子网仍会重新分发到 OSPF 或 BGP。

    Edge 在子网关闭时会接收来自对等体的流量,这可能会导致流量中断,因为对等体首选此路径而不是子网的其他替代路径。

    在未修复该问题的 Edge 上,用户需要在计划的维护时段内重新引导 Edge 以清除该问题。

  • 修复的问题 84313:在使用 Hub/分支拓扑的客户企业中,可以向 VMware SD-WAN 分支 Edge 的底层网络对等体通告 IPv6 覆盖网络链路。

    在覆盖网络上配置 IPv6 地址并启用通告时,也会通过底层网络通告相同的地址。

  • 修复的问题 84741:用户在“监控”(Monitor) >“传输”(Transport) 屏幕上观察到不准确的吞吐量统计信息。

    对于在 WAN 覆盖网络中停用“反向路径转发”(RPF) 的接口上直接发送的流量,接收(入站)数据包和链路统计信息不会递增到 Orchestrator。

  • 修复的问题 84790:除 510/510-LTE 以外的任意型号类型的 VMware SD-WAN Edge 重新引导后,Edge 可能错误地向 VMware SASE Orchestrator 报告严重事件“无法启动服务 wifihang”(Unable to launch service wifihang)。

    wifihang 事件消息专门针对 Edge 510/510-LTE 型号而设计,用于提醒客户该 Edge 型号的 Wi-Fi 进程出现问题。在任何其他 Edge 型号上观察到此事件消息时,无论该型号是否使用 Wi-Fi(例如 Edge 3400),该事件消息都是虚假消息,可以安全地忽略该事件。

  • 修复的问题 85154:在将实例类型为 C4.xlarge 的 AWS 上的 VMware SD-WAN 虚拟 Edge 从旧版 Edge 升级到较新版本(包括 4.3.1 版本),然后再降级回旧版 Edge 时,Edge 将进入停用状态,在这种状态下,Edge 不会与网关和 Orchestrator 建立管理隧道。

    导致此问题的原因是,Orchestrator 由于检测到序列号不匹配而错误地停用 Edge。

    除了在 AWS Edge 处于较新版本后不从该版本降级之外,此问题没有其他解决办法。

  • 修复的问题 85156:对于部署了高可用性拓扑的站点,客户可能会观察到 VMware SD-WAN 备用 Edge 多次重新引导,并且客户流量可能会中断。

    备用 Edge 上针对通过 TCP 接收的数据的 HA 控制数据同步处理逻辑可能会导致只能读取部分数据。这可能会导致在备用节点上处理多个此类短消息,从而降低备用节点的速度。在低端 Edge 平台(例如,Edge 型号 510、520、610、620)中,这种速度降低可能会显著影响活动 Edge 和备用 Edge 之间的检测信号处理,从而导致备用 Edge 被错误地升级为活动 Edge。在“活动-活动”状态下,这种状态会由活动 Edge 打破,而备用 Edge 将重新引导以降级回正确的备用状态。

    在传统 HA 拓扑中遇到此问题时,客户遭受到的影响极小,因为备用 Edge 不会传输客户流量。在增强型 HA 部署中,备用 Edge 也会传输流量,因而重新引导可能会中断某些客户流量。 

    该问题的修复在 Edge TCP 消息处理逻辑中添加了增强功能,提高了备用 Edge 的性能并可防止系统速度下降。

  • 修复的问题 85269:对于配置了多播的 Hub/分支拓扑的客户企业,多播接收方可能不会接收 Hub Edge 后面的流量源,其中源 IP 地址是在 Hub Edge 或分支 Edge 中手动设置的,而并未在两者中同时设置。

    如果由于 PIM 邻居 IP 地址与下一跃点 IP 地址不匹配而导致 PIM 加入发送失败,从而阻止 LHR 到达 RP 并进行注册 (*,G),Pimd 日志和调试命令将向用户提供确认信息。

  • 修复的问题 86098:对于使用增强型高可用性拓扑的站点,如果在站点中的备用 Edge 上使用 PPPoE WAN 链路,用户可能会发现活动 Edge 中未安装默认代理路由,并且使用该链路的流量传输将失败。

    在启动增强型 HA Edge 对时,PPPoE 链路将与备用 Edge 同步,并提供下一跃点为 0.0.0.0 的默认路由。因此,不会在活动 Edge 上安装此路由,并将丢弃使用该链路的流量。

  • 修复的问题 86994:在激活了动态分支到分支的客户企业中,尝试对此企业中的 VMware SD-WAN Edge 进行故障排除时,dispcnt 调试命令不起作用。

    dispcnt 调试命令不会提供所有计数器值,而是将失败并显示“域 (null) 不存在”(Domain (null) does not exist)。在引用 Edge 诊断包中的相关日志时,此命令也会失败。这极大阻碍了对客户网络问题进行故障排除。

    激活了动态分支到分支的企业会由于创建和拆除到每个对等体的大量隧道而出现该问题。用于存储对等体的各种衡量指标的计数器存储在共享内存中,随着时间的推移,这些共享内存分段会由于冲突而进入错误状态,因此 dispcnt 命令无法获取计数器。

    只有通过执行 Edge 服务重新启动才能清除该问题。

  • 修复的问题 87205:对于使用合作伙伴网关部署 VMware SD-WAN Edge 的客户,在 Edge 从合作伙伴网关学习新路由时,客户流量可能会中断。

    此问题是由流量匹配错误的业务策略所致。例如,发送到合作伙伴网关的 DHCP 流量可能会与 Internet 回传规则相匹配,从而导致客户流量中断。

    如果未进行该修复,可以使用“远程诊断”(Remote Diagnostic) > 刷新流量 (Flush Flows) 来刷新 Edge 的流量,从而修复该问题。在 Edge 学习指向合作伙伴网关的新路由时,该修复不会阻止未来可能发生的情况。

  • 修复的问题 87552:如果将 VMware SD-WAN Edge 配置为使用通过 Edge 的非 SD-WAN 目标 (NSD) 或云安全服务 (CSS),则在 NSD 或 CSS 隧道不稳定时,VMware SD-WAN Edge 可能会出现数据平面服务故障并重新启动。

    当 Edge 拆除到 NSD 或 CSS(IPsec 或 GRE)的隧道时,会错误释放先前选择的隧道,这会在 Edge 数据平面服务中触发异常,并且需要重新启动 Edge 服务才能还原该服务。重新启动 Edge 服务将导致客户流量中断 10-15 秒。

    在未修复该问题的 Edge 上,将通过 Edge 的 NSD 或 CSS 与一个 WAN 链路相关联可降低发生该问题的可能性。换句话说,不要在多个 WAN 链路上配置 NSD 或 CSS,而是仅选择一个 WAN 链路。这将失去冗余,但可以缓解此问题的影响。

  • 修复的问题 88055:在 VMware SD-WAN Edge 型号 3x00 上,客户可能会发现当吞吐量保持在 10 Gbps 或更高时,WAN 路径延迟可能会停滞并且 Edge 的稳定性和吞吐量下降。

    在 VCMP 端点之间存在快速时钟偏差的 10G 环境中,WAN 路径延迟测量可能会停滞,从而影响动态多路径优化 (DMPO) 的有效性,这会导致路径选择不正确和吞吐量下降。

  • 修复的问题 88152:对 VMware SD-WAN Edge 子接口的 SNMP 请求不起作用。

    这是第一天行为,而且对 Edge 子接口的任何 SNMP 请求都将超时。该问题的修复添加了对 Edge 子接口的这些 SNMP 请求的支持。

  • 修复的问题 88317:在同时使用公用链路和专用链路并配置了“SD-WAN 可访问”(SD-WAN Reachable) 的 VMware SD-WAN Edge 上,当公用链路关闭时,直接流量不会按预期使用专用链路。

    如果将业务策略设置为首选公用链路,则在首选的公用链路关闭时,流量不会使用 SD-WAN 可访问的专用链路。该修复添加了在直接链路选择尝试查找专用链路作为最后手段时也允许 SD-WAN 可访问链路的逻辑。

  • 修复的问题 88550:对于使用 Edge Network Intelligence 的客户,如果未明确配置 DNS,VMware SD-WAN Edge 将无法与 Edge Network Intelligence 服务通信。

    如果未明确配置 DNS,Edge Network Intelligence 服务将默认使用 Google DNS。如果 DNS 选择环回接口作为源接口,则对该服务的可访问性将会由于 DNS 查找失败而中断。

    如果客户企业未使用包含该修复的 Edge 内部版本,则解决办法是在 Orchestrator 上明确配置 DNS,并选择实际接口作为源接口,而不是选择虚拟环回接口。

  • 修复的问题 89364:对于使用增强型高可用性拓扑的站点,如果用户运行“远程诊断”(Remote Diagnostics) >“接口状态”(Interface Status),备用 Edge 接口的链路速度将显示为 0 Mbps/半双工。

    不会从启动了接口的备用 Edge 中获取速度和自动协商详细信息,并且无法正确显示详细信息。

  • 修复的问题 89596:VMware SD-WAN Edge 可能会发生数据平面服务故障,并因而重新启动该服务,从而导致客户流量中断。

    当客户配置了 NAT 时,可能会出现该问题。在建立使用 NAT 的新流量时,存在极少出现的争用情况,该情况可能会在 Edge 服务中触发异常,从而导致发生故障并重新启动。

    如果未修复该问题,防止出现该问题的唯一方法是禁用 NAT。

  • 修复的问题 89725:对于使用 5.1.0 之前的 Edge 软件版本的 VMware SD-WAN Edge,远程诊断实用程序 WAN 链路带宽测试和 Traceroute 可能无法正常运行。

    WAN 链路带宽测试和 Traceroute 实用程序需要为接口(用于带宽测试)或 IP 地址(用于 Traceroute)提供额外输入。在遇到该问题时,用户无法配置这些输入,因为未显示下拉菜单选项,因此任一实例中的测试都会导致错误。

  • 修复的问题 90044:如果为 VMware SD-WAN 网关配置了 ICMP 探测并重新启动网关,则 ICMP 探测不会恢复,而是保持关闭状态。

    网关重新启动后,debug.py --icmp 中的 ICMP 探测状态显示为“关闭”(DOWN)。

    在未修复该问题的网关上,解决办法是停用 ICMP 探测,然后重新激活该功能。

  • 修复的问题 90098:对于配置了分支到分支 VPN 的客户企业,在某些场景中,即使隧道因配置更改而无法启动,也会一直尝试启动隧道。

    此场景涉及 Edge 尝试创建到对等 Edge 的隧道,但对等 Edge 已脱机或更改了 IP 地址。Edge 未意识到对等体无法访问,并且一直尝试创建到不存在的目标的隧道,这将影响整体性能,并且客户无法停止该行为。

    出现该问题的原因是,未正常工作的分支到分支隧道缺少过期时间限制。此外,该问题很难进行故障排除,因为不会生成有关 Edge 在何处获取分支到分支消息回复的消息,并且连接的网关上没有用于显示对等体的有效分支到分支信息的调试命令。

  • 修复的问题 90216:当流量来自“客户端”(Client) >“分支 Edge”(Spoke Edge) >“Hub”>“服务器”(Server) 时,Traceroute 可能无法显示 VMware SD-WAN Hub Edge 的正确 IP 地址。

    如果分支 Edge 配置了业务策略以将其流量回传到 Hub Edge,并且将传输组配置为使用专用有线 (Private Wired)强制 (Mandatory),当 traceroute 数据包到达 Hub Edge 时,Hub Edge 将使用不正确的 IP 地址(在本例中为公用 IP 地址,而不是专用 IP 地址)来响应 traceroute。

  • 修复的问题 90884:对于使用 Hub 集群/分支拓扑的客户企业,在将集群中的 Hub Edge 重新分配给一个或多个分支 Edge 时,这些分支 Edge 位置中的用户可能会发生流量故障。

    在企业升级 Edge 软件时,可能会将集群中的 Hub Edge 作为集群重新均衡的一部分进行重新分配,因此,可能会在升级后观察到该问题。在遇到该问题时,VMware SD-WAN 网关不会将新的分支 Edge 路由发送到 Hub Edge,因为网关预计所有 Hub Edge 具有所有分支 Edge 路由,因此,在 Hub Edge 的路由表中不包含这些路由。结果是,分支 Edge 和集群中的 Hub Edge 之间的流量将会受到影响,因为转发路径已关闭。

    在未使用修复了该问题的网关的企业中,如果遇到该问题,可以在 Hub Edge 上执行 route reinit 以暂时解决该问题。不过,在重新分配新的 Hub Edge 时,可能会再次出现该问题。

  • 修复的问题 91164:如果客户企业部署了 Hub/分支拓扑并且配置了 VMware SD-WAN Hub Edge 以实现高可用性,则在 HA 故障切换后,HA Hub Edge 可能无法转发 Internet 回传流量。

    该问题仅限于以下场景:在将回传流量配置为使用非 WAN 覆盖网络接口通过静态路由进行路由时,备用 Edge 不会为 Internet 回传流量设置目标路由。在 HA 故障切换中将备用 Edge 升级为活动 Edge 时,这些因素会导致 Internet 回传流量失败。

  • 修复的问题 91188:使用“远程诊断”(Remote Diagnostics) >“Ping”并选择 VLAN 接口作为源接口来对连接到交换接口上的 VLAN 的主机执行 IPv6 ping 操作将失败。

    只有 VMware SD-WAN Edge 可以识别源接口名称“VLAN-x”,而 Edge 操作系统需要“br-networkx”形式的源接口,因为在 Edge 操作系统中,VLAN 接口是使用该名称创建的。

  • 修复的问题 91203:如果客户企业配置了 Hub/分支拓扑,且在该拓扑中 VMware SD-WAN 分支 Edge 配置为通过 Hub Edge 回传流量,则用户可能会发现回传流量的流量性能较差。

    Hub Edge 上的回传分支由源路由类型和目标路由类型(换言之,源 = 企业,目标 = 云)确定,但这种方法可能会导致不一致的行为,因为它依赖于基于路由更改的事件,并且可能会导致丢弃回传流量的数据包。对该问题的修复是,根据分支 Edge 的消息传递确定回传分支。

  • 修复的问题 92454:在“目标”(Destination) 字段中输入仅解析为 IPv4 地址的域名时,“远程诊断”(Remote Diagnostic) >“Traceroute”将不起作用。

    如果域名仅解析为 IPv4 地址,则通过“远程诊断”(Remote Diagnostic) 执行的 Traceroute 命令将不起作用。这是因为 VMware SD-WAN Edge 始终尝试解析 IPv6 记录的域名,而无法找到 IPv4 地址。

    在未进行该修复的 Edge 上,解决办法是直接在 Traceroute 命令中使用与域名对应的 IPv4 地址。可以通过向远程诊断 (Remote Diagnostic) > DNS 测试 (DNS Test) 提供域名来获取 IPv4 地址。

  • 修复的问题 92758:具有高可用性拓扑的站点可能会在 VMware SD-WAN HA Edge 上出现多个不同的问题,包括 LED 状态不正确或 HA 故障。

    即使活动 Edge 已启动且 WAN 链路也已启动且稳定,该 Edge 上的 LED 状态也显示为黄色而不是绿色,这是不正确的。

    该问题可追溯到 Edge 上的共享内存损坏,这种损坏以多种形式表现出来。这可以通过使用 getcntr 工具获取特定域(如 vcedge.com)的计数器来确认。该工具的输出会显示“域不存在”(Domain does not exist),并且未找到计数器名称。

    VMware SD-WAN 依赖 ftok() 系统调用来获取 SYSV 共享内存的键。ftok() 使用 inode 的后 16 位来计算键值。当 inode 编号相差至少 64K 时,这可能会导致键冲突。发生此类冲突时,动态隧道共享内存计数器可能会损坏全局共享内存变量,从而导致出现多个可能的 Edge 问题,包括 LED 状态不正确、计数器无法使用或 HA 故障。

  • 修复的问题 93062:当用户在 VMware Orchestrator 上运行远程诊断“接口状态”(Interface Status) 时,Orchestrator 会为该测试返回错误且未完成测试,或者该测试不会返回路由接口的结果。

    显示的错误消息为“读取测试数据时出错 (error reading data for test)”。如果测试完成,则路由接口的结果为空,不显示任何有关速度或双工的信息。无论哪种情况,“接口状态”(Interface Status) 均为已断开。此问题与作为“接口状态”(Interface Status) 基础的调试命令有关,该命令会忽略激活了 DPKD 的端口。

    在未进行该修复的 Edge 上,用户需要为 Edge 生成诊断包以查看路由接口的状态

  • 修复的问题 93853:在高负载条件下,VMware SD-WAN 网关可能会发生数据平面服务故障并显示 SIGXCPU 代码,从而重新启动该服务以进行恢复。

    在高负载条件下,执行各种活动(例如路由和日志记录)的多个网关线程 CPU 资源不足,并且无法在规定的时间范围内完成任务。网关服务将这些滞后线程解读为死锁,并在后续网关数据平面进程终止时引发 SIGXCPU 信号。

  • 修复的问题 94204:用户可能会发现,尝试为支持 VNF 的 VMware SD-WAN Edge 生成诊断包将失败。

    由于支持 VNF 的 Edge 磁盘空间不足,无法在该 Edge 上完成诊断包。如果 Edge 生成了一个或多个核心文件,并且 Edge 将这些核心文件发送到 /vnf/tmp 文件夹,则可能会引发该问题。每个核心文件都会解压缩到 /vnf/tmp 文件夹中,由于核心文件在解压缩后的大小会快速填充此文件夹的空间,因此导致诊断包生成失败。 

    支持 VNF(虚拟网络功能)的 Edge 包括以下型号:520v、620、640、680 和 840。

  • 修复的问题 94401:在启用了有状态防火墙的 VMware SD-WAN Edge 上,已建立的 TCP 流量可能会过快超时并刷新。

    已建立的 TCP 流量将被视为未建立的 TCP 流量,并且可能会受较短超时的约束。在 TCP 流量中出现 TCP 重置 (RST),然后进行 TCP 三向握手时,即使 TCP 状态显示为“已建立”(Established),流量也会在受到未建立的 TCP 流量超时约束后刷新。

  • 修复的问题 94612:可能无法访问传输到 BGP 网络前缀的流量。

    遇到此问题时,BGP 网络前缀不会在 BGP 下配置,并且不会通告到对等节点。

    在未修复此问题的 Edge 上,唯一的解决办法是删除 BGP 网络并重新配置这些网络。

  • 修复的问题 94775:如果客户企业使用 Hub/分支拓扑,且在该拓扑中 VMware SD-WAN 分支 Edge 通过 Hub Edge 回传其流量,则客户端用户可能会发现流量性能问题。

    导致该问题的原因是,为回传的流量设置了错误标记,回传的数据包将在分支 Edge 上处理,就像在 Hub Edge 上处理一样。这会导致 Hub 上出现路由查找问题,并且回传数据包将被丢弃。

  • 修复的问题 94980:对于使用高可用性拓扑部署的站点,在为 HA Edge 配置 PPPoE WAN 链路后,VMware SD-WAN 备用 Edge 可能会发生数据平面服务错误并重新启动。

    检查备用 Edge 生成的内核时,用户会在配置 PPPoE 链路后看到消息 vc_is_use_cloud_gateway_set

    在未修复此问题的 HA 站点上,客户需要确保仅在维护时段内配置 PPPoE 链路以管理此问题的风险。

  • 修复的问题 95047:当安全端口扫描实用程序扫描未激活 Edge Network Intelligence(分析)的 VMware SD-WAN Edge 时,扫描将报告 Syslog 端口 514 已关闭,这意味着可以访问该端口。

    Edge Network Intelligence 将侦听端口 514 (Syslog)。如果未激活分析,则端口 514 仍可访问,但不会响应请求。因此,端口扫描程序会将该端口报告为“已关闭”(换言之,该端口可以访问,但没有应用程序对其进行侦听)。

  • 修复的问题 95121:在 VMware SD-WAN Edge 型号 510-LTE 或 610-LTE 中使用“锁定的 SIM 卡”(使用密码锁定的 SIM 卡)时,客户会在网络中建立连接时遇到故障。

    在 Edge 510-LTE 和 610-LTE 型号的 SIM 卡插槽中使用锁定的 LTE SIM 卡时,用户会在建立路径时遇到故障,因为在 Orchestrator 中 SIM 卡解锁将不起作用,这是由于 Edge 的 ModemManager 脚本中缺乏对锁定 SIM 卡的支持。

  • 修复的问题 95501:对于使用 Hub/分支拓扑和 BGP 进行路由的客户企业,VMware SD-WAN 分支 Edge 的客户端用户可能会发现流量性能较差。

    管理员会观察到,分支 Edge 首选使用上行链路社区属性进行标记的路由,这些路由来自其配置文件中未包含的 Hub,而不是配置为用于该分支 Edge 的 Hub Edge。这是因为分支 Edge 流量采用上行链路前缀的动态分支到分支路径。

    导致该问题的原因是,SD-WAN 重置上行链路标记以路由从 Hub Edge 收到的消息。因此,在构建动态分支到分支隧道时,将为这些上行链路前缀安装直接路由,从而导致路由欠佳并且流量性能降低。

  • 修复的问题 95565:在使用高可用性拓扑的站点上,VMware SD-WAN 活动 Edge 可能会发生数据平面服务故障,并生成核心文件,同时触发高可用性故障切换。

    触发该问题的原因是,活动 Edge 的 WAN 链路抖动一次或多次(快速地关闭然后启动),同时还在频繁进行 SNMP 查询时使用 SNMP。存在一个计时问题,即,接口重新启动和 SNMP 查询一起执行时可能会触发死锁,从而导致数据平面服务发生故障并生成核心文件。虽然只一次 WAN 链路抖动便可能会导致该问题,但 WAN 链路抖动的频率越高,发生该问题的可能性就越大。

    在出现该问题并且未进行修复的 HA Edge 对上,解决办法是禁用 SNMP,因为这是一个计时问题,这会降低风险,但不会消除风险。

  • 修复的问题 96626:如果为 VMware SD-WAN Edge 接口分配了辅助 IP 地址,则通过辅助 IP 地址进行连接时将失败。

    从另一个分支发送到辅助网络中的 IP 的任何请求都将从主 IP 地址(而非辅助 IP 地址)生成 ARP。因此,ARP 将保持未解析状态,从而导致通过辅助 IP 地址的流量失败。

  • 修复的问题 96739:当用户在 VMware SASE Orchestrator 上查看 VMware SD-WAN Edge 的“监控”(Monitor) >“应用程序”(Application) 选项卡时,屏幕可能会显示域名错误的目标 FQDN。

    当 Edge 的统计信息达到其限制(称为溢出情况),并且 Orchestrator 没有将这些统计信息显示为“溢出”(Overflow),而是在“应用程序”(Application) 选项卡的“目标 FQDN”(Destination FQDN) 中显示随机域名时,可能会出现该问题。

  • 修复的问题 96994:在 VMware SD-WAN Edge 上执行 SNMP 遍历时,某些接口可能不可见。

    缺少的接口可能是应在 snmpwalk 上可见的有效接口。但是,由于 Edge 的硬件列表中显示无效接口,因此在列表中的无效接口之后显示的有效接口将不可见或不会由 snmpwalk 返回。如果此处的接口显示在硬件列表中,但在 Edge 上运行 ifconfig 命令时没有显示,则该接口将无效。

    虽然该问题可能会影响任何 Edge,但在使用 Azure 部署的虚拟 Edge 上遇到该问题的几率更大。这是因为 Azure Edge 倾向于在其硬件列表中列出更多数量的接口,而不是使用 ifconfig 在 Edge 本身中标识的接口数量。

  • 修复的问题 97152:如果客户企业的业务策略将“服务组”(Service Group) 配置为任何有线链路并将“链路模式”(Link Mode) 配置为“可用”(Available),则当有线链路关闭时,流量不会转向到无线链路,并且站点中的客户端用户会观察到与该规则匹配的流量失败。

    如果业务策略规则明确将“服务组”(Service Group) 配置为有线 WAN 链路,将“链路模式”(Link Mode) 配置为“可用”(Available),并且在站点中具有可用的无线链路,则预期情况是,如果服务组中的有线链路关闭(换言之,变为不可用),则使用该规则的流量将故障切换到有线 WAN 链路,以确保与该规则匹配的流量无缝传输。在该问题中,不会将流量转向到无线链路。

  • 修复的问题 97321:从用户在 VMware SD-WAN Edge 上激活 Edge Network Intelligence 分析时起,Edge 可能会触发 Edge 服务重新启动,每次重新启动都会导致客户流量中断 10-15 秒。

    在 Edge 上启用分析后,Edge 可能会发生内存不足情况,然后出现“双重释放“(double free) 内存状态。Edge 将重新启动其服务以还原内存。

    激活分析后,可能会多次发生该问题的症状。

  • 修复的问题 99718:使用 SVI(交换机虚拟接口)上的辅助 IP 地址时,不会建立 BGP 邻居。

    在 Edge 处理输入数据包时,它将验证输入数据包的目标地址是否与输入接口的 IP 地址匹配。由于只会比较主 IP 地址,将目标 IP 地址作为辅助 IP 地址的数据包会被丢弃。因此,不会在此辅助 IP 上建立 BGP 会话。

  • 修复的问题 100363:VMware SD-WAN 网关可能会发生数据平面服务故障并触发服务重新启动,从而导致流量中断 1-5 秒。

    压力测试期间会出现该问题,其中在 futex_abstimed_wait 时发生故障,并导致线程死锁,从而触发服务故障并重新启动。

解决的 Orchestrator 问题

Orchestrator 版本 R51010-20231215-GA 中解决的问题

Orchestrator 内部版本 R51010-20231215-GA 于 2023 年 12 月 18 日发布,它是版本 5.1.0 的第 10 个 Orchestrator 汇总内部版本。

该 Orchestrator 汇总内部版本解决了自第 9 个 Orchestrator 汇总内部版本 R5109-20231003-GA 以来存在的以下重要问题。

  • 修复的问题 117941:“VLAN 通告”(VLAN Advertise) 复选框在 Orchestrator UI 上始终显示为未选中状态。

    即使用户选中 VLAN 通告 (VLAN Advertise) 复选框并保存更改 (Saves Changes),Orchestrator UI 上的 VLAN 通告 (VLAN Advertise) 复选框也会恢复为未选中状态。

  • 修复的问题 125006:对于配置了灾难恢复 (DR) 拓扑的 VMware SASE Orchestrator,Orchestrator 的数据库可能会发生故障,这会导致备用 Orchestrator 进入错误状态,在极少数情况下,这可能会导致 Edge 和网关在 Orchestrator UI 上显示为脱机,并触发事件和警示。

    数据库状态预计会在几分钟内自动恢复,并且 DR Orchestrator 将重新同步。但是,此状态的持续时间有时可能会超出容忍期限,并且 Edge 和网关都开始将其检测信号发送到备用 Orchestrator,而不是活动 Orchestrator。因此,活动 Orchestrator 会将未收到检测信号的 Edge 和网关标记为关闭,并触发事件和警示。此问题仅出现在管理端,并且不会影响网络流量。

    在未进行修复的 Orchestrator 上,避免此问题的方法是适量增加 Orchestrator 系统属性 vco.disasterRecovery.transientErrorToleranceSecs(用于控制对失败同步的容忍期限)的值,以提供更长的自动恢复时段。

  • 修复的问题 128310:由于 Orchestrator 的数据库服务问题,VMware SASE Orchestrator 用户可能会遇到整体速度缓慢和一些 API 失败。其他副作用包括 SD-WAN 网关/Edge 在 UI 中显示为脱机、通过 Orchestrator UI 所做的配置更改未推送到目标 SD-WAN Edge,以及失去报告功能。

    出现这些问题的原因是,Orchestrator 的数据库服务失败,并显示错误:“打开的文件过多”(too many open files)。VMware SASE Orchestrator 上的操作员用户可以通过日志观察到此错误。通过 UI 访问 VMware SASE Orchestrator 的企业或合作伙伴用户遇到速度缓慢以及间歇性 API 失败,从而导致 UI 上显示错误消息。

  • 修复的问题 129239:在 Orchestrator UI 的“配置”(Configure) >“配置文件”(Profile) 页面上,当用户在配置文件级别编辑任何设置并尝试保存时,他们可能会观察到 API 调用超时且不成功。

    遇到此问题时,Orchestrator UI 会在浏览器页面上显示一个红色错误横幅,指示“configuration/updateConfigurationModule 超时”(configuration/updateConfigurationModule time out)。出现此问题的原因是,其他 Orchestrator 数据库查询需要太长时间才能完成,从而导致保存新配置文件设置的尝试超时。

  • 修复的问题 131789:为组织配置单点登录 (SSO) 后,即使身份提供程序 (IdP) 响应中存在角色信息,用户也无法登录到 Orchestrator。

    如果 IdP 以嵌套 JSON 结构发送角色信息,则 Orchestrator 无法匹配通过单点登录 (SSO) 登录的用户的角色。从版本 5.0.1.7 开始,Orchestrator 可以引用并匹配 SSO 用户的角色,即使该角色存在于嵌套 JSON 结构中也是如此。如果在未修复此问题的 Orchestrator 上遇到此问题,解决办法是将 IdP 配置为直接发送角色详细信息,而不是以嵌套结构发送。

Orchestrator 版本 R5109-20231003-GA 中解决的问题

Orchestrator 内部版本 R5109-20231003-GA 在 2023 年 10 月 5 日发布,它是 5.1.0 版本的第 9 个 Orchestrator 汇总内部版本。

该 Orchestrator 汇总内部版本解决了自第 8 个 Orchestrator 汇总内部版本 R5108-20230916-GA 以来存在的以下重要问题。

  • 修复的问题 119938:对于使用自动化建立 Zscalar 隧道的客户,可能需要很长时间才能创建从 VMware SD-WAN Edge 到 Zscaler 的自动化 IPsec 隧道。

    当客户在 Edge > 设备设置 (Device Settings) 中配置 Zscaler 子位置时,这些配置可能需要很长时间才能与 Zscaler 云同步。这是因为 Zscaler 云需要更新每个子位置的记录,该过程可能很耗时。

    此问题是由 Orchestrator 上的自动化框架造成的,该框架会将 IPsec 隧道创建和子位置创建操作加入到自动化队列中。当 Edge WAN IP 发生更改时,也会将更新操作加入自动化队列中。但是,由于存在大量更新操作,队列中项目的等待时间会增加。在某些客户部署环境中,Edge WAN IP 在一天内最多可以更改 4000 次(例如,移动 WAN 链路)。

  • 修复的问题 128310:由于 Orchestrator 的数据库服务问题,VMware SASE Orchestrator 用户可能会遇到整体速度缓慢和一些 API 失败。其他副作用包括 SD-WAN 网关/Edge 在 UI 中显示为脱机状态,通过 Orchestrator UI 所做的配置更改未推送到目标 SD-WAN Edge,以及失去报告功能。

    这些问题都是由于 Orchestrator 的数据库服务失败所致,显示以下错误:打开的文件过多 (too many open files)。VMware SASE Orchestrator 上的操作员用户可以通过日志观察到此错误。通过 UI 访问 VMware SASE Orchestrator 的企业或合作伙伴用户会遇到速度缓慢以及间歇性 API 失败,从而导致 UI 上显示错误消息。

Orchestrator 版本 R5108-20230916-GA 中解决的问题

Orchestrator 内部版本 R5108-20230916-GA 在 2023 年 9 月 20 日发布,它是 5.1.0 版本的第 8 个 Orchestrator 汇总内部版本。

该 Orchestrator 汇总内部版本解决了自第 7 个 Orchestrator 汇总内部版本 R5107-20230722-GA 以来存在的以下重要问题。

  • 修复的问题 94610:当用户通过“远程操作”(Remote Actions) >“强制 HA 故障切换”(Force HA Failover) 启动强制 HA 故障切换时,VMware SASE Orchestrator 可能不会为 HA 故障切换生成并发送警示。

    由于 HA 故障切换由 Orchestrator 强制进行,因此活动和备用 Edge 都会预计到发生故障切换,这可能会导致 HA Edge 在同一检测信号中同时发送 HA_GOING_ACTIVE 和 HA_READY 消息。如果检测信号中发送的“HA 状态”(HA State) 显示为“就绪”(Ready),则会让 Orchestrator 产生误会而不生成故障切换警示,因为它仅看到此“就绪”(Ready) 消息,而并未看到“转为活动”(Going Active) 消息。

  • 修复的问题 104775:当用户在 VMware SD-WAN Edge 上将之前处于活动状态的 WAN 链路配置为备份时,VMware SASE Orchestrator UI 在“监控”(Monitor)>“Edge”>“概览”(Overview) 上无法正确显示状态。

    状态应显示为“备用空闲”(Standby Idle) 并带有灰色状态圆点,但不显示链路类型或备份状态。这是一个表面缺陷,因为 WAN 链路将作为备份执行其角色。

  • 修复的问题 105580:对于配置了 FIPS 模式的 VMware SASE Orchestrator,为 Orchestrator 设置灾难恢复 (DR) 的尝试可能会失败。

    尝试连接时 SSL_CTX_new 失败。配置了 FIPS 的 DR 设置包括使用 MySQL 8.0.28 或更高版本的 Orchestrator 内部版本,该设置会在 DR COPYING_DP 阶段失败,并显示错误消息:SSL_CTX_new failed when trying to connect

  • 修复的问题 106191:如果 Edge 使用的配置文件为任何接口配置了静态 IP 地址,则用户无法更改 VMware SD-WAN Edge 配置。

    如果尝试更改 Edge 配置,VMware SASE Orchestrator UI 将显示错误消息:“接口的探测间隔无效”(invalid probe interval for interface),并阻止保存更改。

    在未修复此问题的 Orchestrator 上,唯一的解决办法是创建一个新的配置文件,而不分配静态接口,并将其应用于 Edge。

  • 修复的问题 115981:对于使用 VMware SASE Orchestrator APIv2 的客户企业,在运行 API 以获取企业事件时,Orchestrator 仅返回一个有限集。

    具体调用为:https://\{api_host}//api/sdwan/v2/enterprises/{enterpriseLogicalId}/events。调用时,仅返回顶级层次结构,并且包含 enterpriseName、EdgeName、segmentName 或 edgeID 等详细信息。此外,APIv2 不支持图形遍历。

    在未修复此问题的 Orchestrator 上,唯一的解决办法是使用 APIv1,这会强制客户维护两组 API 系列。此外,APIv1 不支持 Cloud Web Security。

  • 修复的问题 116531:如果用户尝试在至少有一个 Edge 描述包含逗号 (,) 的 VMware SASE Orchestrator 上生成报告,则报告的格式可能会不正确。

    当 Edge 描述包含逗号(如下面的屏幕截图中所示)时,Orchestrator 的报告服务会混淆这一点,并将每个逗号后的文本分隔到报告的下一列中,而不是像预期的那样在“Edge 描述”(Edge Description) 列中包含整个文本字符串。

    因此,已传输字节数 (Bytes Transmitted) 没有关联的值,而是显示第一个逗号后的文本,接收的字节数 (Bytes Received) 将显示第二个逗号(如果有)后的文本,依此类推。报告仍将包含“已传输字节数”(Bytes Transmitted) 和“接收的字节数”(Bytes Received) 的数据,只是会推送到更右侧,且不会与正确的列对齐。

    在未修复此问题的 Orchestrator 上,用户需要确保 Edge 描述未使用逗号。

  • 修复的问题 117822:当客户查看“监控”(Monitor)>“Edge”>“QoE”时,他们可能会发现 QoE 图形中存在空缺部分,而有关 Edge 的 WAN 链路的任何问题均未说明这一点。

    出现空缺部分是 Orchestrator 数据库问题造成的,即缺少链路数据的内部作业队列,并且未回填链路数据。

  • 修复的问题 118728:在合作伙伴门户或客户企业上,可能不允许某些用户登录到 VMware SASE Orchestrator。

    即使用户具有正确的登录特权,也可能会看到错误“用户没有访问 [enterpriseProxy/getEnterpriseProxy] 所需的特权 [READ:PROXY]”(user does not have privilege [READ:PROXY] required to access [enterpriseProxy/getEnterpriseProxy])。本机身份验证和双因素身份验证都是如此。此错误实际上反映了密码已过期,即使 Orchestrator 没有告知用户这是他们无法登录的真正原因,并且用户无法重置其密码,因为他们无法登录。

    在未修复此问题的 Orchestrator 上,具有适当角色的合作伙伴或客户管理员可以向受影响的用户发送密码重置电子邮件以重置其密码。

  • 修复的问题 121085:如果合作伙伴管理员位于“全局设置”(Global Settings) >“用户管理”(User Management) >“服务权限”(Service Permissions) 页面上,“重置为系统默认值”(Reset to System Default) 选项无法按预期工作。

    对于所有自定义角色权限包,选择重置为系统默认值 (Reset to System Default) 时的预期行为是,恢复为未发布 (Unpublished) 状态,因为用户角色权限已还原为默认设置。但是,合作伙伴用户会发现一个或多个自定义包处于已发布 (Published) 状态,而且这些处于已发布 (Published) 状态的自定义包无法进行修改或删除。

  • 修复的问题 121441:当客户在 VMware SD-WAN Edge 的 VLAN 上激活“VNF 插入”(VNF Insertion) 时,Edge 会删除然后重新部署 VNF,从而使其无法供该 Edge 使用。

    在 VLAN 上激活“VNF 插入”(VNF Insertion) 后,客户会在监控 (Monitor) > 事件 (Events) 页面上看到 VNF 删除和重新部署事件,同时还会收到一封电子邮件,显示消息“(VNF_VM_DELETED) / 在 Edge <Edge Name> 上删除了未知供应商 VNF (Unknown vendor VNF was deleted on the edge <Edge Name>)”。该问题可追溯到在 VLAN 上激活“VNF 插入”(VNF Insertion) 后,Orchestrator 发送了新的 UUID(通用唯一标识符)。Edge 会将此 UUID 更改视为删除并重新部署 VNF 的触发器,从而使其无法供该 Edge 使用。

    此问题仅在新 UI 上出现。如果在未修复此问题的 5.1.x Orchestrator 上遇到此问题,请切换到经典 UI 以配置 VNF。

  • 修复的问题 121469:当用户导航到“全局设置”(Global Settings) >“用户管理”(User Management) 页面时,根据 UI 上的横幅,他们可能会发现所有用户帐户都显示为已锁定,即使大多数帐户或者可能所有帐户实际上并未锁定也是如此。

    任何用户帐户的错误消息横幅都会显示“由于登录尝试失败次数过多,此帐户已被锁定 (This account has been locked due to too many failed login attempts)”,即使在查看用户列表页面时,其状态显示为未锁定 (Unlocked),并且本地 UI 登录仍然可以使用。

  • 修复的问题 124778:在 VMware SASE Orchestrator 上使用新 UI 时,如果客户导航到“全局设置”(Global Settings) >“客户配置”(Customer Configuration),他们看不到用于配置其安全策略的选项。

    客户可以在安全策略 (Security Policy) 部分中配置其 Edge IPsec 建议 (Edge IPsec Proposal),包括“加密”(Encryption)、“DH 组”(DH Group) 等。此选项在经典 UI 上存在,但在新 UI 上缺失。

Orchestrator 版本 R5107-20230722-GA 中解决的问题

Orchestrator 内部版本 R5107-20230722-GA 在 2023 年 7 月 22 日发布,它是 5.1.0 版本的第 7 个 Orchestrator 汇总内部版本。

该 Orchestrator 汇总内部版本解决了自第 6 个 Orchestrator 汇总内部版本 R5106-20230705-GA 以来存在的以下重要问题。

  • 修复的问题 122271:在客户使用 VMware SASE Orchestrator 新 UI 将额外的 LAN 端 NAT 规则添加到配置文件时,他们可能会发现与这些规则匹配的所有流量失败。

    新 UI 错误地根据内部地址前缀计算 LAN 端 NAT 外部掩码。如果编写的规则中的内部前缀和外部前缀不相同(即,不是 1:1),在用户从新 UI 中修改任何 LAN 端 NAT 规则时,规则行为将发生变化,并且规则可能变得不起作用。

    在未修复该问题的 Orchestrator 上,客户只应使用 Orchestrator 的经典 UI 配置 LAN 端 NAT 规则。

Orchestrator 版本 R5106-20230705-GA 中解决的问题

Orchestrator 内部版本 R5106-20230705-GA 在 2023 年 7 月 6 日发布,它是 5.1.0 版本的第 6 个 Orchestrator 汇总内部版本。

该 Orchestrator 汇总内部版本解决了自第 5 个 Orchestrator 汇总内部版本 R5105-20230611-GA 以来存在的以下重要问题。

  • 修复的问题 84772:在配置文件级别将 VLAN 的 IPv6 DHCP 服务器配置为“中继”(Relay) 类型时,如果用户在 Edge 级别使用“Edge 覆盖”(Edge Override) 将类型更改为“已激活”(Activated),并且稍后禁用了“Edge 覆盖”(Edge Override),Edge 将继续使用“已激活”(Activated) 类型,而不是恢复为配置文件提供的“中继”(Relay) 类型。

    在禁用“Edge 覆盖”(Edge Override) 后,VMware SASE Orchestrator 无法实施配置文件配置,从而导致受影响的 Edge 具有错误的 IPv6 服务器设置。

  • 修复的问题 115411:对于使用 5.1.0 或更高版本并部署了灾难恢复拓扑的 VMware SASE Orchestrator,同步可能会由于数据库问题而失败。

    失败的具体进程是 dr_utils.js,在 Orchestrator 5.1.0 和更高版本上的最新数据库软件版本中弃用了该进程,从而导致出现该问题。

  • 修复的问题 115433:在查看 VMware SASE Orchestrator 的新 UI 时,具有“企业支持”(Enterprise Support) 角色的用户看不到 DHCP 配置详细信息。

    如果使用经典 UI,同一“企业支持”(Enterprise Support) 用户可以看到 DHCP 配置详细信息。

  • 修复的问题 116633:在使用 Safari 或 Firefox 登录到 VMware SASE Orchestrator 时,如果用户在配置文件级别配置了无效的 VLAN(例如 ""),然后在 VMware SD-WAN Edge 中配置了有效的 VLAN 值,仍会进行调用,但显示错误。

    未设置值的接口值应该为 Null,但此处为 vlanID = ""。如果用户使用基于 Chromium 的浏览器登录到 Orchestrator,则不会发现该问题。

  • 修复的问题 117772:对于企业客户,在查看 VMware SASE Orchestrator 的“监控”(Monitor) >“网络概览”(Network Overview) 屏幕时,如果正在监控超过 10 个 WAN 链路,则可能不会在“链路状态”(Link Status) 屏幕中包含状态为“已降级”(Degraded) 或“关闭”(Down) 的 WAN 链路。

    该问题是新 Orchestrator UI 独有的,因为前端问题没有考虑降级或关闭的 WAN 链路。监控在经典 UI 上正常工作。

  • 修复的问题 117988:在比较 VMware SASE Orchestrator 经典 UI 和新 UI 上的值时,在 VMware SD-WAN 接口下面为 OSPF 配置的“入站路由学习”(Inbound Route Learning) 和“精确匹配”(Exact Match) 复选框与 Edge 上配置的内容不匹配。

    在查看新 UI 时,“精确匹配”(Exact Match) 选项没有显示正确的值,即使该值已正确存储在 Edge 的数据库中。在经典 UI 上,将显示正确的值。

  • 修复的问题 117993:如果合作伙伴用户所管理的客户企业使用本机身份验证(即用户名/密码),那么当该合作伙伴用户或企业用户尝试重置企业用户的密码时,该操作失败。

    用户将会发现以下错误:用户没有访问 [enterpriseUser/sendEnterpriseUserPasswordResetEMail] 所需的特权 (user does not have privileges required to access [enterpriseUser/sendEnterpriseUserPasswordResetEMail])。仅在新 UI 上出现该问题,这是由缺少请求参数引起的。如果遇到该问题,用户可以切换到经典 UI,密码重置将正常工作。

  • 修复的问题 118074:用户可能无法在 VMware SASE Orchestrator 新 UI 的“配置”(Configure) >“Edge”>“设备”(Device) 页面上打开某些设备设置。

    可能无法访问的设置包括接口、IPv6、云 VPN、非 SD-WAN 目标 (NSD) 和云安全服务 (CSS)。该问题可以追溯到需要使用公用 IP 地址的 WAN 设置;如果缺少该地址,则会在新 UI 上抛出错误并阻止访问这些设置。设备设置在经典 UI 上正常工作。

  • 修复的问题 118544:用户可能会发现未加载并且无法访问操作员配置文件,因此,无法将其分配给客户企业。

    包含操作员配置文件的 Orchestrator 数据库存在问题;如果删除一个客户企业,则会将不正确的逻辑 ID 添加到配置模块中,从而禁止加载操作员配置文件。

  • 修复的问题 118733:如果使用 VMware SASE Orchestrator 的新 UI,并在配置文件级别配置业务策略或防火墙规则,然后在 Edge 级别覆盖该策略或规则,在查看“配置”(Configure) >“Edge”>“列出 Edge”(List Edges) 屏幕时,不会为设备、业务和防火墙正确显示覆盖的 Edge 图标。

    选中“Edge 覆盖”(Edge Override) 的图标应显示为纯色,而不是显示为空。如果为特定类别配置了“Edge 覆盖”(Edge Override),经典 Orchestrator 可以将图标正确显示为纯色。

  • 修复的问题 119733:VMware SASE Orchestrator 的数据库可能会发生故障并停止工作。

    该问题是由数据库不是最新的 MySQL 稳定版本引起的,在使用更新的 MySQL 版本时,Orchestrator 5.1.0.6 版本将消除该缺陷。

  • 修复的问题 120606:在“客户”(Cutomer) >“全局设置”(Global Settings) >“用户管理”(User Management) >“新建角色”(New Role) 上尝试创建新角色时,用户发现错误,并且不会加载特权。

    在创建新角色时,如果遇到该问题,用户将会在 UI 页面上看到“方法错误”(method error),并且还会禁止加载特权。

     

Orchestrator 版本 R5105-20230611-GA 中解决的问题

Orchestrator 内部版本 R5105-20230611-GA 在 2023 年 6 月 13 日发布,它是版本 5.1.0 的第 5 个 Orchestrator 汇总内部版本。

该 Orchestrator 汇总内部版本解决了自第 4 个 Orchestrator 汇总内部版本 R5104-20230426-GA 以来存在的以下重要问题。

  • 仅在新 Orchestrator UI 上出现而不在经典 Orchestrator UI 上出现的问题

    Orchestrator 版本 5.1.0.5 修复了大量问题,客户仅在使用新 UI 时才可能会遇到这些问题,而在使用经典 UI 时则不会遇到。下表列出了所有此类修复以及针对每个问题症状的描述。

    解决的仅新 UI 存在的问题

    请求单

    症状/描述

    修复的问题 87089

    监控 (Monitor) > Edge (Edges) > 源 (Sources) 页面上,用户没有编辑客户端地址的选项。此修复添加了一个蓝色铅笔图标,可以单击该图标来编辑条目。

    修复的问题 112044

    对于部署了 Zscaler 类型的通过 Edge 的非 SD-WAN 目标的站点,在查看监控 (Monitor) > 网络服务 (Network Services) 时,新 UI 不会在部署状态 (Deployment Status) 页面下显示“IaaS 订阅”(IaaS Subscriptions) 列。

    修复的问题 112451

    当用户编辑某个配置文件,并且在设备 (Device) > 接口 (Interfaces) > 您的 Edge 型号 (Your Edge Models) 下,用户选择了“Edge 3810”时,Web 浏览器页面停止响应且无法保存,用户必须刷新该页面才能恢复。客户无法将 Edge 3810 用于该配置文件。

    修复的问题 112500

    对于部署了 Zscaler 类型的云安全服务 (CSS) 的站点,在查看监控 (Monitor) > Edge (Edges) 并将鼠标悬停在某个 Edge 的 Edge 隧道上时,UI 不显示 Zscaler CSS 城市和省/自治区/直辖市。

    修复的问题 112809

    对于具有“企业只读”(Enterprise Read Only) 角色的客户管理员,他们可以在 UI 上查看监控 (Monitor) > 路由 (Routing) 页面。

    修复的问题 112906

    用户可能会观察到 UI 页面以奇怪的格式加载,其中页面包含大片空白区域。

    修复的问题 112912

    对于具有“企业支持”(Enterprise Support) 角色的客户管理员,没有可供其为 Edge 选择远程操作 (Remote Actions) > 重新引导 (Reboot) 的选项。

    修复的问题 113254

    具有“超级用户”(Superuser) 或“标准”(Standard) 角色的合作伙伴管理员无法为其管理的客户更改默认操作员配置文件。

    修复的问题 113366

    用户无法配置下一跃点为 VLAN 辅助 IP 的静态路由。

    修复的问题 113963

    如果用户创建防火墙规则并为该规则设置了一个应用程序,然后编辑该同一规则并更改应用程序,则不会应用所做的更改,该规则会保留之前的应用程序。

    修复的问题 114291

    如果在配置文件上配置了云安全服务 (CSS),则在多个不同分段上更改 CSS 后,用户无法在分段之间切换,并且没有机会保存设备设置 (Device Settings)

    修复的问题 114564

    用户无法在 Edge 接口的可选配置下配置 802.1P 设置 (802.1P Setting)

    修复的问题 114602

    服务设置 (Service Settings) > 警示和通知 (Alerts & Notifications) 下面,用户没有配置操作员警示或企业警示的选项。

    修复的问题 114912

    合作伙伴概览 (Partner Overview) 页面不包含用户协议 (User Agreement) 设置。

    修复的问题 115307

    如果用户会话空闲了足够长时间从而触发超时,UI 不会显示注销消息,而是会进入睡眠模式;当用户访问 UI 时,Orchestrator 会“唤醒”并允许用户访问 Orchestrator,而不是将其重定向到登录页面。

    修复的问题 115439

    当用户导航到配置 (Configure) > 配置文件 (Profile) > 设备设置 (Device Settings) > BGP 时,他们将观察到 BGP 存在,但如果按分段感知 (Segment Aware) 进行排序,此时将缺少用于配置 BGP 的选项。

    修复的问题 115653

    当合作伙伴管理员查看其管理客户 (Manage Customers) 页面时,UI 不会告知客户是否正在使用处于静默服务状态的网关。这使合作伙伴无法及时采取操作,以确保客户只使用活动网关。

    修复的问题 115719

    如果在配置文件级别对设备设置 (Device Settings) 进行了任何更改,回传规则将从配置 (Configure) > 业务策略 (Business Policy) 页面消失。

    修复的问题 116523

    如果用户配置 VNF 插入配置并尝试在 Edge 中配置 VNF 高可用性,则在配置 HA 后,Orchestrator 不会保存 VNF 更改。

    修复的问题 117527

    当用户在配置文件级别配置 BGP 时,如果配置了大量规则,浏览器可能会变得无响应。

  • 修复的问题 105861:当 WAN 链路关闭几分钟,然后重新启动时,“监控”(Monitor) >“QoE”图表不会反映实际的链路状态。

     QoE 应在链路关闭时显示红色,然后在链路恢复时重新显示正常颜色(如果质量良好,则为绿色),但这种情况并未发生,从而给用户造成了困惑。出现该问题的原因是,VMware SASE Orchestrator 的数据库未正确记录链路关闭事件。

  • 修复的问题 106295:对于 AWS 类型的非 SD-WAN 目标,在设置配置了 BGP 的主网关和辅助网关时,VMware SASE Orchestrator 可能会将冗余辅助隧道显示为“关闭”(down),即使它们处于启动状态也是如此。

    AWS 端会将主隧道和辅助隧道报告为“启动”(up),但是在 Orchestrator 的监控 (Monitor) > 网络服务 (Network Services) 页面上,辅助隧道显示为“关闭”(down)。严格来说,这只是一个表面问题。

  • 修复的问题 107180:用户为 VNF 配置 Fortinet 类型时,他们在下拉菜单中看不到 Fortinet 映像版本 6.49 或 7.2.0。

    版本 5.1.0 支持这些映像,但客户无法访问这些映像。

  • 修复的问题 107766:如果客户配置了通过 Edge 的非 SD-WAN 目标或云安全服务 (CSS),并且还配置了“第 7 层 (L7) 运行状况检查”(Layer 7 (L7) Health Check) 选项,则客户可能会发现,与基于其 L7 运行状况检查配置值时应发生的情况相比,隧道意外地被标记为关闭或启动。

    问题在于,无论客户的配置如何,Orchestrator 都会将默认 L7 运行状况检查参数推送到 VMware SD-WAN Edge。因此,即使隧道的条件与客户配置的内容匹配,隧道状态也可能保持不变,因为它遵循默认的 L7 运行状况检查值。

  • 修复的问题 110826:在将 VMware SD-WAN Edge 分配给客户企业后,VMware SASE Orchestrator 不会自动将该 Edge 移动到 Maestro 清单管理应用程序中的“分配的清单”(Assigned Inventory) 选项卡。

    当从 Maestro 请求未分配的 Edge,并且 Orchestrator 查找已分配的序列号时,不会比较 Edge 型号,这会导致 Edge 被分配两次的问题。

  • 修复的问题 111957:操作员升级 VMware SASE Orchestrator 后,用户可能会发现与长时间运行的架构更新失败相关的错误。例如,OFC 页面中可能缺少新学习的路由(BGP 或 OSPF)。Orchestrator 的上载日志中也会发现与学习的路由相关的错误。

    VELOCLOUD_LEARNED_PARTNER_ROUTE_ASSOC 上的外键被丢弃,然后作为一个长期运行的架构更新,被重新添加到从版本 4.2.x 升级到版本 4.3.x 或更高版本的 Orchestrator 上。在升级途径通过某个存在升级缺陷的 2.1.x 内部版本,“且”正在学习 BGP 路由的网关已从 Orchestrator 中删除的 Orchestrator 上,此外键尚不存在。在此类 Orchestrator 中,如果表中已存在违反记录的外键,在从 4.2.x 升级到 4.3.x 及以上版本时添加外键失败。

    对此问题的修复通过删除违反记录的外键,然后重新添加外键,更正了根本原因。

    如果在未修复此问题的情况下升级到某个 Orchestrator,解决办法是在 VeloCloud 架构中运行以下查询:MySQL: DELETE FROM VELOCLOUD_LEARNED_PARTNER_ROUTE_ASSOC WHERE gatewayId not in (select id from VELOCLOUD_GATEWAY),然后重新触发长时间运行的架构更新。

  • 修复的问题 112333:如果 VMware SASE Orchestrator 处理约 4000 个 VMware SD-WAN Edge,并且这些 Edge 具有约 6000 个隧道和持续流量,则 Orchestrator 可能会在约 4 天的时间内变得不稳定,并开始随机注销用户。

    这种压力会导致 Orchestrator 的数据库出现故障,并触发错误“connect ECONNREFUSED”,后跟 Orchestrator 的 IP 地址。此问题仅在规模测试环境中出现,而并未在现场部署中出现。

  • 修复的问题 112605:客户可能会发现,在尝试通过“配置”(Configure) >“设备”(Device) >“云 VPN”(Cloud VPN) >“Edge 到 SD-WAN 站点”(Edge to SD-WAN Sites) 分配 Hub 集群时,配置文件无响应,并且无法保存配置。

    Orchestrator 会创建具有多个回传业务策略的重复配置关联,而重复的引用会导致配置和分配 Hub 集群失败。

  • 修复的问题 112992:将客户企业从一个 VMware SASE Orchestrator 迁移到另一个 VMware SASE Orchestrator 时,Orchestrator 会添加一条 UUID 记录。

    该 UUID 记录会被添加到 VELOCLOUD_ENTERPRISE_OBJECT 记录中,而原本不应添加该记录。

  • 修复的问题 113209:如果 VMware SD-WAN Edge 处于“已降级”(Degraded) 状态,则用户无法从 SASE Orchestrator 中删除该 Edge。

    Orchestrator 抛出了以下错误消息:“无法删除已降级的 Edge 和已连接的 Edge”(Degraded edges and connected edges cannot be deleted)。虽然用户应该无法删除已连接的 Edge,但应该能够删除已降级的 Edge。 

  • 修复的问题 113375:对于使用灾难恢复 (DR) 拓扑部署的 VMware SASE Orchestrator,当 Orchestrator 从 4.5.x 升级到 5.1.x 时,升级可能会失败。

    升级脚本和 iptables 均失败,返回代码为 1。在活动和备用 Orchestrator 运行不同的软件版本期间,可能会触发该问题;当备用 Orchestrator 尝试升级时,iptables 未正确加载(这是预期和临时性行为),该错误导致整个升级失败。此修复仅将 iptables 错误转换为警告并允许继续升级。

  • 修复的问题 114240:在“Edge IPsec 建议”(Edge IPsec Proposal) 下,当用户将“加密”(Encryption) 更改为 AES-128-GCM 或 AES-256-GCM 并保存配置时,Orchestrator UI 抛出错误。

    这个错误的内容如下:“instance.ipsec.encryption 不是以下枚举值之一: AES_128_CBC、AES_256_CBC、DES_CBC”(instance.ipsec.encryption is not one of enum values: AES_128_CBC, AES_256_CBC, DES_CBC)。出现此问题的原因是,两个 GCM 类型的加密在不是有效选项的情况下被错误地添加到加密 (Encryption) 菜单中。更新后的 Orchestrator 中移除了这些选项。

  • 修复的问题 115624:重新启动门户服务时,VMware SASE Orchestrator 可能会遇到 CPU 占用率高、不稳定以及“设备设置”(Device Settings) 和“网络设置”(Network Settings) UI 页面加载缓慢的问题。

    此问题是在连接了约 2000 个 Edge 并且还使用云安全服务 (CSS) 的 Orchestrator 上发现的;如果连接的 Edge 数达到或超过此数量,则可能会出现此问题。导致此问题的原因是,存在多个与将 Edge、配置文件和网络配置从 Edge 上载到 Orchestrator 相关的 Orchestrator 进程,并且完成这些进程所花费的时间比预期长得多(约 60 秒或更长时间)。

  • 修复的问题 116141:在用户更改配置文件中的设备设置时,VMware SASE Orchestrator 需要太长的时间以验证更改。

    每项更改可能需要长达一分钟的时间来验证并应用,而该操作本应只需几秒钟即可完成。此问题可追溯到一个 Orchestrator 进程,该进程不仅检索与该配置文件关联的所有 Edge 配置记录计数,而且还会解码和分析每个记录,这种解码和分析行为既不必要,又会对 Orchestrator CPU 造成负担。此修复可确保该进程仅检索记录计数。

  • 修复的问题 116770:当操作员用户在信任根中创建链长度为 2 或更长的外部证书颁发机构 (CA) 时,VMware SASE Orchestrator 不允许从属中的 pathLengthConstraint 值为 0

    不允许辅助证书颁发机构签署其下的从属证书是一个有效配置,Orchestrator 应允许使用该配置,但某个进程阻止保存该配置。

  • 修复的问题 116790:在将 VMware SASE Orchestrator 升级到 5.1.x 或更高版本时,客户 VMware SD-WAN Edge 可能会无意中降级到比 Edge 配置使用的版本更旧的 Edge 版本。

    从 Orchestrator 中删除客户企业时,如果删除的企业在 Orchestrator 数据库中按其逻辑 ID 与操作员配置文件相关联,则会触发此问题。删除企业后,操作员配置文件也会被删除。如果客户配置了 Edge 映像管理 (Edge Image Management) 且具有多个可用的操作员配置文件,并将该已删除的操作员配置文件指定为默认设置,则会为其分配一个操作员配置文件,该配置文件将保留在其 Edge 映像管理 (Edge Image Management) 菜单中。因此,可能为客户分配一个包含低得多的 Edge 版本的操作员配置文件,如果分配了该操作员配置文件的 Edge 现在运行的旧版本不支持客户使用的功能,这些 Edge 可能会更改其软件并且可能会进行降级,从而可能会产生破坏性影响,包括网络故障。

  • 修复的问题 116976:在合作伙伴管理员登录到 VMware SASE Orchestrator 时,合作伙伴可能会发现,对于其管理的 VMware SD-WAN Edge 上已关闭超过 24 小时的 WAN 链路,Orchestrator 未显示正确的链路状态。

    Orchestrator API 仅为合作伙伴/MSP 返回最近的链路,而常规客户企业用户可获得正确的链路状态信息,这会影响合作伙伴针对链路问题为客户提供正确支持的能力。

  • 修复的问题 117800:将 VMware SASE Orchestrator 从版本 4.x 升级到 5.1.x 或更高版本时,操作员可能会发现,在后端进程重新启动后,会创建相同的 upgradeSchema.sql 文件,即使已成功执行该文件也是如此。

    在升级后架构更新时会出现此问题,在执行后期架构脚本后,不应再次生成 upgradeSchema.sql 文件。

  • 修复的问题 118071:如果为客户分配了多个 VMware SD-WAN 网关,且所有网关都分配了约 2000 多个 Edge,则用户尝试在“配置”(Configure) >“配置文件”(Profile) >“设备”(Device) 中更改 VPN 设置时可能会失败并显示错误。

    Orchestrator 错误消息为“验证更改时出错”(Error validating changes)。VMware SASE Orchestrator 无法更新 VPN 设置,因为 API 正在等待返回记录超过 10000 行的数据库查询,这种情况在大规模运行的 Orchestrator 中可能会发生。出现此问题的原因是,Orchestrator 会获取所有网关,而不考虑网关类型(即主网关和辅助网关),而它本应只让 Edge 报告其主网关。这极大增加了返回的记录数,并且可能会大规模溢出查询。

Orchestrator 版本 R5104-20230426-GA 中解决的问题

Orchestrator 内部版本 R5104-20230426-GA 在 2023 年 4 月 27 日发布,它是版本 5.1.0 的第 4 个 Orchestrator 汇总内部版本。

该 Orchestrator 汇总内部版本解决了自第 3 个 Orchestrator 汇总内部版本 R5103-20230315-GA 以来存在的以下重要问题。

  • 仅在新 Orchestrator UI 上出现而不在经典 Orchestrator UI 上出现的问题

    Orchestrator 版本 5.1.0.4 修复了大量问题,客户仅在使用新 UI 时才可能会遇到这些问题,而在使用经典 UI 时则不会遇到。下表列出了所有此类修复以及针对每个问题症状的描述。

    解决的仅新 UI 存在的问题

    请求单

    症状/描述

    修复的问题 104785

    当用户位于监控 (Monitor) > 事件 (Events) 页面上并单击“事件”(Events) 刷新按钮时,“事件”(Events) 表时间戳不会更新,而且除非重新加载 Web 浏览器页面,否则最近的事件不会显示在表中。

    修复的问题 106327

    当用户位于监控 (Monitor) > 事件 (Events) 页面上并为事件配置筛选器时,某些筛选器选项会缺失,因而限制 Edge 事件的筛选方式。

    修复的问题 107071

    当用户位于监控 (Monitor) > 事件 (Events) 页面上并选择一个足够大的时间段以返回超过 5M 的事件时,页面会超时并且无法加载。

    修复的问题 107980

    当用户位于配置 (Configure) > Edge > 概览 (Overview) 页面上时,如果本地联系人数据为空,那么除非他们还填写了联系人和位置 (Contact & Location) 数据,否则将无法更改 Edge 的名称。

    修复的问题 108072

    当用户尝试在不同分段上配置具有相同 IP 地址的环回接口时,Orchestrator 会阻止该操作,并显示警告消息“必须是唯一的”(Must be unique)。

    修复的问题 109284

    当用户为 Azure 类型或 Zscaler 类型的通过 Edge 的非 SD-WAN 目标 (NSD) 添加隧道时,可以编辑“本地标识类型”(Local Identification Type)、“本地标识”(Local Identification) 和“PSK”字段。

    修复的问题 109300

    当用户查看 Orchestrator 中要配置许可证的任何区域时,用户只能看到选定的许可证,而看不到任何其他许可证。选择一个许可证选项后,Orchestrator 会筛选掉所有其他许可证选项;此问题的修复在许可证下拉菜单右侧添加了一个新的“清除”(Clear) 按钮,以允许选择其他许可证选项。

    修复的问题 109532

    查看配置 (Configure) > 网络服务 (Network Services) 页面时,新 UI 与经典 UI 上的 DNS IP 地址不同,因为新 UI 显示的是不同的字段。

    修复的问题 109533

    配置 (Configure) > Edge > 设备 (Device) > 连接 (Connectivity) > VLAN 页面上,当应该显示更准确的“中继”(Relay) 状态时,DHCP 服务器显示为“已启用”(Enabled)

    修复的问题 109715

    已关闭的 WAN 链路在 24 小时后从监控 (Monitor) > 网络概览 (Network Overview) 页面消失,即使将 Edge 链路关闭限制 (Edge Down Link Limit) 设置为大于 24 小时的值也是如此。

    修复的问题 109788

    配置任何非 SD-WAN 目标时,用户无法使用 0.0.0.0/0 值配置站点子网 (Site Subnet),并且 Orchestrator 将其声明为“CIDR 前缀无效”(Invalid CIDR Prefix)。

    修复的问题 109836

    在新 UI 上配置合作伙伴网关静态路由时,不会将这些路由分发到 Edge。这些路由应作为云路由(类型 = 云)分发到连接的 Edge,并显示在路由表转储中,但事实并非如此。

    修复的问题 109911

    配置业务策略时,在链路转向 (Link Steering) > 接口 (Interfaces) 部分中,如果 WAN 覆盖网络类型为“已禁用”(Disabled),则无法选择该接口。新 UI 仅允许与自动发现或用户定义的 WAN 覆盖网络相关的接口。

    修复的问题 110094

    在编辑 Edge 接口并一次向 OSPF 添加大量筛选器时,筛选网格会消失。如果添加了足够的 OSPF 筛选器以在 OSPF 筛选网格中显示分页,网格高度将设置为 0,并且用户无法再编辑或查看筛选网格。

    修复的问题 110330

    合作伙伴和客户管理员可能看不到全局设置 (Global Settings) > 服务权限 (Service Permissions) 选项卡,即使他们的角色允许查看也是如此。服务权限 (Service Permissions) 是记录用户角色自定义的位置。

    修复的问题 111104

    在查看服务设置 (Service Settings) > Edge 管理 (Edge Management) > 软件和固件映像 (Software & Firmware Images) 页面时,如果用户展开表底部的行,他们将看不到所有详细信息。

    修复的问题 111407

    当用户位于配置 (Configure) > Edge > 设备 (Device) > 连接 (Connectivity) > 接口 (Interfaces) 页面上时,用户无法在没有同时添加 WAN 链路的情况下配置用户定义的接口。

    修复的问题 111444

    在配置 Zscaler 类型的云安全服务 (CSS) 时,用户无法使用某个 URL 配置 Zscaler 登录 URL (Zscaler Login URL) 并收到消息“FQDN 无效”(FQDN is invalid),也不会将登录 URL 值发送到服务器并保存。

    修复的问题 111934

    在更新 Zscaler 类型的通过 Edge 的非 SD-WAN 目标的任何字段时,Orchestrator 会移除 DH 组 (DH Group) 字段。

    修复的问题 111944

    操作员超级用户无法修改或删除系统属性 (System Property)

    修复的问题 112094

    如果用户在非全局分段上更改云安全服务 (CSS) 的凭据,并且在同一会话中切换到全局分段,则 CSS 凭据将被移除。

    修复的问题 112201

    如果用户通过 API 配置云安全服务 (CSS),并将 CSS 设置为“无”(None)(空),则在 VMware Edge 的 CSS 配置下,Orchestrator 将不会显示配置,但 Edge 的数据库和 API 响应已启动 CSS 并正常运行。处于此状态的 CSS 不能在业务策略中使用。

    修复的问题 112224

    当具有超级用户、标准或支持角色的客户管理员导航到诊断 (Diagnostics) 时,即使其角色允许访问诊断包 (Diagnostic Bundles) 页面链接,此部分也不存在。因此,客户管理员无法生成(且无法下载)诊断包,也无法生成和下载数据包捕获。

    修复的问题 112437

    如果用户为同一 Edge 打开多个远程诊断 (Remote Diagnostics) 会话,在打开足够多的会话后,页面可能无法加载。

  • 修复的问题 95631:当用户导航到“监控”(Monitor) >“网络服务”(Network Services) >“云安全服务站点”(Cloud Security Service Sites) 并尝试按“状态更改时间”(State Change Time) 对事件进行排序时,排列顺序不正确。

    当用户尝试按 CSS 表的状态更改时间 (State Change Time) 列进行排序时,排序错误,因为日期不是按时间戳排序,而是按解析的日期排序。经典 UI 和新 UI 上都会出现此问题。

  • 修复的问题 106907:在客户配置了与业务策略关联的通过 Edge 的非 SD-WAN 目标 (NSD) 时,如果用户稍后使用“Edge 覆盖”(Edge Override) 来停用通过 Edge 的 NSD,则不会在使用 5.1.0 版本的 VMware SASE Orchestrator 上移除相应的业务策略。

    在停用通过 Edge 的 NSD 后,Orchestrator 应当移除相应的业务策略,因为如果规则仍然存在,则与该业务策略匹配的流量将会转向到不存在的目标,从而导致该流量被丢弃。

  • 修复的问题 106929:操作员可能无法在使用版本 5.1.0 的 VMware SASE Orchestrator 上将软件版本分配给操作员配置文件。

    Orchestrator 会引发类似于以下内容的错误:

    错误消息.

    出现此问题的原因是,数据库 API 查询存在争用,导致 Orchestrator 尝试添加软件映像时超时。与 VMware 托管的 Orchestrator 一样,在托管大量 Edge 的 Orchestrator 上很可能会出现此问题,因此,无论是使用新 UI 还是经典 UI,都可能会出现此问题。

    在未修复此问题的 Orchestrator 上,唯一的解决办法是增加数据库连接的超时值。

  • 修复的问题 107349:在 VMware SASE Orchestrator 上查看“监控”(Monitor) >“Edge”>“源”(Sources) 时,部分源甚至所有源可能无法解析,并显示“无法解析”(Unable to resolve)。

    此问题并不总是会发生,客户企业中的某些站点可能会按预期显示源的 IP 和 MAC 地址。出现此问题的原因是,Orchestrator 数据库表中的 Edge 名称未进行更新。

    如果客户在未修复此问题的 Orchestrator 上遇到此问题,他们可以在维护时段内禁用云 VPN,然后再次启用云 VPN 以强制 Orchestrator 检索正确的 Edge 名称。

  • 修复的问题 108363:将 VMware SASE Orchestrator 升级到 5.x 版本后,如果 VMware SD-WAN Edge 部署了云安全服务 (CSS)(如 Zscaler)并配置了 7 级 (L7) 运行状况检查,则使用该 CSS 的流量可能丢失约 30 秒。

    在升级 Orchestrator 后,它会触发对所有 Edge 的配置更新,这可能导致某些配置了 L7 运行状况检查的 CSS 站点关闭,直到配置得到更正为止。此问题与修复的问题 107302 相关,对问题 107302 的修复解决了 Edge 上的相应问题。此处的修复可防止 Orchestrator 在升级时触发对 Edge 的配置更新,从而保护未修复 107302 的 Edge。

  • 修复的问题 110946:使用 4.2.x 或更低版本的 VMware SD-WAN Orchestrator 在升级为使用 4.3.x 或更高版本的 SASE Orchestrator 时可能会失败。

    当 Orchestrator 升级到 4.3.x 或更高版本时,4.2.x 或更低版本的 Orchestrator 在运行 apt update service 例程之前不会清理 apt 缓存,导致 MySQL 数据库在升级期间重新启动,从而升级失败。

    如果在未修复此问题的情况下升级到某个 Orchestrator 版本,操作员可以在升级之前运行 rm -rf /var/lib/apt/lists/ 命令。

  • 修复的问题 111665:将 VMware SASE Orchestrator 从早期 Orchestrator 版本更新到 5.1.0 版本时,客户端设备迁移可能无法完成。

    该问题会影响客户端设备数据从使用 MySQL 的 Orchestrator 到使用 ClickHouse 的 Orchestrator 的迁移。迁移一定数量的记录后,迁移过程将提前结束。

  • 修复的问题 111946:当对等体列表超过 100 条时,用户在 VMware SASE Orchestrator 上的“Edge”>“监控”(Monitor) >“路径”(Paths) 选项卡上看不到路径。

    当用户导航到 Edge > 监控 (Monitor) > 路径 (Paths) 选项卡时,Orchestrator 后端将返回所有记录,即使超过 100 条记录也是如此。这是因为后端忽略了限制,即应返回的最大记录数。超过限制计数后返回的记录不会进行标准化,这意味着这些记录不会按照与 UI 不兼容的方式进行格式化。这将导致 UI 中出现错误。Orchestrator 返回的记录数应仅在已提交的限制范围内。

  • 修复的问题 112458:在将新的 VMware SD-WAN 网关添加到网关池并启动网关重新均衡时,即使现有网关过载,新网关也不会重新分发到 VMware SD-WAN Edge。

    在执行网关重新均衡时,VMware SASE Orchestrator 应将多个 Edge 重新分配给同一地理区域中负载最少的网关,出现此问题时,尽管分配的网关过载,Edge 仍会保留其现有的网关分配。

  • 修复的问题 112885:对于与通过 VMware SASE Orchestrator UI 触发网关重新均衡没有直接关系的工作流,可能会触发网关重新均衡。

    此处的修复解决了以下问题:对于专用企业以外的工作流,可能会发生网关重新均衡。应当只在操作员级别通过 Orchestrator UI 触发网关重新均衡,而不应通过任何其他方式触发。

  • 修复的问题 114475:操作员尝试将 VMware SASE Orchestrator 从版本 4.2.0 升级到 5.1.0 时,Orchestrator 可能会报告升级失败。

    在日志中,操作员会看到以下条目:Error while initializing CWS Server service Error: Too many connections。触发此问题的原因是,MySQL 未设置最大连接数,从而导致 MySQL 在安装 vco-db-schema 之前重新启动。此外,虽然 Orchestrator 报告安装失败,但实际上安装已经完成,他们可以重新启动 Orchestrator,所有服务都将按预期运行。

Orchestrator 版本 R5103-20230315-GA 中解决的问题

Orchestrator 内部版本 R5103-20230315-GA 在 2023 年 3 月 15 日发布,它是版本 5.1.0 的第 3 个 Orchestrator 汇总内部版本。

该 Orchestrator 汇总内部版本解决了自第 2 个 Orchestrator 汇总内部版本 R5102-20230222-GA 以来存在的以下严重问题。

  • 修复的问题 107587:操作员无法在 VMware SASE Orchestrator 上为其他操作员或客户管理员编辑用户详细信息。

    如果操作员的角色允许,他们应当有权在管理 (Administration) > 用户管理 (User Management) 下为其他操作员编辑用户详细信息,而且如果激活了管理委派,也应当有权编辑客户管理员。出现此问题时,操作员会观察到用户详细信息为“只读”而无权编辑。

  • 修复的问题 107725:当用户使用 VMware SASE Orchestrator 的新 UI 导航到“监控”(Monitor) >“Edge”(Edges) >“地图分布”(Map Distribution) 时,地图在任何时候都只显示最多 20 个 VMware SD-WAN Edge,而不会显示客户已部署的所有 Edge。

    由于新 UI 的地图分布 (Map Distribution) 一次只在客户的 Edge 列表中显示 20 个 Edge,因此,此问题会影响部署了 20 个以上 Edge 的客户。当用户单击列表的下一页时,地图将只显示该页面上的那些 Edge。没有可用于列出客户企业的所有 Edge 的选项。

  • 修复的问题 108533:在 VMware SASE Orchestrator 的新 UI 上,当用户导航到“服务设置”(Service Settings) >“Edge 管理”(Edge Management) >“配置更新”(Configure Updates) 时,设置的说明文本不清晰。

    设置名称禁用 Edge 配置更新 (Disable Edge Configuration Updates) 与设置的实际功能相矛盾,在此修复中,该名称更改为启用 Edge 配置更新 (Enable Edge Configuration Updates) 以便与功能和说明文本保持一致。

  • 修复的问题 108833:如果用户在 VMware SASE Orchestrator 的新 UI 中更改非全局分段上的 BGP 筛选器,Orchestrator 会使用此新设置覆盖全局分段上的 BGP 筛选器更改。

     对于在多个分段上使用 BGP 且每个分段上具有唯一设置的客户,如果用户使用 BGP 设置被覆盖的全局分段,此问题可能会导致用户的网络中断。使用经典 UI 时,不会出现此问题。

  • 修复的问题 109064:用户可以在一个配置了 MAC 筛选器、另一个则没有配置的两个不同的 Wi-Fi 接口上为 VMware SD-WAN Edge 配置相同的 SSID(服务集标识符)。

    对于 WLAN1 和 WLAN2,如果一个接口打开了 MAC 筛选器、另一个接口关闭了 MAC 筛选器,或者每个接口上具有不同的 MAC 允许列表,则 VMware SASE Orchestrator 不应允许在这两个接口上配置相同的 SSID,因为这样会允许连接未批准的 MAC 地址。

Orchestrator 版本 R5102-20230222-GA 中解决的问题

Orchestrator 内部版本 R5102-20230222-GA 在 2023 年 2 月 24 日发布,它是版本 5.1.0 的第 2 个 Orchestrator 汇总内部版本。

该 Orchestrator 汇总内部版本解决了自第 1 个 Orchestrator 汇总内部版本 R5101-20221220-GA 以来存在的以下严重问题。

  • 修复的问题 40584:当用户在 VMware SASE Orchestrator 上查看“监控”(Monitor) >“Edge”>“源”(Sources) 时,他们可能会发现,即使已经将新的客户端设备添加到 VMware SD-WAN Edge,Orchestrator 在使用 IP 可见性模式时也不会显示最新的客户端设备。

    在将 Edge 的可见性模式 (Visibility Mode) 配置为按 IP 地址的可见性 (Visibility by IP address) 时,可能会出现此问题。出现此问题的原因是,Orchestrator 在正确使用 IP 地址模式时未处理 Edge 的最新客户端信息,因此仅显示旧客户端及其 IP 地址。

  • 修复的问题 105610:当用户尝试创建新的 IPv4 对象组或尝试更新包含以“255”开头和以“0”结尾的通配符掩码(例如,255.0.1.0)的现有 IPv4 对象组时,VMware SASE Orchestrator 不允许此通配符掩码并引发错误,即使这是有效的通配符表达式且应该获得允许时也是如此。

    从 5.0.x 及更高版本开始,Orchestrator 缺少对对象组中通配符掩码的验证,因此当用户为其配置通配符掩码时,会引发错误。

  • 修复的问题 106159:当身份验证配置为单点登录 (SSO) 且相应的身份提供程序 (IdP) 不支持侦测端点时,运行版本 5.1.0.0 和 5.1.0.1 的 VMware SASE Orchestrator 不允许本机用户创建 API 令牌。

    版本 5.1.0.0 引入了在 API 令牌创建验证期间对 IdP 侦测端点进行检查的功能。此检查不会区分本机用户和非本机用户,只要为身份验证配置了 SSO,Orchestrator 就会验证 IdP 是否支持侦测端点。因此,如果 IdP 不支持侦测端点,验证将阻止本机和非本机用户创建 API 令牌。此条件适用于操作员用户和合作伙伴管理员。

  • 修复的问题 106242:对于访问 VMware SASE Orchestrator 上“诊断”(Diagnostics) >“远程诊断”(Remote Diagnostics) 页面的用户,在执行任何 Edge 诊断时可能都会遇到从“远程诊断”(Remote Diagnostics) 页面中意外注销的问题。

    用户遇到此问题的原因是,Orchestrator 已达到可能的连接数量限制,并且 Orchestrator 注销了远程诊断用户以确保正常运行。出现此问题的原因是,Orchestrator 错误地未释放那些不再需要的数据库连接,从而导致 Orchestrator 触发连接限制行为。

  • 修复的问题 106592:在运行版本 5.1.0.0 和 5.1.0.1 的 VMware SASE Orchestrator 上,使用 API 的客户可能会发现以下症状:a) Orchestrator 吊销了活动 API 令牌,以及 b) APIv2 等服务不再正常工作。

    版本 5.1.0.0 引入了一个名为 batchRevokeApiTokenForInactiveSsoUsers 的新后端作业,该作业每 6 小时运行一次,会吊销以前为非活动单点登录 (SSO) 用户颁发的 API 令牌。后端作业存在的缺陷导致其错误地吊销 Orchestrator 上的所有 API 令牌,而不考虑这些令牌的创建对象。

    通过此修复,具有超级用户或合作伙伴管理员的客户管理员应手动从 Orchestrator 中删除非活动身份提供程序 (IdP) 用户,以免用户通过 API 令牌进行未经授权的访问。

  • 修复的问题 106806:VMware SASE Orchestrator 升级到版本 5.1.0 后,连接到 Orchestrator 的客户可能会发现客户流量中断的现象。

    Orchestrator 会在升级到 5.1.0 过程中创建新设备设置模块版本。然后,Orchestrator 将该新设备设置版本推送到所有连接的 Edge,这可能会造成中断,因为某些设备设置更改可能会触发 Edge 服务重新启动,从而导致客户流量中断 10-15 秒。此问题的修复可确保 Orchestrator 在升级到版本 5.1.0 后,不会将更新的设备设置版本推送到所有连接的 Edge。

  • 修复的问题 107410:对于在 VMware SASE Orchestrator 上使用新 UI 的合作伙伴管理员,在尝试将软件映像分配给合作伙伴的某个客户时,用户会发现他们无法滚动列出软件映像的下拉菜单。

    这就导致,除非合作伙伴在打开下拉菜单时,在初始显示的映像中看到所需软件映像,否则,如果映像位于更下方,他们将无法向下滚动以找到所需映像。在将软件映像分配给客户时,操作员用户可正常执行此操作,合作伙伴管理员仍可以在经典 UI 上滚动。

  • 修复的问题 107637:具有大量 VMware Edge 的客户在 VMware SASE Orchestrator 经典 UI 上导航到“配置”(Configure) >“Edge”时,可能会发现该页面无法加载。

    该问题出现在经典 UI 上,并且该页面会超时并显示“出现意外错误”(An unexpected error has occurred) 消息。用户在使用新 UI 时不会遇到此问题。

    错误屏幕.

    对该问题进行故障排除时,操作员会在 Orchestrator 日志中发现 enterprise/getEnterpriseEdgeList 方法失败并显示以下错误:

    2023-02-06T17:21:05.412Z - error: [[email protected]] [24775] API Invocation error for enterprise/getEnterpriseEdgeList: { code: undefined, message: 'Internal error' }

    出现此问题的原因是,Orchestrator API 在配置 (Configure) > Edge 等场景中检索客户的 Edge 列表。在经典 UI 上,该 API 的使用方式可能会导致其超时,尤其是在需要检索大量 Edge 时(例如,500 个或更多 Edge)。

  • 修复的问题 107885:对于 VMware SASE Orchestrator 新 UI 上的任何用户,可能无法为某些 VMware SD-WAN Edge 加载“配置”(Configure) >“概览”(Overview) 页面。

    该问题并不总是会发生,可能会为某些 Edge 加载配置 (Configure) > 概览 (Overview) 页面。如果 Edge 的 QoS 模块未填充分段信息,则会触发该问题。

    在未修复此问题的 Orchestrator 上,用户可以配置一个不影响用户流量的测试业务策略并进行保存,此时将成功加载“概览”(Overview) 页面。

  • 修复的问题 108074:用户在 VMware SASE Orchestrator 新 UI 的“监控”(Monitor) >“Edge”屏幕上下拉 Edge 信息框以查看“描述”(Description) 信息时,该信息缺失。

    在经典 UI 的监控 (Monitor) > Edge 屏幕上,Edge 下拉信息屏幕会显示配置的“描述”(Description):


    在新 UI 的监控 (Monitor) > Edge 屏幕上,Edge 下拉信息屏幕不会显示配置的“描述”(Description):


    用户可以在配置 (Configure) > Edge > 概览 (Overview) 页面上配置 Edge 的描述 (Description)

  • 修复的问题 108309:在使用 5.1.0 版本的 VMware SASE Orchestrator 新 UI 上,当用户尝试使用“Edge 覆盖”(Edge Override) 将 VMware SD-WAN Edge 与非 SD-WAN 目标 (NSD) 关联时,不会显示隧道配置选项。

    隧道配置选项应当以带有 + 符号的操作 (Action) 形式显示在屏幕的最后一列,但在此问题中,+ 符号缺失。


    此问题仅限于 Edge 特定的操作,如果客户通过 Edge 正在使用的配置文件(而不是使用“Edge 覆盖”(Edge Override))来添加 NSD,则会正确显示操作 + (Action +) 选项。


Orchestrator 版本 R5101-20221220-GA 中解决的问题

Orchestrator 内部版本 R5101-20221220-GA 在 2022 年 12 月 20 日发布,它是版本 5.1.0 的第 1 个 Orchestrator 汇总内部版本。

此 Orchestrator 汇总内部版本解决了自 Orchestrator 内部版本 R5100-20221202-GA 以来存在的以下严重问题。

  • 修复的问题 100133:VMware SASE Orchestrator 可能会遇到性能问题。

    如果客户通过将业务策略规则与 Edge Hub 集群相关联来配置大量业务策略规则,则 Orchestrator 在每次需要将这些配置推送到该企业中的 Edge 时,都会遇到性能问题。

  • 修复的问题 101835:如果用户选择配置了云 VPN 的非全局分段,则新 Orchestrator UI 中的“云 VPN”(Cloud VPN) 部分不可用。

    在新 Orchestrator UI 的配置 (Configure) > Edge > 设备设置 (Device Settings) 页面上,如果用户选择配置了云 VPN 的非全局分段,则云 VPN (Cloud VPN) 部分不可用。

  • 修复的问题 102806:客户无法在每个网关级别编辑合作伙伴网关切换配置。

    当客户在升级期间配置合作伙伴网关切换时,会出现此问题。

  • 修复的问题 103622:当操作员用户在 VMware SASE Orchestrator 中尝试访问某些页面时,可能会看到以下错误消息:“您没有访问该数据的权限”(You don't have permission to access this data)。

    当操作员用户在访问某个客户下的“全局设置”(Global Settings)、“Cloud Web Security”或“Secure Access”页面后,尝试访问操作员或合作伙伴的“用户管理”(User Management) 页面时,新 Orchestrator UI 中会出现此问题。

Orchestrator 版本 R5100-20221202-GA 中解决的问题

Orchestrator 版本 R5100-20221202-GA 于 2022 年 12 月 8 日发布,解决了自 Orchestrator 版本 R5011-20221129-GA 以来存在的以下问题。

注:

版本 5.1.0 包含 5.0.0 或 5.0.1 发行说明中列出的所有 Orchestrator 修复。

  • 修复的问题 91407:如果将用户定义的 WAN 覆盖网络配置为备份链路,在该链路实际处于备份模式时,运行版本 5.0.x 的 VMware SASE Orchestrator 在“监控”(Monitor) >“Edge”中将该链路显示为启动。

    这只是一个显示问题,备份 WAN 链路功能可以正常工作。出现该问题的原因是,Orchestrator 未正确存储 Edge 的链路模式值,从而导致显示错误状态。

  • 修复的问题 91393:对于使用 syslong 或 telnet 从 Edge 收集数据的客户,用户可能会在 VMware SD-WAN Edge 的 NetFlow 数据中看到同一应用程序的两个名称。

    当存在如下应用程序时,会遇到该问题:语言文件 (appids_en_us.json) 中的“displayName”与应用程序文件 (applications.json) 中的“displayName”不同。由于在 Edge 端使用 applications.json 文件的“displayName”,因此不应更改该设置。

    出现该问题的原因是,applications.json 文件的“displayName”在 API 响应中更改为 appids_en_us.json 文件中的“displayName”,并且每次更新应用程序库数据时,都会更新每个应用程序库“displayName”,即使用户没有对其进行更改并将相同的内容推送到 Edge 也是如此。

  • 修复的问题 12132:在 VMware SASE Orchestrator 上配置静态路由时,UI 会警告实际上不会发生的 Edge 服务重新启动。

    在更改任何静态路由上的配置并保存更改时,Orchestrator UI 会警告将重新启动 Edge 并中断服务。此消息无效,不会发生与更改静态路由配置关联的 Edge 服务重新启动。该修复移除了虚假警告。

  • 修复的问题 36058:在配置为备份链路的 WAN 链路实际关闭时,该链路可能会在 VMware SASE Orchestrator UI 的“监控”(Monitor) >“概览”(Overview) 页面上显示为灰色。

    屏幕如下所示:


    查看监控 (Monitor) > Edge > 概览 (Overview) 页面时,备份链路状态会显示准确的状态。

  • 修复的问题 52952:VMware SASE Orchestrator UI 允许用户为 AS 路径前置配置无效的输入。

    Orchestrator UI 不会检查无效的 AS 路径前置值。用户可以使用包含逗号的值输入 AS 路径前置,即使这对于 Edge 路由过程来说是无效配置,UI 也会接受此配置。不会应用无效的配置,并且不会向用户提供任何反馈,例如有关无效配置的警告、错误消息或提示。

  • 修复的问题 53740:在 VMware SASE Orchestrator UI 上配置防火墙规则时,用户无法为该规则要匹配的协议配置协议值。

    Orchestrator 仅允许协议匹配条件中的 TCP/UDP/ICMP/GRE,并且不允许介于 0-255 之间的协议值。此更改允许用户配置匹配的防火墙规则,并且在目标 (Destination) 下,用户可以从协议 (Protocol) 菜单中选择“其他”(Other),然后输入一个介于 0-255 之间的值。

    注:

    虽然用户可以输入 0-255 之间的值,但根据 IANA 分配的 Internet 协议号文档,协议值 144-255 被视为预留或未分配的协议值。

  • 修复的问题 68347:VMware SASE Orchestrator 在“警示”(Alerts) 页面上错误地将 Zscaler IPsec for GRE 隧道事件显示为 Edge IPsec 隧道事件。

    不应为 GRE 隧道事件生成警示。

  • 修复的问题 70987:用户可能无法从 VMware SASE Orchestrator 中删除 VMware SD-WAN Edge。

    Edge 处于脱机状态,但未更新为已断开连接,而是保持已降级状态,因而不符合删除条件。

  • 修复的问题 72444:当用户为 VMware SD-WAN Edge 配置 IPv4 和 IPv6 BGP 邻居,然后尝试使用打开/关闭滑动按钮禁用 BGP 设置时,不会保存配置,并且 VMware SASE Orchestrator UI 会显示“无更改”(No Changes)。

    在极少数情况下,如果用户既要配置 BGP 设置又要禁用 BGP,则不会保存针对 BGP 设置执行的用户操作(本应保存这些操作)。

  • 修复的问题 73481:在同一位置部署了两个或更多 VMware SD-WAN 网关时,操作员可能会发现,大多数 VMware SD-WAN Edge 都在使用一个网关,而另一个(其他)网关则未得到充分利用,这可能会导致充分利用的网关出现性能问题。

    出现该问题时,一个网关的利用率将达到 90%,而同一位置的另一个网关的利用率则只有 10% 并留有空闲资源。Edge 的主网关和辅助网关分配必须考虑网关上的现有负载。否则,作为主网关的单个网关将不堪重负,而辅助网关上则留有大量未使用的容量。

  • 修复的问题 75175:当客户管理员尝试访问 VMware SASE Orchestrator 上的“网关信息”(Gateway Information) 页面时,该页面加载失败并显示错误。

    网关迁移完成后,转到监控 (Monitor) > Edge > 查看 (View)(在“网关”(Gateway) 下)会收到以下错误消息:“加载网关信息时出错”(Error Loading Gateway info)


    客户管理员应该无法访问“网关信息”(Gateway Information) 页面,但当他们由于特权级别而尝试访问该页面时,该部分会出错。

  • 修复的问题 76091:用户可能会发现,在“配置”(Configure) >“设备”(Device) 屏幕上编辑子网时,屏幕会冻结。

    如果单击“重置”(Reset) 按钮或将 Edge 移动到“符合条件的 VPN 出口”(Eligible VPN Exits),然后用户为没有学习路由的子网单击保存 (Save),则 UI 将冻结,并且加载图标将永久旋转。


     

    出现该问题的原因是,这些子网中缺少 learnedRoute 数组,从而触发 UI 故障。

  • 修复的问题 76182:在 VMware SASE Orchestrator UI 的“监控”(Monitor) >“Edge”页面上选择特定的时间间隔时,Orchestrator 可能会返回不完整的数据。

    如果用户查询的时间间隔为 5 的倍数,例如 12:00:00 - 13:00:00,则后端只会发送 11 个 5 分钟的采样,而不是正确的 12 个采样,原因是 Edge 链路统计信息 API 存在问题。

  • 修复的问题 77538:在将客户企业从一个 VMware SASE Orchestrator 迁移到其他 Orchestrator 时,客户可能会发现重复的操作员配置文件和 Edge 软件映像。

    重复的操作员配置文件不仅会让客户感到困惑,而且还会指向旧的 Orchestrator,因此,使用该配置文件的 Edge 会将检测信号发送到错误的 Orchestrator,从而导致 Edge 被标记为关闭且无法获取配置更新。

  • 修复的问题 79383:在“配置”(Configure) >“设备”(Device) 中进行配置更改时,用户可能会看到错误消息,但看不到发生错误的分段名称。

    例如,在配置文件级别将 Edge 接口从路由接口切换到交换接口时,如果设备设置中存在一些错误,用户将看到字符串“object.segment.name”而不是分段名称。


    如果客户企业使用多个分段,则当不清楚哪个分段有错误时,故障排除将变得非常困难。

  • 修复的问题 80445:在 VMware SASE Orchestrator 上配置 OSPF 时,用户可能会发现,OSPF 区域 ID 允许在 IP 和编号之间存在重复条目,并且允许将 OSPF 区域 ID 值“0”作为有效 ID。

    Orchestrator 不会针对区域 ID 的两种格式类型(IP 和编号)检查重复条目。此外,它还允许将值“0”作为有效的 OSPF 区域 ID。因此,用户可能会错误地配置和发布无效的 OSPF 配置,从而产生负面影响。

  • 修复的问题 81364:使用新的 Orchestrator 用户界面配置 VMware SD-WAN Edge 接口时,不会更新路由接口的速度和双工设置。

    在未修复该问题的 Orchestrator 上,用户需要使用经典 Orchestrator 为 Edge 的路由接口配置速度和双工设置。

  • 修复的问题 81366:使用新的 Orchestrator 用户界面配置使用高可用性的客户站点时,不会保存对 LOS 值下的 APR 探测间隔进行的更改。

    “LOS 检测”(LOS Detection) 下已修改的 APR 探测间隔不显示为 HA Edge 配置的值。在未修复该问题的 Orchestrator 上,需要在经典 Orchestrator 上配置 APR 探测值。

  • 修复的问题 83342:尝试使用过多 Edge 创建报告时,VMware SASE Orchestrator 显示一条模糊的错误消息,该消息未解释报告失败的原因。

    生成报告出错时,不会在 UI 中显示错误详细信息,而是阻止用户更正导致失败的原因。


    在未进行该修复的 Orchestrator 上,服务日志数据将具有缺失的详细信息(如果需要)。

    不适用

  • 修复的问题 83345:如果在 VMware SASE Orchestrator 上尝试创建报告时由于超时而失败,则 UI 不会显示验证错误。

    此请求单与 83342 有关,在这两种情况下,日志均未提供用于调试问题的足够详细信息。此处的区别在于,导致该问题的原因可能是在没有 Edge 的情况下生成报告,这也可能会导致报告超时且没有错误解释。

  • 修复的问题 83694:在用户登录 VMware SD-WAN Edge 的本地 UI 时,VMware SASE Orchestrator 不会在“监控”(Monitor) >“事件”(Events) 中记录并显示该操作。

    客户管理员不会知晓是否有任何本地用户登录 Edge 的本地用户界面。

  • 修复的问题 84064:对于要部署 Microsoft Azure 虚拟 Hub 的客户,可以选择在 VMware SASE Orchestrator 上配置 BGP。

    自动化的“Microsoft Azure 虚拟 Hub”上不正式支持 BGP。但是,允许用户在 Orchestrator 上配置 BGP,如果用户使用 BGP 配置 Azure 自动化,到网关的隧道将关闭,并且 Azure 站点不会传输流量。


  • 修复的问题 88811:在使用版本 5.0.x 的 VMware SASE Orchestrator 上,操作员超级用户无法为客户用户创建 API 令牌,即使他们拥有委派的特权也是如此。

    出现该问题的原因是,操作员超级用户没有 CREATE ENTERPRISE_API_TOKEN 特权。因此,操作员无法为其他用户创建、读取或吊销 API 令牌。

  • 修复的问题 88845:当用户尝试在 VMware SASE Orchestrator 上使用经典 UI 从企业 VLAN 列表中移除接口并保存更改时,Orchestrator 不会移除这些接口。

    在此操作的保存更改期间,Orchestrator 会忽略配置更改,因为 json 数据格式与经典 UI 的数据格式不匹配。

  • 修复的问题 88910:在运行版本 4.5.1 或 5.0.x 的 VMware SASE Orchestrator 上,用户无法使用“远程诊断”(Remote Diagnostics) >“WAN 链路速度测试”(WAN Link Speed Test) 对 VMware SD-WAN Edge 运行 WAN 链路速度测试。

    在尝试使用“WAN 链路速度测试”(WAN Link Speed Test) 诊断时,用户将无法选择用于速度测试的接口,因为提供的接口没有对应的下拉菜单。

    在未修复该问题的 Orchestrator 上,如果用户要强制对 WAN 链路运行带宽测试,解决办法是,用户可以更改该 WAN 链路的带宽测量方法,这会自动触发重新测试。可按以下方式完成此操作:

    1. 在特定 Edge 的 Orchestrator UI 上,转到配置 (Configure) > 设备 (Device),然后向下滚动到 WAN 设置 (WAN Settings)

    2. 要重新测试 WAN 链路,请选择编辑 (Edit) 以重新测量该链路,然后选择高级 (Advanced) 以显示其他设置。

    3. 带宽测量 (Bandwidth Measurement) 菜单下,将“带宽测量”(Bandwidth Measurement) 方法从当前方法更改为其他方法(例如,如果链路使用“突发模式”(Burst Mode),更改为“缓慢启动”(Slow Start),反之亦然),然后单击更新链路 (Update Link),最后单击“设备”(Device) 页面顶部的保存更改 (Save Changes)

    4. 对 WAN 链路执行测量后,将测量方法更改回原始方法,以确保对相应的 WAN 链路进行最准确的测量。执行此操作将触发额外的带宽测试。

  • 修复的问题 88998:用户无法在运行版本 5.0.x 的 VMware SASE Orchestrator 上使用经典 UI 克隆业务策略或防火墙规则。

    在 5.0.x 版本 Orchestrator 的经典 UI 中,已禁用 Edge 业务策略规则的 IPv6 和混合(IPv4 和 IPv6)选项。不过,用户能够在克隆已存在的规则时使用这些选项,但结果会显示错误消息。

    在 Orchestrator 的新 UI 中不会出现该问题,用户可以使用新 UI 解决该问题。

  • 修复的问题 91231:对于使用灾难恢复拓扑部署的 VMware SASE Orchestrator,如果在 DR 过程的大型表导入阶段触发大型表截断作业,则 DR 复制的初始设置可能会失败。

    如果统计信息的后台导入持续 24 小时以上,此操作会与每天运行的自动截断作业发生冲突。该作业将从大型表中截断旧分区,这些表也会在备用 MySQL 服务器上进行复制。

    但是,在此过程期间,MySQL 可能会对同一表进行数据导入,这会导致复制失败,因此整个 DR 过程也会失败。

    如果在未进行该修复的 Orchestrator 上遇到该问题,可以在 UTC 日期更改小时后启动 DR 进程。但是,当 Orchestrator 较大且其中的 DR 可能需要超过 24 小时才能完成时,此操作将无法保证有效预防该问题发生。

  • 修复的问题 93846:对于使用 ZTP 管理 Edge 清单的合作伙伴和操作员,如果用户尝试将先前分配给一个客户但随后又删除的 VMware SD-WAN Edge 重新分配给其他客户,VMware SASE Orchestrator 将返回错误“未找到 Edge”(Edge is not found)。

    Orchestrator 确定该 Edge 不存在,因为在从客户企业中删除 Edge 后,它将看不到逻辑 Edge,并且用户无法将其重新分配给其他客户。

已知问题

Edge/网关已知问题

5.1.0 版本中的未解决问题。

  • 问题 105933:用户无法使用 SSH 通过路由接口访问 VMware SD-WAN Edge 型号 610/610-LTE 或 520/540。

    对于通过受影响的 Edge 操作系统使用的 af-pkt 驱动程序发起的重复 SSH 数据包,没有丢弃规则。因此,Edge 内核收到 2 个 SSH 数据包:一个是通过 vce1 接口收到的数据包,另一个是由于驱动程序特性而直接收到的 SSH 数据包。这会导致 Edge 内核回复 2 个 SSH 请求,从而使 SSH 客户端感到困惑并导致 SSH 失败。

    解决办法:对于未修复该问题的 Edge,用户可以添加 IP 表规则以丢弃从 vce1 以外的接口收到的 SSH 数据包。

  • 问题 115136:在使用 BGP 进行路由的客户企业中,客户可能会观察到 VMware SD-WAN Edge 上的内存使用量逐渐增加。

    Edge 的 BGP 守护进程导致几天内在 Edge 上逐渐发生内存泄漏,即使没有为该 Edge 配置 BGP,也可能会发生这种情况。如果内存泄漏持续足够长的时间,而使 Edge 的内存使用量超过严重阈值(可用 RAM 的 60%)持续 90 秒以上,Edge 将防御性地重新启动其服务以清除泄漏,从而可能导致客户流量中断 10-15 秒。

    解决办法:如果未修复 Edge,唯一的修复措施是终止以重新启动 BGP 进程,或者在合适的服务时段预先执行 HA 故障切换/Edge 服务重新启动。

  • 问题 117037:对于使用 Hub/分支拓扑的客户,如果有多条 WAN 链路用于发送和接收从分支 Edge 到 Hub Edge 的流量,由于 WAN 链路不会汇总 WAN 链路的带宽,客户可能会发现通过业务策略转向的流量低于预期性能。

    SD-WAN 使用计数器来计算重新排序队列中缓冲的数据包数。此计数器按对等体进行管理,用于确保每个对等体仅缓冲 4K 数据包。在某些情况下,此计数器可能会变为负数。在版本 4.2.x 之前,当此计数器变为负数时,在刷新重新排序队列中的数据包后,相应的计数器立即重置回 0。但从版本 4.3.x 开始,此计数器会自动更新,以确保计数器始终在预期范围内。

    此项行为变化的结果可能会导致计数器计数不正确,重新排序队列可能会保持在一个非常高的数字,而 SD-WAN 则会通过刷新每个数据包来做出反应。此操作不仅会阻止带宽汇总,还会降低流量的有效性(这些流量原本可位于单条链路上)。

    解决办法:在未修复此问题的 Edge 上,解决办法是配置业务策略,以将匹配流量转向到单条强制链路。

Orchestrator 已知问题

check-circle-line exclamation-circle-line close-line
Scroll to top icon