本节介绍了在使用高可用性拓扑的 Edge 部署中,用于检测和防止脑裂状态的机制。

在高可用性部署中,有两种机制可用于检测和防止脑裂情况(该情况下,两个 HA Edge 都变为活动状态)。

第一种机制是,在设备之间的 HA 检测信号链路丢失的情况下,在两个 HA Edge 之间发送第 2 层广播检测信号。第 2 层广播 (EtherType 0x9999) 检测信号会从活动 Edge 在其所有 WAN 接口上发送,以便在该广播网络中找到备用 Edge。当备用 Edge 收到该数据包时,它会将数据包解释为维持其当前备用状态的一种指示。此机制由传统高可用性部署使用,在该部署中,两个 HA Edge 的 WAN 端口均连接到同一个第 2 层交换机。

用于检测和防止脑裂情况的第二种机制是,利用 HA Edge 使用的主网关。这种机制是在增强型高可用性部署中检测和防止脑裂的唯一方法,因为该拓扑不会将两个 HA Edge 都连接到上游第 2 层交换机。

主网关具有到活动 Edge (VCE1) 的预先存在的连接。在脑裂情况下,备用 Edge (VCE2) 将状态更改为“活动”,并尝试与主网关 (VCG) 建立隧道。网关将响应发回到备用 Edge (VCE2),以通知它变为“备用”状态,并且不允许建立隧道。主网关将始终仅具有来自活动 Edge 的隧道。

一旦 HA 链路发生故障,VCE2 就将变为“活动”状态并启用 LAN/WAN 端口,然后尝试与主网关建立隧道。如果 VCE1 仍具有隧道,则主网关会指示 VCE2 恢复为“备用”状态,因此 VCE2 会阻止其 LAN 端口。仅 LAN 接口保持阻止状态(只要 HA 电缆中断)。正如下图所示,网关指示 VCE2 变为“备用”状态。从逻辑上讲,这会防止出现脑裂情况。

注: 在脑裂情况下,从活动 Edge 到备用 Edge 的故障切换不同于在活动 Edge 发生故障的情况下所进行的正常故障切换。为修复脑裂情况而进行的故障切换可能需要额外的几毫秒或几秒才能融合。
注: 为 Edge 配置 WAN 接口设置时,如果从“寻址类型”(Addressing Type) 字段中选择“PPPoE”,则 Edge 无法通过从配置为“PPPoE”的 WAN 接口广播来发送检测信号数据包。