为确保获得最佳 Fault Tolerance 结果,您应当遵循某些最佳做法。

以下主机和网络配置建议有助于提高集群的稳定性和性能。

主机配置

运行主虚拟机和辅助虚拟机的主机应当按照与处理器大致相同的频率运行,否则辅助虚拟机可能会更频繁地重新启动。不依据工作负载进行调整(例如,为省电而执行功率封顶和强制低频率模式)的平台电源管理功能可能会导致处理器频率大范围浮动。如果辅助虚拟机要定期重新启动,请在运行容错虚拟机的主机上取消激活所有的电源管理模式,或者确保所有主机以相同的电源管理模式运行。

主机网络配置

您可以按照以下准则配置主机的网络,以便在不同流量类型的组合(如 NFS)和不同数目的物理网卡的情况下支持 Fault Tolerance。

  • 将每个网卡组分布到两台物理交换机,并确保这两台物理交换机之间的每个 VLAN 的 L2 域连续性。
  • 使用确定的绑定策略确保特定流量类型与特定网卡(活动/待机)或网卡集(如源虚拟端口 ID)具有关联性。
  • 使用活动/待机策略时,将流量类型配对,以便使两种流量类型共享某个 vmnic 的情况下发生故障切换时所产生的影响最小。
  • 使用活动/待机策略时,配置所有活动适配器,以便特定流量类型(如 FT 日志记录)流向相同物理交换机。这样可使网络跃点的数目最少,并降低超额预订交换机到交换机链路的可能性。
注: 主虚拟机与辅助虚拟机之间的 FT 日志记录通信是未加密的,且包含客户机网络和存储 I/O 数据以及客户机操作系统的内存内容。此通信可以包含敏感数据,如纯文本格式的密码。为避免这些数据被泄漏,尤其是避免受到“中间人”攻击,请确保此网络是受保护的。例如,可以对 FT 日志记录通信使用专用网络。

同类集群

vSphere Fault Tolerance 可以在主机不一致的集群内使用,但在节点兼容的集群内才能起到最好的效果。构建集群时,所有主机都应具有以下配置:

  • 对虚拟机所用数据存储的一般访问权限。
  • 相同的虚拟机网络配置。
  • 所有主机的相同 BIOS 设置(电源管理和超线程)。

运行检查合规性确定不兼容性并进行更正。

性能

要增加主虚拟机和辅助虚拟机之间日志记录通信使用的可用带宽,请使用 10 千兆位网卡,并激活巨型帧。

您可以选择多个网卡用于 FT 日志记录网络。通过选择多个网卡,即使所有网卡都不是专门用于运行 FT,您也可以利用多个网卡的带宽。

在共享存储上存储 ISO 以连续进行访问

将激活了 Fault Tolerance 的虚拟机访问的 ISO 存储在可以供容错虚拟机的两个实例访问的共享存储上。如果使用此配置,虚拟机中的 CD-ROM 会继续正常工作,即使发生了故障切换也是如此。

避免网络分区

当 vSphere HA 集群出现管理网络故障而导致某些主机与 vCenter Server 隔离并且使这些主机彼此隔离时,会出现网络分区。请参见网络分区。如果出现分区,则可能降低 Fault Tolerance 保护。

在使用 Fault Tolerance 的已分区 vSphere HA 集群中,主虚拟机(或其辅助虚拟机)可以在由首选主机(不负责管理虚拟机)管理的分区中停止。如果需要故障切换,则仅当主虚拟机位于首选主机(负责管理该主虚拟机)管理的分区中时才重新启动辅助虚拟机。

为确保管理网络尽可能不出现导致网络分区的故障,请遵循网络连接的最佳做法中的建议。

使用 vSAN 数据存储

vSphere Fault Tolerance 可以使用 vSAN 数据存储,但您必须考虑以下限制:

  • 主虚拟机和辅助虚拟机均不支持混合使用 vSAN 和其他类型的数据存储。
  • FT 不支持 vSAN Metro 集群。

要提高使用 FT 与 vSAN 时的性能和可靠性,建议采用下列条件。

  • vSAN 和 FT 应使用单独的网络。
  • 将主虚拟机和辅助虚拟机置于单独的 vSAN 故障域中。