可以管理每个 SDDC 集群的 Elastic DRS 策略,以优化集群缩放,从而满足工作负载的需求。

对于任何策略,当集群达到任意资源的高阈值时,将触发扩大操作。无论选择何种策略,存储横向扩展阈值都不能设置为大于 80%。仅当达到所有低阈值后,才会触发缩减操作。有关 EDRS 横向扩展和横向缩减逻辑的详细信息,请参见 Elastic DRS 算法的工作原理VMware Cloud on AWS 具有弹性,它显示一个网格,其中一行显示当前应用于每个集群的 EDRS 策略。要查看或编辑策略详细信息,请展开行。

注: 在双主机 SDDC 和包含少于 6 个主机的延伸集群中,只有 Elastic DRS 基准策略可用。EDRS 至少需要两个主机,因此不适用于单主机 SDDC。
可用策略包括:
Elastic DRS 基准
这是新 SDDC 的默认策略。除非选择了另一个策略,否则该策略无法禁用,并且将始终应用于集群。当存储利用率达到 80% 后或多 AZ SDDC 中发生 AWS 可用区故障时,该策略会添加主机。如果其他策略能够为工作负载虚拟机提供更好的支持,则可以选择该策略。如果需要保持 vSAN 备用空间,此策略将超出最大主机计数。该策略具有以下阈值:
资源 高阈值 低阈值
CPU 不适用 不适用
内存 不适用 不适用
存储 80% 利用率 不适用
为获得最佳性能进行优化
此策略会根据需要添加主机以保持性能,并且仅当资源消耗显著减少时才会移除这些主机。如果此策略确定移除主机会降低性能并强制在短期内执行横向扩展,则不会移除主机。该策略具有以下阈值:
资源 高阈值 低阈值
CPU 90% 利用率 50% 利用率
内存 80% 利用率 50% 利用率
存储 80% 利用率 20% 利用率
为实现最低成本进行优化

横向缩减时,此策略会快速移除主机,以便在将主机计数保持在可行最小值的同时保持基准性能。仅当此策略预计存储利用率不会导致在移除主机后的短期内进行横向扩展时,才会移除主机。该策略具有以下阈值:

资源 高阈值 低阈值
CPU 90% 利用率 60% 利用率
内存 80% 利用率 60% 利用率
存储 80% 利用率 40% 利用率
快速缩放

此策略会根据内存或 CPU 需要一次添加多个主机,根据存储需要按增量添加主机。默认情况下,一次添加四个主机。如果在灾难恢复、虚拟桌面基础架构 (VDI) 和类似用例中需要更快地扩展,可以指定更大的横向扩展增量(8 或 12)。与任何 EDRS 策略一样,横向扩展时间会随着增量大小的增加而增加。当增量较大(12 个主机)时,在某些配置中,可能需要长达 40 分钟才能完成。

横向缩减时,此策略会快速移除主机,以便在将主机计数保持在可行最小值的同时保持基准性能。如果此策略预计移除主机会降低性能并强制在短期内执行横向扩展,则不会移除主机。当集群达到最小主机计数或移除了横向扩展增量中的主机数时,横向缩减将停止。此策略具有以下阈值:

资源 高阈值 低阈值
CPU 80% 利用率 50% 利用率
内存 80% 利用率 50% 利用率
存储 80% 利用率 40% 利用率
自定义受管 EDRS 策略

此策略支持单独配置策略参数,以确保性能标准,同时优化成本。可以为所有资源设置阈值上限和阈值下限。

横向扩展基于资源类型(CPU、内存和存储)。达到任何一个阈值上限时,就会触发横向扩展,但横向缩减要求所有资源类型都低于这些阈值。可以禁用横向扩展 CPU 和内存,但不能禁用横向扩展存储。可以在集群上禁用横向缩减。

默认情况下,此策略会根据内存或 CPU 需要并行添加多个主机,根据存储需要一次添加一个主机。与任何 EDRS 策略一样,横向扩展时间会随着增量大小的增加而增加。当增量较大(12 个主机)时,在某些配置中,可能需要长达 40 分钟才能完成。此策略具有以下阈值范围:

资源 阈值范围上限 阈值范围下限
CPU 60%-95% 利用率(启用时) 5%-60% 利用率
内存 60%-95% 利用率(启用时) 5%-60% 利用率
存储 70%-80% 利用率 5%-40% 利用率
注:

最佳做法是,阈值上限和阈值下限之间的差距不应小于 15 个百分点。如果差距较大,则不太可能强制执行添加/移除主机事件。设置横向缩减阈值时,请注意,移除主机时所需的数据撤出可能会暂时给剩余主机带来额外的负担。如果集群大小接近用于在 FTT=1 和 FTT=2 之间移动的 6 个主机 SLA 阈值,配置自定义受管 EDRS 策略时要小心谨慎。FTT 的任何更改都会强制在后台重建数据,从而给集群带来额外的负担。

Elastic DRS 策略通过三个变量进行监管:
最小集群大小
无论资源利用率如何,EDRS 都将横向缩减到的最小主机计数。达到最小集群大小后,EDRS 将无法再执行横向缩减操作。只要存储利用率保持在最小阈值以下且集群大小不低于最低要求(通常,传统集群为两个主机,延伸集群为六个主机),仍然可以手动移除主机。
最大集群大小
无论资源利用率如何,EDRS 都将横向扩展到的最大主机计数。达到最大集群大小后,对于 CPU 或内存消耗,EDRS 将无法再执行横向扩展操作,但对于存储,可以继续添加主机。只要集群大小不超过组织允许的最大值,始终可以手动添加主机。
扩展增量
(仅限自定义和快速缩放策略)CPU 和内存的横向扩展事件期间添加或横向缩减事件期间移除的主机数。存储的扩展增量始终为单个主机(1 个)。在常规集群(单 AZ)中,自定义受管 EDRS 策略支持增量为 1-6 个。在延伸集群中,支持的范围为 2-12 个且增量为偶数。

过程

  1. 登录到 VMware Cloud 控制台 (https://vmc.vmware.com)。
  2. 单击清单 > SDDC,然后选择一个 SDDC 并单击查看详细信息
  3. 选择集群并指定要使用的 Elastic DRS 策略。

    在集群对应的卡视图上,单击操作,然后选择编辑 Elastic DRS 设置。此外,还可以从打开弹性选项卡开始,该选项卡会显示一个网格,其中一行显示了当前应用于每个集群的 EDRS 策略。要查看或编辑策略详细信息,请展开该行。

    Elastic DRS 基准策略没有参数。对于其他策略,指定最小集群大小为 2 或更大,最大集群大小与预期工作负载资源消耗一致。最大集群大小适用于 CPU 和内存。需要保持存储容量并确保数据持久性时,该服务可以添加比您在最大集群大小中指定的数量更多的主机。

    自定义受管 EDRS 策略为所有资源提供了默认值。可以根据工作负载的需求编辑这些值。此外,还可以对内存和 CPU 禁用缩放。

  4. 单击保存

下一步做什么

所有 EDRS 策略更改都记录在 SDDC 活动日志中。