vSAN 存储策略定义对虚拟机的存储要求。这些策略可确保为虚拟机提供所需的服务级别,因为它们可以确定将存储分配给虚拟机的方式。

VMware Cloud on AWS 包括两个 vSAN 数据存储,一个用于管理虚拟机 (vsanDatastore),另一个用于工作负载虚拟机 (WorkloadDatastore)。这两个数据存储共享同一个底层存储设备,并使用同一池中的可用空间。

将为部署到 vSAN 数据存储的每个虚拟机至少分配一个虚拟机存储策略。您可以在创建或重新配置虚拟机时分配存储策略。

存储策略包含可用性属性和高级属性。

vSAN 虚拟机存储策略的可用性属性

站点灾难容差
定义延伸群集处理站点故障时使用的数据冗余方法。此属性适用于延伸群集。如果使用标准 vSAN 群集,请选择“无 (标准群集)”。
选项如下所示:
  • 无 (标准群集)
  • 双站点监控 (延伸群集)
  • 无 - 在主站点上保留数据 (延伸群集)
  • 无 - 在辅助站点上保留数据 (延伸群集)
允许的故障数
定义虚拟机允许的主机和设备故障数。您可以选择无数据冗余,也可以选择针对性能(镜像)或容量(纠删码)优化的 RAID 配置。
  • RAID-1 使用较多的磁盘空间放置对象的组件,但能够提供更好的对象访问性能。
  • RAID-5/6(纠删码)使用较少的磁盘空间,但性能会下降。
表 1. RAID 配置、FTT 和主机要求
RAID 配置 允许的故障数 (FTT) 所需的最小主机数
RAID-1(镜像)这是默认设置。RAID-1 1 3
RAID-5(纠删码) 1 4
RAID-1(镜像) 2 5
RAID-6(纠删码) 2 6
RAID-1(镜像) 3 7
注: 如果出现故障或虚拟机变得无响应,则 FTT = 0(无数据冗余)的虚拟机可能会出现数据丢失的情况。

受管存储策略配置文件确定了群集的初始 RAID 配置。将受管存储策略配置文件应用于群集后,RAID 配置将随着群集大小的更改自动更新。有关详细信息,请参见《VMware Cloud on AWS 受管存储策略配置文件》。

vSAN 虚拟机存储策略的高级属性

每个对象的磁盘带数
虚拟机对象的每个副本在其上进行条带化的容量设备的最低数量。值如果大于 1,则可能产生较好的性能,但也会导致使用较多的系统资源。默认值为 1。最大值为 12。仅当 VMware 技术支持建议时才更改默认值。
对象的 IOPS 限制
定义对象(例如 VMDK)的 IOPS 限制。IOPS 使用加权大小计算,表示为 I/O 操作数。如果系统使用的默认基本大小为 32 KB,则 64-KB I/O 表示两个 I/O 操作。

计算 IOPS 时,读取和写入同等对待,但不考虑缓存命中率和顺序性。如果磁盘的 IOPS 超过此限制,将限制 I/O 操作。如果对象的 IOPS 限制设置为 0,将不会强制执行 IOPS 限制。

vSAN 允许对象在操作的第一秒或一段时间不活动后 IOPS 达到限制速率的两倍。

对象空间预留
此设置定义了部署虚拟机时必须预留(置备)的虚拟机磁盘 (vmdk) 对象的逻辑大小百分比。 VMware Cloud on AWS 中的默认预留值为 0%( 精简置备)。您可以指定 厚置备以便为大于预期的 vSAN 写入预留容量,但底层 vmdk 结构仍与 精简置备配置相同,并且不同于内部部署的厚置备快速置零置备模式。
闪存读取缓存预留
VMware Cloud on AWS 中会忽略此设置。在混合 vSAN 部署中,它指定为读取缓存预留多少闪存容量。
禁用对象校验和
如果该选项设置为 ,该对象将计算校验和信息来确保其数据的完整性。如果该选项设置为 ,该对象不计算校验和信息。

vSAN 使用端到端校验和来确保数据的完整性,即确认文件的每个副本都与源文件完全相同。系统会在读取/写入操作期间检查数据的有效性,如果检测到错误,vSAN 将修复数据或报告错误。

如果检测到校验和不匹配,vSAN 将使用正确数据覆盖错误数据来自动修复数据。校验和计算和错误更正作为后台操作执行。

群集中所有对象的默认设置为,表示启用校验和。

强制置备
如果该选项设置为 ,则即使数据存储不满足存储策略中指定的 允许的故障数主要级别每个对象的磁盘带数闪存读取缓存预留策略,也会置备该对象。该参数可在引导时以及在出现故障无法再进行标准置备时使用。

默认值对于大多数生产环境都是可接受的。当不满足策略要求时,vSAN 无法置备虚拟机,但是可以成功创建用户定义的存储策略。

VMware Cloud on AWS 受管存储策略配置文件

在 SDDC 中创建群集时,VMware Cloud on AWS 会创建一个受管存储策略配置文件,该配置文件将作为默认存储策略应用于在群集中创建的虚拟机。此存储策略配置文件的名称为“VMC Workload Storage Policy - cluster name”。策略设置已配置,以便确保群集满足 VMware Cloud on AWS 服务级别协议 (SLA) 中所述的要求。

受管存储策略设置基于群集配置,如下所示:

  • SLA 未涵盖单主机 SDDC。它们使用无数据冗余策略。
  • 单 AZ 群集根据群集大小和主机实例类型使用精简置备和容错:
    • 使用 Elastic vSAN 存储的群集使用 1 个故障 - RAID-1 (镜像) 策略,而不考虑群集大小。
    • 使用非 Elastic vSAN 存储的群集(包含 3 到 5 个主机)使用 1 个故障 - RAID-1 (镜像)
    • 使用非 Elastic vSAN 存储的群集(包含 6 个或更多的主机)使用 2 个故障 - RAID-6 (纠删码)
  • 延伸群集使用 1 个故障 - RAID-1 (镜像),同时将站点灾难容差设置为双站点监控

由于非 Elastic vSAN 群集的受管存储策略因群集大小而异,因此,如果添加或移除主机会更改群集大小,则会触发存储策略重新配置,以便需要不同的策略。例如,如果再将一个主机添加到包含五个 i3.metal 主机的群集中,该群集的存储策略将从 1 个故障 - RAID-1 (镜像) 重新配置为 2 个故障 - RAID-6 (纠删码)。如果移除额外主机,并且主机数量从六个减少到五个,则会执行反向操作。

注: 对触发受管存储策略重新配置的群集进行更改时,重新配置将暂时需要额外的存储。如果群集占用的容量接近 75% 的存储容量,则可能会触发 EDRS 扩大事件,从而将主机添加到群集。重新配置完成后,EDRS 可能不会移除该额外添加的主机。存储重新配置后检查群集,并在必要时移除额外主机。

对于具有 6 个或更多主机的非 Elastic vSAN 群集,如果群集存储利用率大于总存储容量的 40%,则无法移除主机。对于所有其他类型的群集,VMware 强烈建议,如果群集存储利用率大于总存储容量的 40%,则不要移除主机。

如果从群集中移除一个或多个主机,并触发受管存储策略重新配置,则必须先完成重新配置,然后再移除一个或多个主机。如果工作负载使用大量存储,则此重新配置可能需要几小时到几天才能完成。在此期间,您已指定要移除的任何主机仍可用,您仍需根据主机使用情况付费。存储策略重新配置完成后,一个或多个主机将移除,您不再需要根据主机使用情况付费。

注: 请勿编辑 VMware Cloud on AWS 为群集创建的受管存储策略。如果重命名策略,则该策略将不再由 VMware Cloud on AWS 进行管理。如果编辑受管存储策略的设置,则下次重新配置存储策略时将覆盖您所做的更改。

如果不希望使用受管存储策略,则可以定义自己的存储策略,并将其分配给工作负载数据存储的默认策略。请参见https://docs.vmware.com/cn/VMware-vSphere/7.0/com.vmware.vsphere.vsan.doc/GUID-F52F0AE9-FB31-4236-B566-D9610B14C670.html

虚拟机模板和受管存储策略

如果虚拟机模板与 VMware Cloud on AWS 受管存储策略关联,则重新配置群集的策略时,模板的策略不会自动更新。重新配置群集的存储策略后,虚拟机模板合规性状态变为“已过期”。要使模板策略状态变为“合规”,必须将模板转换为虚拟机,重新应用虚拟机存储策略,然后再将虚拟机转换回模板。

从模板部署虚拟机时,VMware 建议对“虚拟机存储策略”选择数据存储默认值,以确保虚拟机使用当前的群集受管存储策略进行部署。

存储策略和 SLA 要求

使用虚拟机存储策略时,务必了解它们对 vSAN 群集中的存储容量消耗有何影响以及是否满足 VMware Cloud on AWS 服务级别协议 (SLA) 中定义的要求。

受管存储策略最初根据群集中的主机数量进行配置。例如,三主机群集默认为 FTT=1,使用 RAID-1 镜像策略。单 AZ 中具有六个以上 i3.metal 主机的群集默认为 2 个故障 - RAID-6 (纠删码)。您可以创建自定义策略,使数据可用性与基础数据的需求保持一致,但如果工作负载虚拟机的存储策略没有达到服务级别协议中规定的要求,则可能无法获得 SLA 积分。虚拟机存储策略必须配置适当的保护级别。临时工作负载可能会使用“无数据冗余”策略来节省容量,从而放弃所有 SLA 可用性保证。

重要事项:

将 i3.metal 群集从 5 个主机纵向扩展到 6 个主机时,底层策略的容错必须更新为 2 个故障 - RAID-6 (纠删码)2 个故障 - RAID-6 (镜像) 以补偿更大的故障池。使用受管存储策略的群集将自动进行重新配置,但必须手动更新使用自定义策略的所有群集。如果对此主机配置继续使用容错为 1,意味着 VMware 无法根据保证服务定义指南提供可用性保证。使用 Elastic vSAN 的 R5.metal 群集能够使用容错为 1 保持 SLA 合规性,适用于包含 3 个或更多主机的任何群集。

有关存储策略的设计和优化调整注意事项的详细信息,请参见《管理 VMware vSAN》文档。