vSAN 存储策略定义对虚拟机的存储要求。这些策略决定了如何将存储分配给管理虚拟机和工作负载虚拟机。

VMware Cloud on AWS SDDC 中创建的第一个集群包括两个 vSAN 数据存储,一个用于管理虚拟机 (vsanDatastore),另一个用于工作负载虚拟机 (WorkloadDatastore)。这两个数据存储共享同一个底层存储设备,并使用同一池中的可用空间。在 SDDC 中创建的其他集群仅包含 WorkloadDatastore。

将为部署到 vSAN 数据存储的每个虚拟机至少分配一个虚拟机存储策略。您可以在创建或重新配置虚拟机时分配存储策略。

有关存储策略的详细信息,请参见 VMware Designlet 受管存储策略配置文件

vSAN 虚拟机存储策略的可用性属性

站点灾难容差
定义延伸集群处理站点故障时使用的数据冗余方法。此属性适用于延伸集群。如果使用标准 vSAN 集群,请选择“无 (标准集群)”。
选项如下所示:
  • 无 (标准集群)
  • 双站点镜像(延伸集群)
  • 无 - 在主站点上保留数据 (延伸集群)
  • 无 - 在辅助站点上保留数据 (延伸集群)
允许的故障数
定义虚拟机允许的主机和设备故障数。您可以选择无数据冗余,也可以选择针对性能(镜像)或容量(纠删码)优化的 RAID 配置。
  • RAID-1 使用更多磁盘空间,但性能更佳。
  • RAID-5/6(纠删码)使用较少的磁盘空间,但性能会下降。
表 1. RAID 配置、FTT 和主机要求
RAID 配置 允许的故障数 (FTT) 所需的最小主机数
RAID-1(镜像)这是默认设置。RAID-1 1 2
RAID-5(纠删码) 1 4
RAID-1(镜像) 2 5
RAID-6(纠删码) 2 6
RAID-1(镜像) 3 7
重要说明: 不建议使用 FTT = 0(无数据冗余)的虚拟机存储策略,如果出现主机故障或虚拟机变得无响应,可能会导致数据丢失。

受管存储策略配置文件确定了集群的初始 RAID 配置。将受管存储策略配置文件应用于集群后,RAID 配置将随着集群大小的更改自动更新。有关详细信息,请参见《VMware Cloud on AWS 受管存储策略配置文件》。

vSAN 虚拟机存储策略的高级属性

每个对象的磁盘带数
定义虚拟机对象的每个副本在其上进行条带化的存储设备的最低数量。值如果大于 1,则性能可能更佳,但也会导致使用更多系统资源。默认值为 1。最大值为 12。仅当 VMware 技术支持建议时才更改默认值。
对象的 IOPS 限制
定义对象(例如 VMDK)的 IOPS 限制。IOPS 使用加权大小计算,表示为 I/O 操作数。如果系统使用的默认基本大小为 32 KB,则 64-KB I/O 表示两个 I/O 操作。

计算 IOPS 时,读取和写入同等对待,但不考虑缓存命中率和顺序性。如果磁盘的 IOPS 超过此限制,将限制 I/O 操作。如果对象的 IOPS 限制设置为 0,将不会强制执行 IOPS 限制。

vSAN 允许对象在操作的第一秒或一段时间不活动后 IOPS 达到限制速率的两倍。

对象空间预留

此设置定义了部署虚拟机时必须预留(置备)的虚拟机磁盘 (vmdk) 对象的逻辑大小百分比。VMware Cloud on AWS 中的默认预留值为 0%(精简置备)。您可以指定厚置备以便为大于预期的 vSAN 写入预留容量,但底层 vmdk 结构仍与精简置备配置相同,并且不同于内部部署的厚置备快速置零置备模式。

存储资源中所述,您应考虑将对象空间预留 (OSR) 高级策略设置设为精简置备。OSR 仅控制空间预留,并且没有任何影响。尽管容量管理通常对内部部署数据中心至关重要,但 VMware Cloud on AWS Elastic DRS 可确保集群不会耗尽可用空间。

闪存读取缓存预留
VMware Cloud on AWS 中会忽略此设置。在混合 vSAN 部署中,它指定为读取缓存预留多少闪存容量。
禁用对象校验和
如果该选项设置为 ,该对象将计算校验和信息来确保其数据的完整性。如果该选项设置为 ,该对象不计算校验和信息。

vSAN 使用端到端校验和来确保数据的完整性,即确认文件的每个副本都与源文件完全相同。系统会在读取/写入操作期间检查数据的有效性,如果检测到错误,vSAN 将修复数据或报告错误。

如果检测到校验和不匹配,vSAN 将使用正确数据覆盖错误数据来自动修复数据。校验和计算和错误更正作为后台操作执行。

集群中所有对象的默认设置为,表示启用校验和。

强制置备
如果该选项设置为 ,则即使数据存储不满足存储策略中指定的 允许的故障数主要级别每个对象的磁盘带数闪存读取缓存预留策略,也会置备该对象。该参数可在引导时以及在出现故障无法再进行标准置备时使用。

默认值对于大多数生产环境都是可接受的。当不满足策略要求时,vSAN 无法置备虚拟机,但是可以成功创建用户定义的存储策略。

VMware Cloud on AWS 受管存储策略配置文件

在 SDDC 中创建集群时,VMware Cloud on AWS 会创建一个受管存储策略配置文件,该配置文件默认应用于在集群中创建的虚拟机。此存储策略配置文件的名称为“VMC Workload Storage Policy - cluster name”。策略设置可确保集群满足 VMware Cloud on AWS 服务级别协议 (SLA) 中所述的要求。将虚拟机迁移到同一 SDDC 中的不同集群时,还必须更改虚拟机存储策略。请参见将存储策略分配给虚拟机

受管存储策略设置基于集群配置:

  • SLA 未涵盖单主机 SDDC。它们使用无数据冗余策略。
  • 单 AZ 集群使用精简置备,并基于集群大小和主机实例类型设置故障容差值:
    • 包含 2 到 5 个主机的集群使用 1 个故障 - RAID-1 (镜像)
    • 包含 6 个或更多主机的集群使用 2 个故障 - RAID-6 (纠删码)
  • 最多包含 4 个主机的延伸群集使用无数据冗余并且将站点灾难容差设置为双站点镜像
  • 包含 6 个或更多主机的延伸集群使用 1 个故障 - RAID-1 (镜像),同时将站点灾难容差设置为双站点镜像

由于受管存储策略因集群大小而异,因此,如果添加或移除主机会更改集群大小,则会触发存储策略重新配置,以便需要不同的策略。例如,如果再将一个主机添加到包含五个主机的集群中,该集群的存储策略将从 1 个故障 - RAID-1 (镜像) 重新配置为 2 个故障 - RAID-6 (纠删码)。如果移除额外主机,并且主机数量从六个减少到五个,则会执行反向操作。

注: 对触发受管存储策略重新配置的集群进行更改时,重新配置将暂时需要额外的存储。如果集群占用的容量接近 79% 的存储容量,则可能会触发 EDRS 扩大事件,从而将主机添加到集群。重新配置完成后,EDRS 可能不会移除该额外添加的主机。存储重新配置后检查集群,并在必要时移除额外主机。

在包含 6 个主机的延伸集群中,无法移除主机。在包含 6 个主机的常规集群中,如果集群存储利用率大于总存储容量的 40%,则无法移除主机。对于所有其他集群类型,如果集群存储利用率大于总存储容量的 40%,则 VMware 强烈建议不要移除主机。

如果从集群中移除一个或多个主机时触发了受管存储策略重新配置,则必须先完成重新配置,然后再移除一个或多个主机。如果工作负载使用大量存储,则此重新配置可能需要几小时到几天才能完成。在此期间,您已指定要移除的任何主机仍可用,您仍需根据主机使用情况付费。存储策略重新配置完成后,一个或多个主机将移除,您不再需要根据主机使用情况付费。

注: 请勿编辑 VMware Cloud on AWS 为集群创建的受管存储策略。如果重命名策略,则该策略将不再由 VMware Cloud on AWS 进行管理。如果编辑受管存储策略的设置,则下次重新配置存储策略时将覆盖您所做的更改。

如果不希望使用受管存储策略,则可以定义自己的存储策略,并将其分配给工作负载数据存储的默认策略。请参见《管理 VMware vSAN》中的使用 vSAN 策略

虚拟机模板和受管存储策略

如果虚拟机模板与 VMware Cloud on AWS 受管存储策略关联,则重新配置集群的策略时,模板的策略不会自动更新。重新配置集群的存储策略后,虚拟机模板合规性状态变为“已过期”。要使模板策略状态变为“合规”,必须将模板转换为虚拟机,重新应用虚拟机存储策略,然后再将虚拟机转换回模板。

从模板部署虚拟机时,VMware 建议对“虚拟机存储策略”选择数据存储默认值,以确保虚拟机使用当前的集群受管存储策略进行部署。

存储策略和 SLA 要求

使用虚拟机存储策略时,务必了解它们对 vSAN 集群中的存储容量消耗有何影响以及是否满足 VMware Cloud on AWS 服务级别协议 (SLA) 中定义的要求。

受管存储策略最初根据集群中的主机数量进行配置。例如,三主机集群默认为 FTT=1,使用 RAID-1 镜像策略。单 AZ 中具有六个以上主机的集群默认为 2 个故障 - RAID-6 (纠删码)。您可以创建自定义策略,使数据可用性与基础数据的需求保持一致,但如果工作负载虚拟机的存储策略没有达到服务级别协议中规定的要求,则可能无法获得 SLA 积分。虚拟机存储策略必须配置适当的保护级别。临时工作负载可能会使用“无数据冗余”策略来节省容量,从而放弃所有 SLA 可用性保证。

重要说明:

将集群从 5 个主机纵向扩展到 6 个主机时,底层策略的容错必须更新为 2 个故障 - RAID-6 (纠删码)2 个故障 - RAID-1 (镜像) 以补偿更大的故障池。使用受管存储策略的集群将自动进行重新配置,但必须手动更新使用自定义策略的所有集群。如果对此主机配置继续使用容错为 1,意味着 VMware 无法根据保证服务定义指南提供可用性保证。

VMware 会定期检查虚拟机存储策略是否符合 SLA 要求,并在发现不合规策略时发送通知。

有关存储策略的设计和优化注意事项的详细信息,请参见管理 VMware vSAN