集群是一组具有共享资源和共享管理界面的 ESXi 主机和相关虚拟机。必须首先创建集群并激活 DRS,然后才能从集群级别资源管理中获益。

在集群中使用 vSphere Fault Tolerance (vSphere FT) 虚拟机时,DRS 的行为有所不同,具体取决于是否激活增强型 vMotion 兼容性 (EVC)。

表 1. 在使用 vSphere FT 虚拟机和 EVC 情况下的 DRS 行为
EVC DRS(负载均衡) DRS(初始放置)
已启用 已启用(主虚拟机和辅助虚拟机) 已启用(主虚拟机和辅助虚拟机)
已禁用 已禁用(主虚拟机和辅助虚拟机)

已禁用(主虚拟机)

全自动(辅助虚拟机)

准入控制和初始放置

尝试在已启用 DRS 的集群内打开一个或一组虚拟机的电源时,vCenter Server 会执行准入控制。它会检查集群内是否有足够的资源来支持虚拟机。

如果集群没有足够的资源,无法打开单个虚拟机的电源,或无法打开组启动尝试中任何虚拟机的电源,将会显示一条消息。否则,对于每台虚拟机,DRS 将生成要在其上运行虚拟机的主机的建议,并执行以下操作之一

  • 自动执行放置建议。
  • 显示用户随后可以选择接受或覆盖的放置建议。
    注: 对于独立主机或非 DRS 集群内的虚拟机,不提出任何初始放置建议。这些虚拟机将在打开电源时被置于当前所在的主机上。
  • DRS 会考虑网络带宽。通过计算主机网络饱和度,DRS 可以更好地做出放置决策。更全面地了解环境,有助于避免虚拟机的性能下降。

单个虚拟机打开电源

在 DRS 集群中,可以打开单个虚拟机的电源,并接受初始放置位置建议。

打开单个虚拟机电源时,有两种类型的初始放置位置建议:

  • 打开单个虚拟机电源,不需要任何必备条件步骤。

    用户将拥有虚拟机的初始放置位置建议列表,这些建议是互斥的。您只能选择一种建议。

  • 打开单个虚拟机的电源,但需要执行必备条件操作。

    这些操作包括在待机模式下打开主机电源或在主机间迁移其他虚拟机。在这种情况下,提供的建议具有多行,显示每个必备条件操作。用户可以接受整个建议,也可以取消打开虚拟机电源。

组启动

可以尝试同时打开多个虚拟机的电源(组启动)。

选定进行组启动尝试的虚拟机不必位于同一个 DRS 集群内。可以在集群间选择虚拟机,但它们必须属于同一数据中心。也可以包括位于非 DRS 集群或独立主机上的虚拟机。这些虚拟机会自动开机并且不包括在任何初始放置建议中。

每个集群均提供组启动尝试的初始放置建议。如果组启动尝试的所有放置相关操作都处于自动模式,虚拟机将开机且不会提供任何初始放置建议。如果所有虚拟机的放置相关操作均处于手动模式,则会手动打开所有虚拟机的电源(包括处于自动模式的虚拟机)。这些操作包含在初始放置建议中。

对于已打开电源的虚拟机所属的每个 DRS 集群,均会有一个建议,其中包含所有必备条件(或没有建议)。所有特定于此类集群的建议都显示在启动建议选项卡下。

如果进行了非自动组启动尝试,并且包括不受初始放置建议限制的虚拟机(即独立主机上的虚拟机或非 DRS 集群中的虚拟机),vCenter Server 会尝试自动打开这些虚拟机的电源。如果这些虚拟机开机成功,则会显示在已开始启动选项卡下。所有无法开机的虚拟机将显示在失败的启动选项卡下。

组启动

用户选择同一数据中心中的三个虚拟机进行组启动尝试。前两个虚拟机(VM1 和 VM2)在同一 DRS 集群 (Cluster1) 中,而第三个虚拟机 (VM3) 则在一台独立主机上。VM1 处于自动模式,而 VM2 处于手动模式。在此方案中,用户将获得 Cluster1 的初始放置建议(位于启动建议选项卡下),其中包含打开 VM1 和 VM2 电源的操作。将尝试自动打开 VM3 的电源,如果成功,将会显示在已开始启动选项卡下。如果此尝试失败,将会显示在失败的启动选项卡下。

虚拟机迁移

尽管 DRS 执行初始放置位置以便跨集群平衡负载,但是虚拟机负载和资源可用性中的更改可能会导致集群失衡。要更正此失衡情况,DRS 将生成迁移建议。

如果在集群上启用了 DRS,则可以更均匀地分配负载,从而降低不平衡程度。例如,下图中左侧的三台主机不平衡。假定主机 1、主机 2 和主机 3 具有相同的容量,且所有虚拟机的配置和负载(包括预留,如果已设置)均相同。但是,由于主机 1 有六个虚拟机,其资源可能被过度利用,而主机 2 和主机 3 上有丰富的可用资源,因此,DRS 会将虚拟机从主机 1 迁移到主机 2 和主机 3(或提出迁移建议)。该图右侧显示了正确平衡负载之后所呈现的主机配置。

图 1. 负载平衡

此图显示 DRS 如何重新平衡集群。

当集群不平衡时,DRS 将根据默认的自动化级别,提出建议或迁移虚拟机:

  • 如果所涉及的集群或任何虚拟机为手动或半自动,则 vCenter Server 不执行自动操作来平衡资源。“摘要”页面会指示有迁移建议,“DRS 建议”页面会显示最有效地利用集群内资源的更改建议。
  • 如果所涉及的集群或虚拟机均为全自动,则 vCenter Server 将根据需要在主机间迁移正在运行的虚拟机,以确保高效利用集群资源。

    注: 即使是在自动迁移设置中,用户也可以显式迁移单个虚拟机,但 vCenter Server 可能会将这些虚拟机迁移到其他主机,以优化集群资源。

默认情况下,自动化级别是为整个集群指定的。也可以为单个虚拟机指定自定义的自动化级别。

DRS 迁移阈值

DRS 迁移阈值允许您指定要生成并应用的建议(如果建议中所涉及的虚拟机处于全自动模式)或要显示的建议(如果处于手动模式)。此阈值是衡量 DRS 在建议迁移中提高虚拟机良好状态的激进程度的指标。

可以移动阈值滑块以使用从“保守”到“激进”这五个设置中的一个。激进程度设置越高,DRS 建议迁移以提高虚拟机良好状态的频率就越高。“保守”设置仅生成优先级 1 的建议(强制性建议)。

在建议收到优先级后,会将该级别与您所设置的迁移阈值进行比较。如果优先级低于或等于阈值设置,则会应用该建议(如果相关虚拟机均处于全自动模式),或向用户显示该建议以进行确认(如果处于手动或半自动模式)。

DRS 评分

每个迁移建议都使用虚拟机幸福感衡量指标进行计算,该衡量指标用于衡量执行效率。该衡量指标在vSphere Client中的集群“摘要”选项卡中显示为“DRS 评分”。DRS 负载平衡建议尝试改进虚拟机的 DRS 评分。“集群 DRS 评分”是集群中所有已打开电源的虚拟机的“虚拟机 DRS 评分”的加权平均值。“集群 DRS 评分”显示在计量器组件中。填充部分的颜色将随值而变化,以与“虚拟机 DRS 评分”直方图中的相应直条匹配。直方图中的直条显示在该范围内具有 DRS 评分的虚拟机所占百分比。可以利用以下方法通过服务器端排序和筛选查看列表:选择集群的“监控”选项卡,然后选择“vSphere DRS”,将显示集群中按其 DRS 评分升序排序的虚拟机列表。

迁移建议

如果创建带有默认模式(手动或半自动)的集群,则 vCenter Server 将在“DRS 建议”页面上显示迁移建议。

系统将提供足够的建议,以强制实施规则并平衡集群的资源。每条建议均包含要移动的虚拟机、当前(源)主机和目标主机,以及提出建议的原因。原因可能为以下之一:

  • 平衡平均 CPU 负载或预留。
  • 平衡平均内存负载或预留。
  • 满足资源池预留。
  • 满足关联性规则。
  • 主机正在进入维护模式或待机模式。
注: 如果使用 vSphere Distributed Power Management (DPM) 功能,那么,除了迁移建议外,DRS 还会提供主机电源状况建议。

DRS 集群要求

添加到 DRS 集群的主机必须满足某些要求才能成功使用集群功能。

注: vSphere DRS 是 vSphere 的一项重要功能,要维持在 vSphere 集群内运行的工作负载正常运行,必须使用此功能。从 vSphere 7.0 Update 1 开始,DRS 依赖于 vCLS 虚拟机的可用性。有关详细信息,请参见 vSphere 集群服务

共享存储器要求

DRS 集群具有特定的共享存储要求。

确保受管主机使用共享存储器。共享存储器通常位于 SAN 上,但也可以通过使用 NAS 共享存储器来实现。

有关其他共享存储器的信息,请参见《vSphere 存储》文档。

共享的 VMFS 卷要求

DRS 集群具有某些共享的 VMFS 卷要求。

配置所有受管主机以使用共享 VMFS 卷。

  • 将所有虚拟机的磁盘置于可通过源主机和目标主机访问的 VMFS 卷上。
  • 确保 VMFS 卷足够大,可以存储虚拟机的所有虚拟磁盘。
  • 确保源主机及目标主机上的所有 VMFS 卷都使用卷名称,并且所有虚拟机都使用这些卷名称来指定虚拟磁盘。
注: 虚拟机交换文件还需要放在源主机和目标主机均可以访问的 VMFS 上(就像 .vmdk 虚拟磁盘文件一样)。如果所有的源主机及目标主机都是 ESX Server 3.5 或更高版本,并且使用主机-本地交换,则此要求将不适用。这种情况下,支持将带有交换文件的 vMotion 置于非共享存储器上。默认情况下,交换文件置于 VMFS 上,但管理员可以使用高级虚拟机配置选项替代此文件位置。

处理器兼容性要求

DRS 集群具有特定的处理器兼容性要求。

为了避免限制 DRS 的功能,应当将集群内源和目标主机的处理器兼容性最大化。

vMotion 在基础 ESXi 主机之间传输虚拟机的运行架构状况。vMotion 兼容性是指目标主机的处理器必须能够使用等效指令,从源主机的处理器在挂起时的状态继续执行。处理器时钟速度和缓存大小可能不同,但处理器必须属于相同的供应商类别(Intel 与 AMD)和相同的处理器系列,以便达到通过 vMotion 迁移所需的兼容性。

处理器系列由处理器供应商定义。可以通过比较处理器的型号、步进级别和扩展功能来区分同一系列中的不同处理器版本。

有时,处理器供应商在同一处理器系列中引入了重大的架构更改(例如 64 位扩展及 SSE3)。如果不能保证通过 vMotion 成功迁移,VMware 会识别这些异常情况。

vCenter Server 提供了一些有助于确保通过 vMotion 迁移的虚拟机满足处理器兼容性要求的功能。这些功能包括:

  • 增强型 vMotion 兼容性 (EVC) - 可以使用 EVC 帮助确保集群内主机的 vMotion 兼容性。EVC 可以确保集群内的所有主机向虚拟机提供相同的 CPU 功能集,即使这些主机上的实际 CPU 不同也是如此。这样可以避免因 CPU 不兼容而导致通过 vMotion 迁移失败。

    在“集群设置”对话框中配置 EVC。为了使集群能够使用 EVC,集群内的主机必须满足某些要求。有关 EVC 和 EVC 要求的信息,请参见《vCenter Server 和主机管理》文档。

  • CPU 兼容性掩码 - vCenter Server 会将虚拟机可用的 CPU 功能与目标主机的 CPU 功能进行比较,以确定是允许还是禁止通过 vMotion 迁移。通过将 CPU 兼容性掩码应用到单个虚拟机,可以向虚拟机隐藏某些 CPU 功能,从而防止由于 CPU 不兼容而造成的 vMotion 迁移失败。

DRS 集群的 vMotion 要求

DRS 集群具有特定的 vMotion 要求。

要启用 DRS 迁移建议的使用,集群内的主机必须是 vMotion 网络的一部分。如果主机不在 vMotion 网络中,DRS 仍可提供初始放置位置建议。

要为 vMotion 进行配置,集群内的每台主机必须满足下列要求:

  • vMotion 不支持裸磁盘,也不支持对借助于 Microsoft 集群服务 (MSCS) 集群的应用程序进行迁移。
  • vMotion 要求在所有启用了 vMotion 的受管主机之间设置专用的千兆以太网迁移网络。在受管主机上启用 vMotion 后,需要为受管主机配置唯一的网络标识对象并将其连接到专用迁移网络。

配置带有虚拟闪存的 DRS

DRS 可以管理具有虚拟闪存预留的虚拟机。

虚拟闪存容量会显示为主机定期向 vSphere Client 报告的统计数据。DRS 每次运行时,都使用最新报告的容量值。

可以在每个主机上配置一个虚拟闪存资源。这表示在虚拟机打开电源期间,DRS 不需要在给定主机上的不同虚拟闪存资源之间进行选择。

DRS 选择具有足够可用虚拟闪存容量的主机以启动虚拟机。如果 DRS 无法满足虚拟机的虚拟闪存预留,则无法打开其电源。DRS 将具有虚拟闪存预留且打开电源的虚拟机视为与其当前主机之间具有软关联性。DRS 建议不要使用此类虚拟机执行 vMotion 操作,除非有必须使用的理由,例如将主机置于维护模式或者降低使用过度的主机上的负载。

创建集群

集群是一组主机。将主机添加到集群时,主机的资源将成为集群资源的一部分。集群管理其中所有主机的资源。

集群启用 vSphere High Availability (HA) 和 vSphere Distributed Resource Scheduler (DRS) 解决方案。
注: vSphere DRS 是 vSphere 的一项重要功能,要维持在 vSphere 集群内运行的工作负载正常运行,必须使用此功能。从 vSphere 7.0 Update 1 开始,DRS 依赖于 vCLS 虚拟机的可用性。有关详细信息,请参见 vSphere 集群服务

前提条件

  • 确认您拥有足够的权限,可以创建集群对象。
  • 确认清单中存在数据中心。
  • 如果想要使用 vSAN,必须在配置 vSphere HA 之前启用它。

过程

  1. vSphere Client 中,浏览到数据中心。
  2. 右键单击该数据中心并选择新建集群
  3. 输入集群名称。
  4. 选择 DRS 和 vSphere HA 集群功能。
    选项 描述
    将 DRS 用于此集群的步骤
    1. 选中 DRS 打开复选框。
    2. 选择一个自动化级别和迁移阈值。
    将 HA 用于此集群的步骤
    1. 选中 vSphere HA 打开复选框。
    2. 选择是否启用主机监控和准入控制。
    3. 如果启用准入控制,请指定策略。
    4. 选择一个虚拟机监控选项。
    5. 指定虚拟机监控敏感度。
  5. 选择增强型 vMotion 兼容性 (EVC) 设置。
    EVC 可以确保集群内的所有主机向虚拟机提供相同的 CPU 功能集,即使这些主机上的实际 CPU 不同也是如此。这样可以避免因 CPU 不兼容而导致通过 vMotion 迁移失败。
  6. 单击确定

结果

已将集群添加到清单中。

下一步做什么

将主机和资源池添加到集群。
注:集群摘要页面下,可以看到 集群服务,其中显示了 vSphere 集群服务运行状况。

编辑集群设置

将主机添加到 DRS 集群时,主机的资源将成为集群资源的一部分。除了这种资源聚合外,您还可以使用 DRS 集群支持集群范围内的资源池并强制执行集群级别的资源分配策略。

还提供下面的集群级别的资源管理功能。

负载均衡
将持续监控集群内所有主机和虚拟机的 CPU 和内存资源的分布情况和使用情况。在给出集群内资源池和虚拟机的属性、当前需求以及不均衡目标的情况下,DRS 会将这些衡量指标与理想状态下的资源使用情况进行比较。然后,DRS 提供建议或相应地执行虚拟机迁移。请参见 虚拟机迁移。当您在集群中打开虚拟机电源时,DRS 将尝试通过在相应主机上放置该虚拟机或提出建议来保持适当的负载均衡。请参见 准入控制和初始放置
电源管理
vSphere Distributed Power Management (DPM) 功能启用后,DRS 会将集群级别和主机级别容量与集群的虚拟机需求(包括近期历史需求)进行比较。然后,在找到足够的额外容量时,DRS 建议您将主机置于待机状态,或将主机置于待机电源模式。如果需要容量,DRS 会打开主机电源。根据提出的主机电源状况建议,可能需要将虚拟机迁移到主机并从主机迁移虚拟机。请参见 管理电源资源
关联性规则
可以通过分配关联性规则控制集群内主机上的虚拟机的放置。请参见 将关联性规则与 vSphere DRS 结合使用

前提条件

可以在没有特殊许可证的情况下创建集群,但必须要有许可证才能为 vSphere DRS 或 vSphere HA 启用集群。
注: vSphere DRS 是 vSphere 的一项重要功能,要维持在 vSphere 集群内运行的工作负载正常运行,必须使用此功能。从 vSphere 7.0 Update 1 开始,DRS 依赖于 vCLS 虚拟机的可用性。有关详细信息,请参见 vSphere 集群服务

过程

  1. vSphere Client 中浏览到某个集群。
  2. 依次单击配置选项卡和服务
  3. vSphere DRS 下,单击编辑
  4. DRS 自动化下,为 DRS 选择默认的自动化级别。
    自动化级别 操作
    手动
    • 初始放置:显示建议的主机。
    • 迁移:显示迁移建议。
    半自动
    • 初始放置:自动。
    • 迁移:显示迁移建议。
    全自动
    • 初始放置:自动。
    • 迁移:自动运行建议。
  5. 设置 DRS 的迁移阈值
  6. 选中 Predictive DRS 复选框。除了实时衡量指标以外,DRS 还响应 vRealize Operations 服务器提供的预测衡量指标。您还必须在支持该功能的 vRealize Operations 版本中配置 Predictive DRS
  7. 选中虚拟机自动化复选框以启用个别虚拟机自动化级别。
    可在“虚拟机替代项”页面中设置个别虚拟机的替代项。
  8. 其他选项下,选中一个复选框以执行某项默认策略。
    选项 描述
    虚拟机分布 出于可用性目的,在各主机间分布偶数数量的虚拟机。这是 DRS 负载均衡的辅助方式。
    用于负载均衡的内存衡量指标 负载均衡基于虚拟机的已消耗内存而不是活动内存。仅建议将此设置用于主机内存未超额分配的集群。
    注: 此设置不再受支持,将不会显示在 vCenter 7.0 中。
    CPU 超额分配 控制集群中的 CPU 超额分配。
    可扩展份额 为此集群上的资源池启用可扩展份额。
  9. 电源管理下,选择“自动化级别”。
  10. 如果已启用 DPM,请设置 DPM 阈值
  11. 单击确定

下一步做什么

注:集群摘要页面下,可以看到 集群服务,其中显示了 vSphere 集群服务运行状况。

您可以在 vSphere Client 中查看 DRS 的内存利用率。要了解详细信息,请参见:

设置虚拟机的自定义自动化级别

创建 DRS 集群后,可以为各个虚拟机自定义自动化级别,以替代集群的默认自动化级别。

例如,可以为全自动的集群内的特定虚拟机选择手动,或为手动集群内的特定虚拟机选择半自动

如果虚拟机已设置为已禁用,则 vCenter Server 将不会迁移该虚拟机或为其提供迁移建议。

过程

  1. vSphere Client 中,浏览到集群。
  2. 依次单击配置选项卡和服务
  3. 在“服务”下,选择 vSphere DRS,然后单击编辑。展开“DRS 自动化”。
  4. 选中启用单个虚拟机自动化级别复选框。
  5. 要临时停用任何单个虚拟机替代项,请取消选中启用个别虚拟机自动化级别复选框。
    再次选中此复选框时,将还原虚拟机设置。
  6. 要临时挂起集群中的所有 vMotion 活动,请将集群置于手动模式,并取消选中启用个别虚拟机自动化级别复选框。
  7. 选择一个或多个虚拟机。
  8. 单击自动化级别列,然后从下拉菜单选择自动化级别。
    选项 描述
    手动

    将显示放置和迁移建议,但在手动应用建议之前,不会运行这些建议。

    全自动

    放置和迁移建议会自动运行。

    半自动 初始放置会自动执行。将显示迁移建议,但不运行。
    已禁用

    vCenter Server将不会迁移虚拟机或为其提供迁移建议。

  9. 单击确定

结果

注:

其他 VMware 产品或功能(如 vSphere vApp 和 vSphere Fault Tolerance)可能会替代 DRS 集群内虚拟机的自动化级别。有关详细信息,请参见特定于产品的文档。

停用 DRS

可以关闭集群的 DRS。

停用 DRS 时:

  • DRS 关联性规则不会被移除,但在重新激活 DRS 之前不会应用这些规则。
  • 主机和虚拟机组不会被移除,但在重新激活 DRS 之前不会应用这些组。
  • 资源池将从集群中永久移除。为了避免丢失资源池,请在本地计算机上保存资源池树快照。激活 DRS 时,可以使用快照还原资源池。
注: 如果激活了工作负载管理,请勿停用 DRS,否则 WCP 服务将不可恢复。

过程

  1. vSphere Client 中,浏览到集群。
  2. 依次单击配置选项卡和服务
  3. vSphere DRS 的下面,单击编辑
  4. 取消选中打开 vSphere DRS 复选框。
  5. 单击确定,关闭 DRS。
  6. (可选) 选择用于保存资源池的选项。
    • 单击以在本地计算机上保存资源池树快照。
    • 单击以关闭 DRS,而不保存资源池树快照。

结果

DRS 已关闭。
注: vSphere DRS 是 vSphere 的一项重要功能,要维持在 vSphere 集群内运行的工作负载正常运行,必须使用此功能。从 vSphere 7.0 Update 1 开始,DRS 依赖于 vCLS 虚拟机的可用性。有关详细信息,请参见 vSphere 集群服务

还原资源池树

您可以还原以前保存的资源池树快照。

前提条件

  • vSphere DRS 必须打开。
  • 您只能在创建快照的同一集群中还原快照。
  • 在该集群中不存在其他资源池。
  • 必须始终在同一版本的 vCenter 和 ESXi 上执行备份和还原。

过程

  1. vSphere Client 中,浏览到集群。
  2. 右键单击该集群,然后选择还原资源池树
  3. 单击浏览,然后在本地计算机上查找快照文件。
  4. 单击打开
  5. 单击确定以还原该资源池树。

vSAN 延伸集群的 DRS 感知

启用 DRS 的延伸集群上提供 vSAN 延伸集群的 DRS 感知。vSAN 延伸集群具有读取局部性,其中虚拟机从本地站点读取数据。从远程站点获取读取可能会影响虚拟机性能。借助 vSAN 延伸集群的 DRS 感知,DRS 现在可以完全感知虚拟机读取局部性,并且将虚拟机放在完全满足读取局部性的站点上。这是自动操作,没有可配置选项。vSAN 延伸集群的 DRS 感知使用现有关联性规则。它还可与 VMware Cloud on AWS 配合使用。

具有 vSphere HA 和 vSphere DRS 的 vSAN 延伸集群通过将两个数据副本分散到两个故障域以及第三个故障域中的一个见证节点提供灵活性,以防出现故障。两个活动故障域提供数据复制,以便两个故障域具有数据的当前副本。

vSAN 延伸集群提供了在两个故障域中自动移动工作负载的方法。如果整个站点发生故障,vSphere HA 将在辅助站点上重新启动虚拟机。这可确保关键生产工作负载不会停机。在主站点重新联机后,DRS 会立即使用软性关联性主机将虚拟机重新平衡回主站点。此过程会导致在虚拟机数据组件仍在重建时从辅助站点读取和写入虚拟机,并且可能会降低虚拟机性能。

在 vSphere 7.0 U2 之前的版本中,我们建议将 DRS 从全自动模式更改为半自动模式,以避免在进行重新同步时将虚拟机迁移到主站点。仅在重新同步完成后,才能将 DRS 重新设置为全自动。

vSAN 延伸集群的 DRS 感知引入全自动读取局部性解决方案,用于从 vSAN 延伸集群上的故障中恢复。读取局部性信息指出虚拟机具有完全访问权限的主机,且在将虚拟机放在 vSAN 延伸集群上的主机上时,DRS 会使用此信息。DRS 可防止在站点恢复阶段 vSAN 重新同步仍在进行时虚拟机回退到主站点。当虚拟机的数据组件达到完全读取局部性时,DRS 会自动将虚拟机迁移回主关联站点。这样,您可以在整个站点发生故障时以全自动模式运行 DRS。

在部分站点发生故障时,如果虚拟机由于丢失的数据组件超过或等于其允许的故障数而丢失读取局部性,vSphere DRS 将确定消耗极高读取带宽的虚拟机,并尝试将其重新平衡到辅助站点。这可确保在部分站点故障期间,具有大量读取工作负载的虚拟机不会减少。在主站点重新联机并且数据组件已完成重新同步后,虚拟机将移回其关联站点。

vGPU 的DRS放置

DRS 在集群的主机之间分发 vGPU 虚拟机。

DRS 将在集群的主机之间以广度优先的方式分发 vGPU 虚拟机。虚拟机的小数 vGPU 配置文件分配可能受同类配置文件相互排除规则的约束。

  • 手动将 vGPU 虚拟机迁移到所需的主机,以打开未使用的物理 GPU 容量。
  • 在集群中的所有 vGPU 虚拟机中使用相同的 vGPU 配置文件配置。
  • 启用主机“GPU 整合”。有关详细信息,请参见配置主机图形
  • 如果 DRS 自动化处于活动状态,请考虑将集群或虚拟机置于部分自动化模式。有关详细信息,请参见编辑集群设置

虚拟机的 DRS 开销内存管理

在 vSphere 8.0 U3 中,DRS 增强了要重新配置的虚拟机的开销内存管理。

在 VMware vSphere 中,开销内存是指 ESXi 用于管理虚拟机 (VM) 的内存量。此内存是 ESXi 执行其功能所必需的,它与分配给虚拟机的客户机内存是分开的。开销内存量取决于多个因素,包括虚拟 CPU (vCPU) 的数量、分配给虚拟机的内存量以及虚拟机的配置和硬件版本。vCPU 越多,分配的内存越大,消耗的开销内存就越大。在 vSphere 中,DRS 与 ESXi 内存管理配合使用,以确保虚拟机具有最佳开销内存使用。DRS 通过设置虚拟机开销内存限制来管理开销内存,并允许 ESXi 使用该限制内的开销内存。

在 VMware vSphere 中重新配置虚拟机会直接影响 ESXi 管理虚拟机所需的开销内存。更改虚拟机的配置(如修改 vCPU 数量、分配的 RAM 量或添加虚拟硬件,如网络适配器或磁盘控制器)时,开销内存要求可能会发生变化。例如,将虚拟机预留从 250GB 重新配置为 0GB 时,需要使用大约 25MB 的开销内存。ESXi 分配 25MB 的额外开销内存来管理虚拟页面与物理页面之间的页表映射。vSphere 监控并管理这些更改。但是,以前的 vSphere 版本并未自定义以适应这些开销内存增加的情况。如果新的开销内存增加超过开销限制,则可能会导致重新配置失败。

在 vSphere 8.0 U3 中,DRS 在进行任何重新配置之前主动更新虚拟机的开销内存限制。DRS 检查各种因素,包括虚拟机的资源规范、IO 筛选器和其他影响开销内存的元素。DRS 可确保新的开销限制满足重新配置后更新的虚拟机规范导致的开销内存预期增加,从而优化虚拟机性能和稳定性。

DRS 增强的开销内存管理可以通过在虚拟机进行重新配置之前智能地管理开销内存限制来帮助防止重新配置失败,从而显著降低重新配置失败的风险。这种主动方法可确保获得更可靠的体验。通过优化虚拟机性能和稳定性,虚拟环境可以高效且无中断地运行,尤其是在关键重新配置过程中。此增强功能可无缝集成到现有的 vSphere 环境中,同时提高性能和可靠性。