Intel 提供了 Intel Optane 永久内存模式 (PMem),在该模式下,硬件将 DRAM 隐藏为缓存并将 PMem 公开为系统内存。尽管 PMem 比 DRAM 便宜,但访问延迟更长,可能会导致性能下降问题。

问题

在内存模式下使用 PMem 时出现性能下降问题:
  • 如果活动内存高于可用 DRAM 内存的某个百分比,则虚拟机性能可能会下降,因为内存访问可能需要转到 PMem。
  • 任意两个随机虚拟机都可能会由于硬件实施而发生更高级别的页冲突,从而导致虚拟机性能下降,即使可用 DRAM 内存已充分利用也是如此。

解决方案

vSphere 使用 vSphere 内存监控和修复 (vMMR) 执行实时监控。vMMR 收集主机级别和虚拟机级别的内存统计信息,如 DRAM/PMem 带宽、延迟、丢失率,这些提供了额外见解。这有助于分析主机是否由于在内存模式下运行而遇到问题,以及是否需要重新分发工作负载。如果分析表明某些工作负载由于在内存模式下配置的系统上运行而导致性能下降,则可以将虚拟机从当前主机迁移到其他主机以均衡负载。

  • 根据新收集的统计信息增加了两个预配置的默认警报。一个在主机级别(主机内存模式活动 DRAM 使用情况较高),另一个在虚拟机级别(虚拟机 PMem 带宽使用情况较高)。如果满足警报条件,将发布事件以触发相应的警报。如果触发了警报,则表明此系统上的内存模式可能有问题。可以使用性能图表进一步分析是否确实存在问题。
  • 还可以根据集群/主机或虚拟机级别的新性能衡量指标创建自定义警报。例如,可以在观察到 PMem 带宽高于某个值时创建警报。vMMR 警报仅适用于采用内存模式的系统。有关如何创建自定义警报的详细信息,请参见创建或编辑警报部分。
  • 如果主机遇到性能问题,则可以通过查看现有性能图表将问题范围缩小到 CPU、内存、磁盘或网络问题。

    在 vSphere Client 中,在主机和虚拟机的“性能”选项卡下增加了一个新的内存窗格。主机级别的性能图表显示不同内存类型(DRAM、PMem)的读取/写入带宽、丢失率。虚拟机级别的性能图表显示虚拟机的 DRAM 和 PMem 读取带宽。这些性能图表可帮助客户分析统计信息,并确定其应用程序工作负载是否因内存模式而出现性能下降问题。例如,如果观察到 PMem 带宽明显增加,则表明内存模式导致出现问题,可以进一步调查。

  • 还可以使用高级选项并绘制一些与内存模式相关的衡量指标,在主机和虚拟机级别绘制基于自定义的性能图表。
  • 从 ESXi 主机的“虚拟机”选项卡中,可以查看包含驻留在该主机上的所有虚拟机的性能信息的列表。要显示有关内存模式对虚拟机的影响的信息,请单击视图列 (视图列) 图标,然后选择新添加的“活动内存”、“DRAM 读取带宽”和“PMem 读取带宽”衡量指标。这有助于发现受影响最大的虚拟机。

有关 vMMR 的详细信息,请参见《vSphere 内存监控和修复》文档。