vRealize Operations Manager提供选定主机的衡量指标组。各组会为主机显示最相关的衡量指标,帮助监控环境。

要显示衡量指标组,请在“环境概览”中选择一个主机,随后选择所有衡量指标选项卡。

要显示一个组内包含的衡量指标,请单击组旁边的加号。可以双击一个组,以便在图表窗口中为组中的每项衡量指标填充一个独立图表。在上面的屏幕截图中,内存组的衡量指标会填充图表窗口。

表 1. CPU 衡量指标组

衡量指标

描述

CPU|CPU 争用 (%)

这项衡量指标显示 ESXi 主机中的虚拟机由于争用物理 CPU 访问权限而无法运行的时间百分比。所示数字为所有虚拟机的平均数字。此数字将小于受 CPU 争用影响最大的虚拟机所经历的最大争用次数。

使用这项衡量指标可验证主机能否为其所有虚拟机高效地提供服务。低争用表示虚拟机可以访问所需的一切,从而保证顺畅运行。这意味着基础架构为应用程序组提供了良好服务。

在使用这项衡量指标时,确保数字未超过预期。注意观察相对值和绝对值。相对值表示值发生显著变化,表示 ESXi 无法为虚拟机提供服务。绝对值表示实际值本身很高。调查此数字为什么很高。影响这项衡量指标的因素之一就是 CPU 电源管理。如果 CPU 电源管理将 CPU 时钟速度从 3 GHz 降低至 2 GHz,则会造成速度降低,因为这表明虚拟机并未全速运行。

这项衡量指标的计算方式如下:cpu|capacity_contention / (200 * summary|number_running_vcpus)

CPU|需求 (%)

这项衡量指标显示不存在 CPU 争用或 CPU 限制时虚拟机使用的 CPU 资源量。这项衡量指标表示过去 5 分钟的平均活动 CPU 负载。

如果将电源管理设为最大值,应将此值保持在 100% 以下。

这项衡量指标的计算方式如下:(cpu.demandmhz / cpu.capacity_provisioned)*100

摘要|正在运行的虚拟机数

这项衡量指标显示给定时间点在运行的虚拟机数量。每隔 5 分钟对该数据进行一次采样。

大量正在运行的虚拟机可能造成 CPU 或内存高峰,因为主机使用了更多资源。正在运行的虚拟机数能很好地反映 ESXi 主机必须处理的请求数量。已关闭电源的虚拟机并不包含在内,因为它们不会影响 ESXi 性能。正在运行的虚拟机数发生变化会造成性能问题。一台主机中有大量正在运行的虚拟机还表示高度风险,因为如果 ESXi 崩溃,所有虚拟机都会发生故障。

使用此衡量指标寻找正在运行的虚拟机数量高峰与其他衡量指标高峰(例如 CPU 争用或内存争用)之间的关联。

摘要|vMotion 数量

这项衡量指标显示在过去 (x) 分钟内,一台主机中在未发生虚拟机停机或服务中断的情况下所发生的实时迁移 (vMotion) 的次数。

vMotion 数量可以很好地反映稳定性。在运行状况良好的环境中,此数字比较稳定,相对较低。

在使用这项衡量指标时,应注意 vMotion 与其他衡量指标高峰(例如 CPU 争用和内存争用)之间的关联。尽管 vMotion 不应造成任何高峰,但很有可能在内存使用情况争用、CPU 需求和争用方面出现一些高峰。

表 2. 内存衡量指标组

衡量指标

描述

内存|气球 (KB)

这项衡量指标显示虚拟机内存控制当前使用的内存总量。

使用此衡量指标可以监控 ESXi 通过内存气球回收了多少虚拟机内存。

内存气球的存在表示 ESXi 已承受内存压力。ESXi 会在其占用的内存达到特定阈值时激活内存气球。例如,在 vRealize Operations Manager6.0 中,阈值为 >98%。

在使用这项衡量指标时,请验证内存气球的大小是否正在增加。内存气球增大表示内存不足并非一次性事件,而且内存不足现象正在恶化。注意内存波动,这可能表明虚拟机需要分页膨胀。如果虚拟机请求分页膨胀,这表示虚拟机遇到了内存性能问题,因为必须从磁盘返回页面。

在内存气球目标值大于此衡量指标所显示的值时,则表示还有更多内存可以回收。

内存|争用 (%)

这项衡量指标显示虚拟机等待访问交换内存的时间百分比。

使用此衡量指标监控 ESXi 内存交换。值较大表示 ESXi 内存不足,并且有大量内存正在交换。

内存|使用情况 (%)

这项衡量指标显示处于活动状态的已用物理内存量。内存使用情况显示为已配置或可用的总内存的百分比。这项衡量指标映射到 vCenter 中的“已消耗”计数器。

在衡量指标显示较大的值时,则表示 ESXi 正占用较大百分比的可用内存。检查其他内存相关衡量指标,了解 ESXi 是否需要更多内存。

表 3. 网络衡量指标组

衡量指标

描述

网络 I/O | 所有实例的汇总 | 丢包率 (%)

这项衡量指标显示在收集时间间隔内,所丢弃的已接收数据包和已传输数据包的百分比。

使用这项衡量指标监控 ESXi 网络的可靠性和性能。值较大表示网络不可靠,性能降低。

网络 I/O | 所有实例的汇总 | 每秒接收的数据包数

这项衡量指标显示在收集时间间隔内收到的数据包数。

使用这项衡量指标监控 ESXi 的网络使用情况。

网络 I/O | 所有实例的汇总 | 每秒传输的数据包数

这项衡量指标显示在收集时间间隔内传输的数据包数。

使用这项衡量指标监控 ESXi 的网络使用情况。

表 4. 存储衡量指标组

衡量指标

描述

数据存储 I/O|观察到的平均虚拟机磁盘 I/O 工作负载

存储适配器|所有实例的汇总|读取延迟 (ms)

这项衡量指标显示所有存储适配器执行一次读取操作所需的平均时间量。

使用这项衡量指标监控存储适配器的读取操作。值较大表示 ESXi 正遭遇存储读取操作速度缓慢的问题。

总延迟是内核延迟和设备延迟之和。

存储适配器|所有实例的汇总|写入延迟 (ms)

这项衡量指标显示所有存储适配器执行一次写入操作所需的平均时间量。

使用这项衡量指标监控存储适配器的写入操作性能。值较大表示 ESXi 正遭遇存储写入操作速度缓慢的问题。

总延迟是内核延迟和设备延迟之和。