使用虚拟机性能仪表板可查明虚拟机是否存在性能问题。第一步是,当某个虚拟机存在问题时,请验证其他虚拟机是否存在相同的问题。如果问题普遍存在,说明根本原因与该虚拟机无关。
如何使用仪表板
- 从数据中心小组件中选择数据中心。要查明是否存在性能问题、问题所在以及问题的严重性,请同时使用以下三个条形图:虚拟机是否面临 CPU 就绪、虚拟机是否面临内存争用、虚拟机是否面临磁盘延迟。每个条形图都分析了集群支持虚拟机的方式。这些条形图指示了虚拟机是否正在等待 CPU 资源、面临内存争用或磁盘延迟。对于每个虚拟机,它会选择过去 24 小时内最差的衡量指标。默认情况下,VMware Aria Operations 每 5 分钟收集一次数据,因此这是 288 个数据点 (12 x 24 = 288) 中的最高值。收集每个虚拟机的值后,条形图就会将每个虚拟机置于各自的性能段中。段中的阈值考虑最佳做法,因此它们采用颜色编码。对于每个条形图,您都可以将时间段更改为您感兴趣的时间段。之后显示最大值。该值是 5 分钟收集时间段内最差的 20 秒。对于任务关键型环境,IaaS 必须充分满足所有虚拟机的需求。如果在分布图表上看到绿色,则无需进一步分析。
对于开发环境,可能会容许 CPU 和内存的少量争用,因为需要平衡成本。
也可以将筛选器从数据中心更改为集群。如果要列出集群,则可以添加集群性能 (%) 衡量指标并按升序排序。这样,需要立即关注的集群将会在最上面。
可以单击条形查看该性能段下的虚拟机列表。从此处,可以选择一个虚拟机,然后其 KPI 将自动显示在仪表板的下半部分。
- 多个虚拟机分析
从所选数据中心中的虚拟机性能小组件选择某个数据中心时,将显示列出该数据中心中所有虚拟机的表。
该表按“已违反 KPI”列排序,使您的注意力集中在 IaaS 未充分满足其需求的虚拟机上。该列统计了任何给定 5 分钟时段内的 SLA 违反次数。它基于计数器
Performance \ Number of KPIs Breached
。由于虚拟机使用 IaaS 的四个资源(CPU、内存、磁盘和网络),因此计数器的值介于 0 到 4 之间,0 表示理想情况。值 4 表示所有 4 项 IaaS 服务均未交付。无论服务等级如何,都使用相同的阈值,因为这是内部 KPI,而不是外部 SLA。由于目标是主动监控,而不是被动故障排除,因此计数器显示最差值,而不是监控周期的平均值。
- 每个虚拟机分析
从表中选择某个虚拟机时,将自动显示 CPU、内存、磁盘和网络性能图表,每个小组件显示该虚拟机的 KPI。
- 警示
将自动显示相关警示。可以通过编辑小组件查看设置,并相应地进行调整以满足您的运维需求。
- 虚拟磁盘
一个虚拟机可以有许多磁盘,并且这些磁盘可能具有不同的性能级别。下表列出了各个虚拟磁盘及其争用和利用率衡量指标。
- 配置
将显示所选虚拟机的相关配置。可以根据需要进行自定义。
- 关系
可以从虚拟机导航到父集群或数据存储。使用关系小组件可导航并自动选择关联的集群或数据存储。