实时! 集群性能仪表板提供有关虚拟机的底层计算集群是否满足其请求的实时信息。此仪表板侧重于集群的 CPU、内存和性能。使用此仪表板可以查看满足虚拟机需求方面是否存在任何问题,以及集群内是否存在任何失衡问题。实时! 集群性能仪表板是主仪表板,它为辅助仪表板实时!集群性能仪表板做补充。如果性能问题由高利用率导致,则会显示此辅助仪表板。主仪表板解答问题“我们的 IaaS 是否正在工作?”,而辅助仪表板解答问题“我们的 IaaS 是否在努力工作?”。
设计注意事项
实时! 集群性能仪表板显示三个热图。这些热图相互补充,必须一起使用。在所有热图中,每个集群和这些集群中的 ESXi 主机的位置均相同。固定位置可让您比较问题是由内存争用、CPU 就绪还是 CPU 同步停止引起的。
每个集群和 ESXi 主机的大小都是固定的。可变大小会产生干扰,并且可能会导致出现小框,使其难以阅读。
性能的重点是总体,而不是单个虚拟机。这不是单虚拟机故障排除仪表板,而是侧重于基础架构问题的仪表板。由于基础架构计数器以数学方式汇总了虚拟机计数器,因此您必须具有正确的汇总策略。由于目标是提供预警,因此不要将平均值用作汇总方法。使用超出阈值的总体百分比。应设置严格的阈值,以接收预警。
如何使用仪表板
查看热图
内存争用、
CPU 就绪和
CPU 同步停止,并查看是否有绿色以外的颜色。
- 绿色表示几乎 100% 的虚拟机已收到所请求的 CPU 和内存。设置阈值,以使热图在 10% 的虚拟机未收到所请求的资源时变为红色。
- 红色表示预先警告。严格的阈值用于激活主动关注和修复操作。热图可能会由于应用了高标准而变为红色,即使尚未收到虚拟机所有者的投诉也是如此。
- 浅灰色表示主机上没有正在运行的虚拟机,并且衡量指标未计算。
查看是否存在任何不均衡。
- 有两种类型的不均衡:集群不均衡和资源类型不均衡。
- ESXi 主机按集群进行分组,以便轻松查看集群中的不均衡。集群不均衡确实有可能发生,最好是对其进行监控,而不仅仅是假设。
- 如果三个热图不同,则表明出现资源不均衡。例如,如果内存争用大多为红色,但两个 CPU 热图为绿色,则意味着内存和 CPU 之间存在不均衡。
- 如果单个 ESXi 主机在三个热图中显示不同的颜色,则表示主机中的 CPU 和内存资源之间存在不均衡。
对于 NOC 操作员,在热图中选择一个虚拟机以进行深入研究。
- 所选 ESXi 主机的趋势小组件将自动显示性能计数器。要隐藏任何衡量指标,请单击图例中的名称。
在部署过程中,配置 NOC 仪表板之间的自动轮换。如果要查看一个仪表板,您可以使用 URL 共享功能移除 VMware Aria Operations 菜单。这使得整个用户界面可以显示出来,并使您能够专注于仪表板。
注意事项
- 如果您有屏幕操作区域,则可以添加“磁盘延迟”。使用计数器“面临磁盘延迟的使用者百分比 (%)”。它是数据存储对象的一部分,而不是集群的一部分,因为集群中的虚拟机可以具有跨多个数据存储的磁盘。按数据中心(而不是按集群)来组织此存储性能。