要对 VPSALES4632 虚拟机相关问题进行故障排除,应评估症状、检查时间轴信息、考虑事件并创建衡量指标图表以找到问题的根本原因。

开始之前

关于此任务

如果检查警示未能帮助您确定针对虚拟机报告的问题的原因,请使用故障排除选项卡“症状”、“时间轴”、“事件”和“所有衡量指标”来对虚拟机的历史和当前状态进行故障排除。

过程

  1. 如果要查看警示详细信息选项卡,请在左侧窗格中单击虚拟机,然后在下面的列表中选择 VPSALES4632。

    主窗格将更新,以显示对象的摘要选项卡。

  2. 单击故障排除选项卡,单击症状选项卡,然后查看症状来确定是否其中某个症状与报告的问题有关。

    根据警示的配置方式,触发某些症状可能不足以生成警示。

    1. 查看症状名称来确定是否一个或多个症状与报告的问题有关。

      “信息”列提供了触发条件、趋势和当前值。哪些是最常见的影响响应时间的症状? 是否看到任何与 CPU 或内存使用情况相关的症状?

    2. 创建日期进行排序,以便重点关注客户报告该问题的时间范围。
    3. 单击状态:活动筛选器按钮以禁用该筛选器,以便查看活动和非活动症状。

    根据症状,考虑该问题是否与 CPU 或内存使用相关。但您不知道该问题是虚拟机还是主机出现的。

  3. 单击时间轴选项卡,然后查看一段时间内的警示、症状和更改事件,这些信息可帮助您确定导致报告问题相关因素的常见趋势。
    1. 要确定在报告问题的同时其他虚拟机是否触发了症状并生成警示,请单击显示对等事件

      其他虚拟机警示将添加到时间轴。如果看到在同一时间范围内多个虚拟机触发了症状,则可以调查祖先对象。

    2. 单击显示祖先事件,然后选择主机系统

      与其上部署虚拟机的主机关联的警示和症状将添加到时间轴。使用这些信息来确定报告的问题与主机上的警示之间是否存在关联。

  4. 单击事件选项卡以查看针对存在问题的虚拟机收集的衡量指标的更改,这些更改可能有助于您发现报告问题的原因。
    1. 使用日期控件选项查看客户报告该问题的大概时间的事件。
    2. 依次单击工作负载容量压力标志来确定是否有任何事件与该问题相关联。
    3. 单击缩放视图,然后放大在问题报告时或之前出现的任何事件或事件群集。
    4. 单击显示数据值,然后将光标置于某个事件上方以查看有关该事件的详细信息。

      选定时间的事件也会显示在事件图表下的数据网格中。

    5. 在左侧窗格中,单击主机系统,在左下窗格列表中单击主机名,然后使用工作负载容量压力反复进行主机分析。

    通过比较虚拟机和主机上的事件并评估这些结果,表明 CPU 或内存问题有可能是该问题的原因。

  5. 例如,如果确定该问题与 CPU 或内存使用相关,请单击所有衡量指标选项卡来创建您自己的衡量指标图表,以便确定是一个因素、另一个因素还是组合因素。
    1. 如果主机仍是重点,则首先处理主机衡量指标。
    2. 在衡量指标列表中,双击 CPU 使用情况 (%)内存使用情况 (%) 衡量指标,将其添加到右侧的工作区。
    3. 在映射中,单击 VPSALES4632 对象。

      衡量指标列表现在会显示虚拟机衡量指标。

    4. 在衡量指标列表中,双击 CPU 使用情况 (%)内存使用情况 (%) 衡量指标,将其添加到右侧的工作区。
    5. 查看主机和虚拟机图表以查看是否可以确定表明报告问题原因的模式。

    在此方案中,通过比较四个图表,显示主机和虚拟机上的 CPU 使用均正常,并且虚拟机上的内存使用也正常。但是,主机上的内存使用在 VPSALES4632 虚拟机报告问题之前的三天持续较高。

结果

主机内存运行持续较高,从而影响了虚拟机的响应时间。其运行的虚拟机数量正好在受支持的数量之内。原因可能是虚拟机上处理负载较高的应用程序过多。可以将某些虚拟机移到其他主机,分散工作负载或关闭闲置虚拟机的电源。

下一步做什么

  • 在此示例中,可以使用 vRealize Operations Manager 关闭主机上的虚拟机的电源,从而提高正在使用的虚拟机的性能。请参见在 vRealize Operations Manager 中从工具栏运行操作

  • 如果希望再次使用您在所有衡量指标选项卡上创建的图表组合,请单击生成仪表板

  • 如果没有解决问题,请继续调查。