环境中的对象出现问题时,VMware Aria Operations 中的警示会通知您。此方案说明了一种监控和处理您所负责对象的警示的方法。

触发一个或多个警示症状时将生成警示。根据警示的配置方式,在触发一个症状或触发所有症状时将生成警示。

生成警示时,必须基于警示对环境中对象产生的负面影响对其进行处理。要进行处理,请从运行状况警示开始,然后根据严重程度对其进行处理。

作为虚拟基础架构管理员,每天至少查看警示两次。在此方案的评估过程中,您将遇到以下警示:

  • 虚拟机具有意外的高 CPU 工作负载。
  • 主机存在少数虚拟机导致的内存争用。
  • 由于内存缩减、内存膨胀或交换,集群中多个虚拟机存在内存争用。

过程

  1. 从左侧菜单中,单击故障排除,然后单击警示
  2. 在“分组依据”筛选器中选择时间,然后在“创建日期”列中单击向下键,以便先列出最近的警示。
  3. 在“所有筛选器”中,选择严重程度 > 警告
    您已按触发顺序列出所有警告警示,其中最近的警示先显示。
  4. 按名称、触发警示的对象、对象类型和警示生成的时间查看警示。
    例如,您是否能够识别任何您负责管理的对象?您是否了解下一小时实施的修复工作将修复影响对象运行状况的所有警示?您是否了解由于资源限制当前无法解决某些警示?
  5. 要告知其他管理员或工程师您正着手解决虚拟机具有意外的高 CPU 工作负载警示,请单击所选警示,在菜单栏中单击操作,然后单击获取所有权
    “警示详细信息”中的“分配给:”字段将使用您的用户名更新。
  6. 要将虚拟机具有意外的高 CPU 工作负载警示的所有权分配给其他用户,请单击警示,单击菜单栏上的操作,然后单击分配给
  7. 输入要为其分配警示所有权的用户的名称,然后单击保存
    “警示详细信息”中的“分配给:”字段将更新为您分配了警示的用户的名称。
    注: 您可以通过单击警示并从 操作菜单中选择 释放所有权选项,来移除分配给用户的所有权。
  8. 要获取所有权并临时排除警示对对象状况的影响,请在列表中选择主机存在少数虚拟机导致的内存争用警示。然后单击菜单栏上的操作,单击挂起
    1. 要将警示挂起一小时,请输入 60
    2. 单击确定
    警示将挂起 60 分钟,且您在警示列表中被列为所有者。如果一小时内未解决该警示,警示将回到活动状态。
  9. 选择包含由于内存缩减、虚拟增长或交换,集群中多个虚拟机存在内存争用警示的行。然后单击菜单栏上的操作,单击取消警示以从列表中移除该警示。
    该警示是已知问题,您无法解决,除非更换新硬件。
    已从警示列表中移除该警示,但此操作不会解决根本问题。此警示中的症状基于衡量指标,因此将在下一个收集和分析周期内生成警示。在基础硬件和工作负载分布问题得到解决之前,此模式将持续存在。

结果

您已处理严重运行状况警示,并获得需要进一步解决问题或进行故障排除的警示的所有权。

下一步做什么

对警示做出响应。请参见用户方案:对“运行状况警示”列表中的警示做出响应