为环境创建警示定义时,需应用一致的最佳实践,以便针对所监控的对象优化警示行为。

警示定义命名和描述

警示定义名称是显示在以下位置的短名称:

  • 当生成警示时在数据网格中
  • 在出站警示通知中,包括在环境中配置出站警示和通知时发送的电子邮件通知

确保提供可清楚描述所报告问题的说明性名称。您的用户可以基于警示定义名称评估警示。

警示定义描述是显示在警示定义详细信息和出站警示中的文本。确保提供有用的描述,以帮助用户了解导致生成警示的问题。

等待和取消周期

等待周期设置可帮助您调整环境中的敏感度。在症状定义的等待周期导致触发症状后,警示定义的等待周期将生效。对于大多数警示定义,在症状级别配置敏感度,并将警示定义的等待周期配置为 1。此配置可确保在所需症状敏感度级别触发所有症状后立即生成警示。

取消周期设置可帮助您调整环境中的敏感度。在症状定义的取消周期导致取消症状后,警示定义的取消周期将生效。对于大多数定义,在症状级别配置敏感度,并将警示定义的取消周期配置为 1。此配置可确保在所需症状取消周期之后,当所有症状情况消失后立即取消警示。

创建警示定义以生成最少的警示

可以控制警示列表的大小,使之更易于管理。当警示是关于可在大量对象上触发的一般问题时,则配置其定义,以便在层次结构中的更高级别的对象上生成警示,而不是在单个对象上生成警示。

向警示定义添加症状时,请勿使用次要症状过度填充单个警示定义。使症状组合尽可能简单明了。

也可以使用一系列症状定义来描述涉及的增量级别。例如,卷接近容量限制的严重性值可能为“警告”,而卷已达到容量限制的严重性值可能为“严重”。第一个症状不是直接威胁,但第二个症状是直接威胁。然后,可以将“警告”和“严重”症状定义包含在单个警示定义中,其中的条件为“任何”,并将警示严重程度设置为“基于症状”。这些设置导致生成具有正确严重程度的警示(如果已触发了任一症状)。

避免警示之间发生重叠和间隙

重叠将导致为同一个基础条件生成两个或更多警示。当严重程度较低的未解决警示被取消,但无法触发严重程度较高的相关警示时,会发生间隙。

当一个警示定义中的值 <=50%,第二个警示定义中的值 >=75% 时,将发生间隙。之所以发生间隙,是因为当利用率较高的卷的百分比下降到 50% 和 75% 之间时,第一个问题会取消,但第二个问题不会生成警示。这种情况是有问题的,因为没有活动的警示定义可填充间隙。

可行的建议

如果向用户提供文本说明,以帮助他们解决由警示定义发现的问题,则准确说明工程师或管理员应如何修复问题以解决警示。

为了支持这些说明,可添加指向 wiki、操作说明书或其他信息源的链接,并添加您要从 VMware Aria Operations 对目标系统运行的操作。