Ao criar definições de alerta para seu ambiente, aplique práticas recomendadas consistentes para otimizar o comportamento de alerta para seus objetos monitorados.
Nomenclatura e descrição das definições de alerta
O nome da definição de alerta é o nome abreviado que aparece nos seguintes locais:
- Em grades de dados quando os alertas são gerados
- Em notificações de alerta de saída, incluindo as notificações por e-mail que são enviadas quando alertas de saída e notificações são configurados no seu ambiente
Certifique-se de fornecer um nome informativo que indique claramente o problema relatado. Seus usuários podem avaliar alertas com base no nome da definição de alerta.
A descrição da definição de alerta é o texto que aparece nos detalhes da definição de alerta e nos alertas de saída. Certifique-se de fornecer uma descrição útil que ajude os usuários a entender o problema que gerou o alerta.
Aguardar e cancelar o ciclo
A configuração do ciclo de espera ajuda a ajustar a sensibilidade em seu ambiente. O ciclo de espera para a definição de alerta entra em vigor após o ciclo de espera para a definição de sintoma resultar em um sintoma disparado. Na maioria das definições de alerta, você configura a sensibilidade no nível do sintoma e configura o ciclo de espera da definição de alerta como 1. Essa configuração garante que o alerta seja gerado imediatamente depois que todos os sintomas forem acionados no nível de sensibilidade do sintoma desejado.
A configuração do ciclo de cancelamento ajuda a ajustar a sensibilidade em seu ambiente. O ciclo de cancelamento da definição de alerta entra em vigor após o ciclo de cancelamento da definição de sintoma resultar em um sintoma cancelado. Na maioria das definições, você configura a sensibilidade no nível do sintoma e configura o ciclo de cancelamento da definição de alerta como 1. Essa configuração garante que o alerta seja cancelado imediatamente depois que todas as condições de sintomas desaparecerem após o ciclo de cancelamento de sintomas desejado.
Criar definições de alerta para gerar o menor número de alertas
Você pode controlar o tamanho da sua lista de alertas e facilitar o gerenciamento. Quando um alerta é sobre um problema geral que pode ser acionado em um grande número de objetos, configure sua definição para que o alerta seja gerado em um objeto de nível superior na hierarquia, em vez de em objetos individuais.
Ao adicionar sintomas à sua definição de alerta, não sobrecarregue uma única definição de alerta com sintomas secundários. Mantenha a combinação de sintomas o mais simples e direta possível.
Você também pode usar uma série de definições de sintomas para descrever níveis incrementais de preocupação. Por exemplo, Volume aproximando-se do limite de capacidade pode ter um valor de gravidade de Aviso, enquanto Volume atingido o limite de capacidade pode ter um nível de gravidade de Crítico. O primeiro sintoma não é uma ameaça imediata, mas o segundo é uma ameaça imediata. Em seguida, você pode incluir as definições de sintoma de Aviso e Crítico em uma única definição de alerta com uma condição Qualquer e definir a gravidade do alerta como Baseada em Sintoma. Essas configurações fazem com que o alerta seja gerado com a criticidade correta se um dos sintomas for acionado.
Evitar sobreposições e lacunas entre alertas
As sobreposições resultam na geração de dois ou mais alertas para a mesma condição subjacente. As lacunas ocorrem quando um alerta não resolvido com gravidade mais baixa é cancelado, mas um alerta relacionado com gravidade mais alta não pode ser acionado.
Uma lacuna ocorre em uma situação em que o valor é <=50% em uma definição de alerta e >=75% em uma segunda definição de alerta. A lacuna ocorre porque quando a porcentagem de volumes com alto uso fica entre 50% e 75%, o primeiro problema é cancelado, mas o segundo não gera um alerta. Essa situação é problemática porque nenhuma definição de alerta está ativa para cobrir a lacuna.
Recomendações acionáveis
Se você fornecer instruções de texto aos usuários para ajudá-los a resolver um problema identificado por uma definição de alerta, descreva com precisão como o engenheiro ou o administrador deve corrigir o problema para resolver o alerta.
Para oferecer suporte às instruções, adicione um link para um wiki, runbook ou outras fontes de informações e adicione ações que você executa de VMware Aria Operations nos sistemas de destino.