A geração de incidentes pode ser ajustada no VMware Edge Network Intelligence para se adequar melhor ao seu ambiente. É especialmente importante ajustar novas instâncias para garantir que a geração de incidentes de falsos positivos não cria demasiados alertas.
Por predefinição, a geração de incidentes do VMware Edge Network Intelligence é pré-ajustada para a configuração ideal para a maioria das empresas. Pode adicionar aplicações personalizadas ou alterar as predefinições na página Definições de administrador (Admin settings) > Prioridade dos incidentes (Incident priority).
Terminologia
Perfis de prioridade
Predefinições que lhe permitem definir como cada tipo de incidente se comporta no ambiente. Os incidentes são de dois tipos:
1. Incidentes que medem a % de clientes afetados, em que a chave para definir prioridades é definir o volume de desvio da linha de base que está disposto a tolerar e a % mínima de clientes que precisam de ser afetados antes de a prioridade aumentar para P2 ou até P1. Para problemas mais graves, deve definir uma “tolerância de desvio baixa” para indicar que mesmo um pequeno desvio da linha de base tem de aumentar a prioridade dos incidentes.
2. Incidentes binários: as indisponibilidades do servidor enquadram-se nesta classificação, em que um servidor fica indisponível (por exemplo, não responde a pedidos, etc.) ou não. Para estes problemas, a prioridade é binária, isto é, se o servidor estiver indisponível, terá de ser “sempre prioridade PX”.
Tolerância do desvio
Especifica o desvio desde a linha de base e que % de clientes tem de ser afetada para que estes tipos de problemas se tornem críticos.
Limitação de alerta
Define o tempo que deve aguardar antes de alertar sobre um incidente novamente (supondo que o incidente ainda está ativo). Por exemplo, se um incidente DHCP tiver uma limitação de alerta de 1 dia e o incidente DHCP continuar a ocorrer, uma notificação por e-mail será enviada uma vez por dia até o incidente deixar de ocorrer.
Descrições dos perfis
Tolerância de desvio importante
Normalmente utilizado para tipos de incidentes menos importantes (por exemplo, clientes com latência lenta do Radius). Os incidentes com este perfil de prioridade começam como P6. Se existir 1 desvio padrão da linha de base, será aumentado para P5. Se existirem 2 desvios padrão da linha de base e se afetarem, pelo menos, 5% dos clientes, será aumentado para P3. Se existirem 3 ou mais desvios padrão e se afetarem, pelo menos, 10% dos clientes, será aumentado para P2. Incidentes com este perfil de prioridade nunca alcançarão P1. A limitação de alerta para o perfil Tolerância de desvio importante é de 1 dia.
Tolerância de desvio média
Normalmente utilizado para tipos de incidentes ligeiramente menos importantes (por exemplo, clientes com fraco desempenho da Web). Os incidentes com este perfil de prioridade começam como P5. Se existir 1 desvio padrão da linha de base, será aumentado para P4. Se existirem 2 desvios padrão da linha de base e se afetarem, pelo menos, 5% dos clientes, será aumentado para P3. Se existirem 3 ou mais desvios padrão e se afetarem, pelo menos, 10% dos clientes, será aumentado para P2. Finalmente, se existir um aumento de 4 ou mais desvios padrão e se afetarem, pelo menos, 30% dos clientes, será aumentado para P1. A limitação de alerta para o perfil Tolerância de desvio média é de 1 dia.
Tolerância de desvio baixa
Normalmente, utilizado para os tipos de incidentes mais importantes (por exemplo, os clientes a ligarem-se devido a X). Os incidentes com este perfil de prioridade começam como P4. Se existir 1 desvio padrão da linha de base, será aumentado para P3. Se existirem 2 desvios padrão da linha de base e se afetarem, pelo menos, 5% dos clientes, será aumentado para P2. Se existirem 3 ou mais desvios padrão e se afetarem, pelo menos, 10% dos clientes, será aumentado para P1. A limitação de alerta para o perfil Tolerância de desvio baixa é de 1 dia.
Sempre PX (perfil para P2, P3 e P4)
Normalmente, utilizado para indisponibilidades do servidor binárias: a ocorrer ou não. Sempre que são acionados incidentes deste tipo, têm de ter sempre esta prioridade específica. A limitação de alerta para o perfil Sempre PX é de 7 dias.
Sempre PX (sem limitação de alerta)
Não existem perfis “sem limitação de alerta” para P2, P3 e P4. A limitação de alerta para este tipo de perfil é de 1 hora.
Sem prioridade
Normalmente utilizado para incidentes em que os desvios breves não são acionáveis (por exemplo, clientes com fraco desempenho do Wi-Fi). Os incidentes deste tipo tornam-se acionáveis quando vistos no contexto da análise de problemas sistémicos durante um período de tempo mais longo. Os incidentes com este perfil não têm prioridade atribuída. Os e-mails de alerta não serão enviados no caso destes incidentes. No entanto, ainda serão apresentados na parte inferior da página de incidentes quando o filtro “Todos os incidentes” (All Incidents) tiver sido selecionado.
Desativado
Os incidentes com este perfil não são apresentados na IU.
Alertas de incidentes
Tipo de alerta | Modo de alerta | Frequência de alerta | Frequência de limitação | Requisitos de localização das subscrições da empresa multissite* | |
---|---|---|---|---|---|
Alerta de APs | E-mail/SMS | 1 minuto | N/D | Localização necessária. | |
Alerta do crawler | E-mail/SMS | 10 minutos
Nota: Um
Feed é declarado como “inativo” após 20 minutos.
|
1 dia | N/D | |
Webhook | |||||
Alerta de incidente de dispositivo crítico | E-mail/SMS | 15 minutos | 7 dias | Localização necessária. | |
Alerta de incidente | E-mail/SMS
Nota: Se subscrever o e-mail/SMS normal, também receberá o e-mail de resumo semanal.
|
15 minutos | Tolerância de desvio importante | 1 dia | É obrigatório selecionar uma localização. Contudo, se o incidente for do tipo Reencaminhamento DHCP, Servidor, VLAN ou WLC, a localização será ignorada. |
Tolerância de desvio média | 1 dia | ||||
Tolerância de desvio baixa | 1 dia | ||||
Sempre PX (perfil para P2, P3 e P4) | 7 dias | ||||
Sempre PX – sem limitação de alerta (perfil para P2, P3 e P4). | 1 hora | ||||
E-mail de resumo semanal | 1 hora | Uma vez por semana, às segundas-feiras, no espaço de uma hora a partir das 8h00. | A localização é ignorada e todos os sites são incluídos num único e-mail. O e-mail será enviado se tiver QUALQUER subscrição de incidente. | ||
Webhook | 5 minutos | Mesma limitação de e-mail/SMS. | É obrigatório selecionar uma localização. Contudo, se o incidente for do tipo Reencaminhamento DHCP, Servidor, VLAN ou WLC, a localização será ignorada. | ||
Alerta do controlador | E-mail/SMS | 5 minutos
Nota:
|
1 dia | N/D | |
Alerta de licença | 12 horas | N/D | N/D (não baseado em subscrição) | ||
Alerta de declaração | E-mail/SMS | 1 hora | Uma vez por semana, às segundas-feiras. | N/D | |
Alerta de resumo do UPS | E-mail/SMS | 1 minuto | N/D | N/D |