Vous pouvez régler la génération des incidents dans VMware Edge Network Intelligence pour qu'elle corresponde mieux à votre environnement. Il est particulièrement important de régler de nouvelles instances pour vérifier que la génération d'incidents faux positifs ne crée pas trop d'alertes.
Par défaut, la génération d'incidents VMware Edge Network Intelligence est préréglée selon le paramétrage optimal pour la plupart des entreprises. Vous pouvez ajouter des applications personnalisées ou modifier les paramètres par défaut sur la page Paramètres d'administration (Admin settings)> Priorité de l'incident (Incident priority).
Terminologie
Profils de priorité
Paramètres prédéfinis qui vous permettent de définir le comportement de chaque type d'incident dans votre environnement. Il existe deux types d'incidents :
1. Incidents qui mesurent le % de clients affectés, pour lesquels la clé de définition des priorités consiste à définir la différence entre la ligne de base que vous êtes prêt à tolérer et le pourcentage minimal de clients qui doivent être affectés avant que la priorité augmente à P2 ou même à P1. Pour des problèmes plus importants, vous devez définir une tolérance d'écart plus faible pour indiquer que même une légère différence par rapport à la ligne de base doit augmenter la priorité de l'incident.
2. Incidents binaires : les pannes de serveur relèvent de ce compartiment, que le serveur soit en panne (il ne répond pas aux demandes par exemple) ou non. Pour ces problèmes spécifiques, la priorité est binaire, c'est-à-dire que si le serveur est en panne, il doit être défini sur « toujours priorité PX » (always priority PX).
Tolérance d'écart
Spécifie le degré d'écart par rapport à la ligne de base et le pourcentage de clients qui doivent être affectés pour que ces types de problèmes deviennent critiques.
Limitation d'alertes
Définit la durée d'attente avant de déclencher une nouvelle alerte sur un incident (en supposant que l'incident soit toujours actif). Par exemple, si un incident DHCP présente une limitation d'alertes de 1 jour et que l'incident DHCP continue de se produire, une notification par e-mail est envoyée une fois par jour jusqu'à ce que l'incident cesse de se produire.
Descriptions de profils
Tolérance d'écart important
Généralement utilisé pour des types d'incidents les moins importants (par exemple, les clients dont la latence de RADIUS est lente). Les incidents avec ce profil de priorité démarrent en P6. S'il existe un écart type de 1 par rapport à la ligne de base, ils passent en P5. S'il existe un écart type de 2 par rapport à la ligne de base et que cet écart affecte au moins 5 % des clients, ils passent en P3. S'il existe un écart type d'au moins 3 et qu'il affecte au moins 10 % des clients, il passe en P2. Les incidents avec ce profil de priorité ne peuvent jamais atteindre P1. La limitation d'alertes pour le profil de tolérance d'écart important est de 1 jour.
Tolérance d'écart moyen
Utilisé pour des types d'incidents légèrement moins importants (par exemple, les clients dont les performances Web sont médiocres). Les incidents avec ce profil de priorité démarrent en P5. S'il existe un écart type de 1 par rapport à la ligne de base, ils passent en P4. S'il existe un écart type de 2 par rapport à la ligne de base et que cet écart affecte au moins 5 % des clients, ils passent en P3. S'il existe un écart type d'au moins 3 et qu'il affecte au moins 10 % des clients, il passe en P2. Enfin, s'il existe une augmentation de l'écart type d'au moins 4 et qu'il affecte plus de 30 % des clients, ils passent en P1. La limitation d'alertes pour le profil de tolérance d'écart moyen est de 1 jour.
Tolérance d'écart faible
Généralement utilisé pour les types d'incidents les plus importants (par exemple, des clients se connectant en raison de X). Les incidents avec ce profil de priorité démarrent en P4. S'il existe un écart type de 1 par rapport à la ligne de base, ils passent en P3. S'il existe un écart type de 2 par rapport à la ligne de base et que cet écart affecte au moins 5 % des clients, ils passent en P2. S'il existe un écart type d'au moins 3 et qu'il affecte au moins 10 % des clients, il passe en P1. La limitation d'alertes pour le profil de tolérance d'écart faible est de 1 jour.
Toujours PX (profil pour P2, P3 et P4)
Généralement utilisé pour les interruptions de serveur binaires, qu'elles se produisent ou non. Chaque fois que des incidents de ce type sont déclenchés, ils doivent toujours être de cette priorité particulière. La limitation d'alertes pour le profil Toujours PX est de 7 jours.
Toujours PX (pas de limitation d'alertes)
Il n'existe aucun profil « pas de limitation d'alertes » pour P2, P3 et P4. La limitation d'alertes pour ce type de profil est de 1 heure.
Aucune priorité
Généralement utilisé pour les incidents dans lesquels les écarts d'exécution courts ne sont pas exploitables (par exemple, les clients ayant des performances Wi-Fi médiocres). Les incidents de ce type deviennent exploitables lorsqu'ils sont affichés dans le contexte de l'analyse des problèmes systémiques pendant une période plus longue. Aucune priorité n'est attribuée aux incidents avec ce profil. Les e-mails d'alerte ne sont pas envoyés pour ces incidents. En revanche, ils s'affichent toujours au bas de la page Incident lorsque le filtre « Tous les incidents » (All Incidents) a été sélectionné.
Désactivé
Les incidents avec ce profil ne s'affichent pas dans l'interface utilisateur.
Alertes d'incidents
Type d'alerte | Mode d'alerte | Fréquence des alertes | Fréquence des limitations | Conditions requises pour l'emplacement de l'abonnement de la société multisite* | |
---|---|---|---|---|---|
Alerte du point d'accès | E-mail/SMS | 1 minute | S/O | Emplacement requis. | |
Alerte de l'analyseur | E-mail/SMS | 10 minutes
Note : Un
Flux (Feed) est déclaré « inactif » au bout de 20 minutes.
|
1 jour | S/O | |
Webhook | |||||
Alerte d'incident de périphérique critique | E-mail/SMS | 15 minutes | 7 jours | Emplacement requis. | |
Alerte d'incident | E-mail/SMS
Note : Si vous vous abonnez à l'e-mail/au SMS normal, vous recevez également l'e-mail récapitulatif hebdomadaire.
|
15 minutes | Tolérance d'écart important | 1 jour | La sélection d'un emplacement est obligatoire. Toutefois, si l'incident est de type Relais DHCP, Serveur, VLAN ou WLC, l'emplacement est ignoré. |
Tolérance d'écart moyenne | 1 jour | ||||
Tolérance d'écart faible | 1 jour | ||||
Toujours PX (profil pour P2, P3 et P4) | 7 jours | ||||
Toujours PX : pas de limitation d'alertes pour P2, P3 et P4. | 1 heure | ||||
E-mail récapitulatif hebdomadaire | 1 heure | Une fois par semaine le lundi, à 8 h à une heure près. | L'emplacement est ignoré et tous les sites sont inclus dans un seul e-mail. L'e-mail est envoyé si vous disposez d'un abonnement à un incident QUELCONQUE. | ||
Webhook | 5 minutes | Même limitation que pour l'e-mail/le SMS. | La sélection d'un emplacement est obligatoire. Toutefois, si l'incident est de type Relais DHCP, Serveur, VLAN ou WLC, l'emplacement est ignoré. | ||
Alerte de contrôleur | E-mail/SMS | 5 minutes
Note :
|
1 jour | S/O | |
Alerte de licence | 12 heures | S/O | S/O (non basé sur l'abonnement) | ||
Alerte d'instruction | E-mail/SMS | 1 heure | Une fois par semaine le lundi. | S/O | |
Alerte de synthèse UPS | E-mail/SMS | 1 minute | S/O | S/O |