Cette rubrique fournit des informations sur les différents types d'alertes dans VMware Aria Operations, comment y accéder et comment afficher plus d'informations sur ces alertes.
Types d'alertes
Il existe trois types d'alertes dans VMware Aria Operations. Le type d'alerte détermine la gravité du problème.
- Alertes de santé
- La liste des alertes de santé correspond à toutes les alertes générées qui sont configurées pour affecter la santé de votre environnement et qui nécessitent une intervention urgente. La liste des alertes de santé permet d'évaluer les problèmes, d'en définir les priorités et de commencer à les résoudre immédiatement.
- Alertes de risques
- La liste des alertes de risque correspond à toutes les alertes générées qui sont configurées pour indiquer un risque dans votre environnement. Traitez les alertes de risque rapidement, avant que les symptômes déclencheurs ayant généré l'alerte affecte de manière négative la santé de votre environnement.
- Alertes d'efficacité
- La liste des alertes d'efficacité correspond à toutes les alertes générées qui sont configurées pour indiquer les problèmes d'utilisation efficace de vos objets surveillés dans votre environnement. Traitez les alertes d'efficacité pour récupérer l'espace inutilisé ou améliorer les performances des objets dans votre environnement.
Accès aux alertes dans VMware Aria Operations
La page Toutes les alertes ou la page Alertes administratives fournit la liste de toutes les alertes générées dans VMware Aria Operations. Utilisez la liste des alertes pour déterminer l'état de votre environnement et commencer à résoudre les problèmes.
Emplacement de la page Toutes les alertes
Dans le menu de gauche, cliquez sur
.Emplacement de la page Alertes administratives
En tant qu'administrateur, vous pouvez afficher les alertes administratives en cliquant sur l'icône d'avertissement en regard du menu Alertes ou en cliquant sur Alertes administratives. Vous pouvez afficher la page Alertes administratives uniquement si vous êtes un utilisateur Administrateur général ou si vous disposez de privilèges administratifs qui vous sont attribués.
dans le menu de gauche, puis en cliquant sur l'ongletFonctionnement des pages Toutes les alertes et Alertes administratives
Par défaut, au départ, seules les alertes actives sont répertoriées et regroupées par heure. Consultez et gérez les alertes qui figurent dans la liste à l'aide des options de la barre d'outils. Sélectionnez plusieurs lignes dans la liste grâce aux combinaisons Maj+clic et Ctrl+clic.
Pour voir les détails d'une alerte, cliquez sur son nom. Les détails de l'alerte s'affichent sur la droite, notamment les symptômes ayant déclenché l'alerte. Le système propose des recommandations pour résoudre le problème associé à l'alerte et un lien pour exécuter la recommandation. Dans les détails, un bouton Exécuter l'action peut s'afficher. Placez le pointeur de la souris sur ce bouton pour en savoir plus sur la recommandations à suivre. Vous pouvez également afficher le bouton Exécuter et le Correctif suggéré dans la grille de données Alertes. Vous pouvez filtrer les alertes en sélectionnant celles dont l'option Exécuter est activée et exécuter la tâche recommandée pour résoudre l'alerte à partir de la grille de données Alertes. Cliquez sur la petite case située sur la partie inférieure gauche de la liste des alertes pour inclure les colonnes Correctif suggéré et Exécuter dans la grille de données.
Cliquez sur le nom de l'objet pour lequel l'alerte a été générée afin d'afficher les détails correspondants et d'accéder à des informations supplémentaires relatives aux mesures et aux événements.
Si vous avez migré des alertes depuis une version précédente de VMware Aria Operations , elles sont répertoriées avec l'état Annulé et leurs détails ne sont pas disponibles.
Toutes les alertes et options d'alertes administratives
Les options d'alerte incluent les options de barre d'outils et de grille de données. Utilisez les options de la barre d'outils pour trier la liste d'alertes et annuler, interrompre ou gérer la propriété. Utilisez la grille de données pour afficher les alertes et les détails correspondants.
Sélectionnez une alerte dans la liste pour activer le menu Actions :
Option | Description |
---|---|
Annuler l'alerte | Annule les alertes sélectionnées. Si vous configurez la liste des alertes pour que seules les alertes actives s'affichent, les alertes annulées sont retirées de la liste. Vous pouvez annuler des alertes une fois que votre intervention n'est plus requise. L'annulation d'une alerte n'annule pas la condition sous-jacente qui l'a générée. L'annulation des alertes est efficace si l'alerte est déclenchée par des symptômes de panne et d'événement, car ces symptômes sont déclenchés de nouveau uniquement si des pannes ou des événements se produisent ultérieurement sur les objets surveillés. Si l'alerte a été générée à partir de symptômes liés à des mesure ou à des propriété, l'alerte est uniquement annulée jusqu'au prochain cycle de collecte et d'analyse. Si les valeurs incriminées sont encore présentes, l'alerte est à nouveau générée. |
Supprimer les alertes annulées | Supprimez les alertes annulées (inactives) en sélectionnant un groupe ou des alertes individuelles. L'option est désactivée pour les alertes actives. |
Interrompre | Interrompez une alerte pendant un nombre de minutes donné. Vous pouvez suspendre les alertes lorsque vous examinez une alerte et ne souhaitez pas que celle-ci affecte la santé, le risque ou l'efficacité de l'objet pendant que vous travaillez. Si le problème persiste une fois la période de suspension écoulée, l'alerte est réactivée et affecte de nouveau la santé, le risque ou l'efficacité de l'objet. L'utilisateur qui interrompt l'alerte devient le propriétaire assigné. |
Attribuer à | Attribuez l'alerte à un utilisateur. Vous pouvez rechercher un nom d'utilisateur spécifique et cliquer sur Enregistrer pour attribuer l'alerte à l'utilisateur sélectionné. |
S'approprier | En tant qu'utilisateur actuel, vous vous attribuez la propriété de l'alerte. Cette action est possible s'il s'agit de vous-même, mais vous ne pouvez pas attribuer la propriété d'une alerte à d'autres utilisateurs. |
Concéder | Une alerte est destituée de sa pleine propriété. |
Accéder à la définition d'alerte | Permet de basculer vers la page des définitions d'alerte, qui contient la définition de l'alerte sélectionnée précédemment. |
Désactiver… | Fournit deux options pour désactiver l'alerte :
Note : Pour activer l'option Désactiver, sélectionnez
Définition dans la liste déroulante
Grouper par, puis cliquez sur le nom du groupe Définition d'alerte.
|
Ouvrir une application externe | Actions que vous pouvez exécuter sur l'objet sélectionné. Par exemple, « Ouvrir la machine virtuelle dans vSphere Client ». |
Option | Description |
---|---|
Aucun | Les alertes ne sont pas classées dans des groupes spécifiques. |
Heure | Permet de regrouper les alertes par heure de déclenchement. Il s'agit de l'option par défaut. Vous pouvez également les regrouper selon les plages suivantes : 1 heure, 4 heures, aujourd'hui et hier, jours de la semaine en cours, semaine dernière et semaines antérieures. |
Criticité | Permet de regrouper les alertes par criticité. Les valeurs sont les suivantes, par ordre croissant de criticité : Info/Avertissement/Immédiat/Critique. Voir également Criticité dans le tableau des options de la grille de données Toutes les alertes, ci-dessous. |
Définition | Permet de regrouper les alertes par définition : les alertes similaires sont regroupées. |
Type d'objet | Permet de regrouper les alertes en fonction du type d'objet qui les déclenche. Par exemple, les alertes relatives aux hôtes sont regroupées. |
Portée | Permet de regrouper les alertes par portée. Vous pouvez rechercher des alertes dans l'étendue sélectionnée. |
Filtres rapides | Descriptions |
---|---|
Options de filtrage | Permet de limiter la liste des alertes en fonction de correspondances avec des filtres que vous sélectionnez. Par exemple, si vous avez choisi l'option Heure dans le menu Grouper par, Vous pouvez maintenant sélectionner État -> Actif dans le menu Filtres rapides pour que la page Toutes les alertes/Alertes administratives affiche uniquement les alertes actives, classées selon leur heure de déclenchement. |
Options (consultez également les tableaux Grouper par et Grille de données Toutes les alertes pour obtenir des définitions de filtre supplémentaires) | |
ID d'alerte | ID donné pour une alerte. |
Alerte | Nom de la définition d'alerte qui a généré l'alerte. |
Propriétaire | Nom de l'opérateur propriétaire de l'alerte. |
Impact | Le badge d'alerte affecté par l'alerte. Le badge affecté (santé, risque ou efficacité) indique le niveau d'urgence du problème identifié. |
Sous-type d'alerte | Informations supplémentaires sur le type d'alerte déclenchée sur un objet sélectionné. Cela vous permet de classer les alertes dans un niveau détaillé autre que le type d'alerte afin que vous puissiez attribuer certains types d'alertes à des administrateurs système spécifiques. Par exemple : disponibilité, performances, capacité, conformité et configuration. |
Statut | État actuel de l'alerte. Par exemple, Actif ou Annulé. |
Criticité | Le niveau d'importance de l'alerte dans votre environnement. Le niveau est soit le niveau attribué à la définition d'alerte lorsqu'elle a été créée, soit la criticité la plus élevée du symptôme si le niveau attribué était Basé sur le symptôme.
Voici les valeurs possibles :
|
Déclenché sur | Nom et type de l'objet pour lequel l'alerte a été générée, affichés dans une info-bulle lorsque vous passez la souris sur le nom de l'objet. Cliquez sur le nom de l'objet pour afficher les onglets présentant ses détails. Dans ces onglets, vous pouvez commencer à examiner tout problème supplémentaire relatif à l'objet. |
État du contrôle |
État de l'interaction de l'utilisateur avec l'alerte. Voici les valeurs possibles :
|
Type d'objet | Type d'objets à partir duquel l'alerte a été générée. |
Créé le | Date et heure de génération de l'alerte. |
Mise à jour le | Date et heure auxquelles l'alerte a été modifiée pour la dernière fois.
Une alerte est mise à jour à chaque fois que l'une des modifications suivantes se produit :
|
Annulée le |
Date et heure auxquelles l'alerte est annulée pour l'une des raisons suivantes :
|
Action | Choisissez Oui pour filtrer sur les alertes dont l'option Exécuter est activée. Choisissez Non pour filtrer sur les alertes dont l'option Exécuter est désactivée. |
La grille de données Alertes fournit la liste des alertes générées utilisées pour résoudre des problèmes dans votre environnement. Une flèche dans chaque en-tête de colonne permet de trier la liste par ordre croissant ou décroissant.
Option | Description |
---|---|
Criticité | La criticité est le niveau d'importance de l'alerte dans votre environnement. Le niveau est soit le niveau attribué à la définition d'alerte lorsqu'elle a été créée, soit la criticité la plus élevée du symptôme si le niveau attribué était Basé sur le symptôme.
Voici les valeurs possibles :
|
Alerte | Nom de la définition d'alerte qui a généré l'alerte. Cliquez sur le nom de l'alerte pour afficher les détails correspondants à droite. |
Déclenché sur | Nom et type de l'objet pour lequel l'alerte a été générée, affichés dans une info-bulle lorsque vous passez la souris sur le nom de l'objet. Cliquez sur le nom de l'objet pour afficher les onglets présentant ses détails. Dans ces onglets, vous pouvez commencer à examiner tout problème supplémentaire relatif à l'objet. |
Créé le | Date et heure de génération de l'alerte. |
Statut | État actuel de l'alerte. Par exemple, Actif ou Annulé. |
Type d'alerte | Décrit le type d'alerte qui s'est déclenchée pour l'objet sélectionné. Cela vous permet de classer les alertes afin d'attribuer certains types d'alertes à des administrateurs spécifiques. Par exemple : application, virtualisation/hyperviseur, matériel, stockage, réseau, administrative et résultats. |
Sous-type d'alerte | Fournit des informations supplémentaires sur le type d'alerte qui s'est déclenchée pour l'objet sélectionné. Cela vous permet de classer les alertes de façon plus détaillée qu'avec le classement Type d'alerte, afin d'attribuer certains types d'alertes à des administrateurs spécifiques. Par exemple : disponibilité, performances, capacité, conformité et configuration. |
Importance | Affiche la priorité de l'alerte. Le niveau d'importance de l'alerte est déterminé à l'aide d'un algorithme de classement intelligent. |
Correctif suggéré | Affiche la recommandation permettant de résoudre l'alerte. |
Action | Cliquez sur ce bouton pour suivre la recommandation et résoudre l'alerte. |
Affichage des informations sur l’alerte
Lorsque vous cliquez sur une alerte dans la liste contenant toutes les alertes, les informations correspondantes s'affichent à droite. Affichez les informations sur l'alerte pour connaître les symptômes qui l'ont déclenché, les recommandations permettant de résoudre le problème sous-jacent et corriger la cause de l'alerte.
Différentes manières d'afficher les informations sur l'alerte
- Dans le menu de gauche, cliquez sur , puis cliquez sur une alerte dans la liste des alertes.
- Dans le menu de gauche, cliquez sur Alertes. , puis sélectionnez un groupe, un centre de données personnalisé, une application ou un objet d'inventaire. Cliquez sur l'objet, puis sur l'onglet
- Dans le menu, sélectionnez Rechercher et localisez l'objet voulu. Cliquez sur l'objet, puis sur l'onglet Alertes.
- Onglet Détails de l'alerte
-
Section Description Recommandations Affichez les recommandations pour l'alerte. Cliquez sur < ou sur > pour passer en revue les recommandations. Pour résoudre l'alerte, cliquez sur le bouton Exécuter l'action s'il s'affiche. Autres recommandations Réduisez la section pour afficher des recommandations supplémentaires. Reportez-vous aux liens de la section Voulez-vous plus d'informations ? pour afficher les mesures supplémentaires, les événements ou les autres informations qui s'affichent sous forme de lien. Base de l'alerte Actif uniquement Cette option est activée par défaut. Lorsque cette option est activée, tous les symptômes/conditions actifs qui ont été satisfaits pour l'alerte s'affichent. Lorsque cette option est désactivée, tous les symptômes/conditions d'une alerte s'affichent. Symptômes Affichez les symptômes qui ont déclenché l'alerte. Réduisez chaque symptôme pour afficher des informations supplémentaires. Conditions Affichez les conditions qui ont déclenché l’alerte. Réduisez chaque condition pour afficher des informations supplémentaires. Remarques Entrez vos remarques sur l'alerte et cliquez sur Envoyer pour enregistrer. Fermer Cliquez sur l'icône X pour fermer l'onglet Détails de l'alerte. - Onglet Alertes associées
-
La Portée associée affichée à droite, montre les objets situés un niveau au-dessus et un niveau en dessous de l'objet sur lequel l'alerte a été déclenchée. Cette topologie est fixe. Vous ne pouvez pas modifier la portée dans l'onglet Alertes associées.
À droite, vous pouvez voir les éléments suivants :- Si la même alerte a été déclenchée sur l'objet au cours des 30 derniers jours. Cela vous aide à comprendre si le problème est récurrent ou nouveau.
- Si la même alerte a été déclenchée chez d'autres homologues dans le même environnement, au cours des 30 derniers jours. Cela vous permet d'effectuer une analyse rapide chez vos homologues pour savoir si d'autres ont connu le même problème.
- Toutes les alertes déclenchées dans la topologie actuelle. Cela vous permet de déterminer s'il existe d'autres alertes en amont ou en aval dans l'environnement, affectant la santé de l'objet.
- Onglet Preuve potentielle
-
Reportez-vous à l'onglet Preuve potentielle pour connaître les preuves potentielles relatives au problème et établir la cause principale. Cet onglet affiche les événements, les modifications de propriétés et les mesures anormales pouvant concerner l'alerte. La portée et l'intervalle de temps sont fixes. Pour modifier la portée ou l'intervalle de temps et procéder à un examen plus poussé, cliquez sur Lancer l'assistant. L'assistant de dépannage s'exécute.
L'intervalle de temps qui s'affiche dans l'onglet Preuve potentielle est de deux heures trente minutes avant le déclenchement de l'alerte. VMware Aria Operations recherche des preuves potentielles dans cet intervalle de temps.
Alertes intelligentes
Chaque entreprise peut disposer d'au moins cinq outils de surveillance qui surveillent les différents aspects de leurs opérations de centre de données 24 heures sur 24. Cela peut entraîner une situation de saturation des alertes, dans laquelle plusieurs alertes sont générées par un outil de surveillance unique ou plusieurs outils pour le même problème. Par conséquent, les administrateurs informatiques doivent passer au crible des milliers d'alertes pour filtrer le bruit et se concentrer sur les problèmes clés, augmentant ainsi le volume même des alertes et occasionnant une tempête ou un bruit d'alerte, ce qui empêche les équipes d'identifier les alertes les plus critiques. La saturation des alertes se produit, car les outils de surveillance ne disposent pas des informations nécessaires pour comprendre que toutes les alertes décrivent le même problème.
L'apprentissage automatique (ML) permet d'automatiser la gestion de systèmes complexes qui contiennent des milliers d'objets, tels que des machines virtuelles, des hôtes et des banques de données, grâce à la surveillance de millions de mesures, d'énormes volumes de journaux et de suivis d'application, afin de capturer une image haute résolution de l'intégralité de la pile.
VMware Aria Operations, par le biais de la création de clusters d'alertes intelligentes, contribue à éliminer les interruptions de service de l'entreprise qui se produisent en raison d'un manque de capacités de dépannage plus rapides et de résolution des problèmes critiques sur plusieurs objets.
Emplacement de l'onglet Alertes intelligentes
Dans le menu de gauche, cliquez sur Alertes intelligentes.
, puis cliquez sur la vignetteFonctionnement de la création de clusters d'alertes intelligentes
Les alertes intelligentes, également appelées clusters d'alertes dans VMware Aria Operations, regroupent les alertes associées en fonction de leur heure de création et de leur distance de topologie. Cette approche offre une méthode de dépannage plus organisée et plus efficace, par rapport au traitement des alertes individuelles résultant du même problème sous-jacent. Le clustering d’alertes est effectué en fonction de l’algorithme DBScan. DBScan (Density-Based Spatial Clustering of Applications with Noise) est un algorithme d'apprentissage automatique de création de cluster non supervisé qui tente de regrouper des points de données étroitement rangés dans des clusters artificiels. Dans le contexte de VMware Aria Operations , DBScan a été adapté dans un algorithme de diffusion en continu avec des paramètres spécifiques configurés, tels que le nombre minimal de points défini sur cinq, la différence d'heure définie sur quinze minutes, et la distance de topologie définie sur 1, pour ne tenir compte que des enfants et des parents directs. Deux vues principales, Durée de vie des alertes intelligentes et Topologie des objets, sont fournies pour le dépannage du cluster d'alertes.
Option | Description |
---|---|
Filtres | Vous pouvez filtrer les clusters d’alertes en fonction de leur état. Sélectionnez Actif ou Inactif dans la liste déroulante État, puis cliquez sur Appliquer. |
Cluster d'alertes | La fiche du cluster d'alertes affiche les éléments suivants :
|
Objet | Nom de l’objet racine. |
Heure de début/Heure de fin | L'heure de début du cluster d'alertes est l'heure à laquelle le premier cluster qui répond à la condition de création de cluster est identifié. L'heure de fin du cluster d'alertes est l'heure à laquelle le cluster ne remplit plus les conditions requises pour être un cluster d'alertes. |
Alertes/objets | Sélectionnez Alertes pour afficher la représentation graphique des alertes d'une période spécifique. Sélectionnez Objets pour afficher le graphique de relation entre les objets d'un cluster d'alertes. Passez la souris sur l'objet et cliquez sur Détails pour ouvrir la page Résumé de l'objet. |
Mode de démarrage | Cliquez sur Mode de démarrage pour afficher la durée de vie d'un cluster d'alertes. Chaque bulle affiche des alertes et des objets. Passez la souris sur la bulle pour afficher plus de détails. |
Dépannage | Cliquez sur cette option pour lancer l'assistant de dépannage en vue d'un dépannage plus poussé. |
Graphique | Le graphique affiche le nombre d'alertes par heure, pour le cluster d'alertes sélectionné.
Cliquez sur la légende du diagramme pour filtrer les alertes en fonction des éléments suivants :
Cliquez sur l'icône Calendrier pour afficher les alertes passées en sélectionnant la Plage ou en sélectionnant une date dans les champs De et À. |
Grouper par | Vous pouvez regrouper les alertes en fonction des éléments suivants :
|
Filtres | Vous pouvez filtrer les alertes selon :
|