Cette rubrique fournit des informations sur les différents types d'alertes dans VMware Aria Operations, comment y accéder et comment afficher plus d'informations sur ces alertes.

Types d'alertes

Il existe trois types d'alertes dans VMware Aria Operations. Le type d'alerte détermine la gravité du problème.

Alertes de santé
La liste des alertes de santé correspond à toutes les alertes générées qui sont configurées pour affecter la santé de votre environnement et qui nécessitent une intervention urgente. La liste des alertes de santé permet d'évaluer les problèmes, d'en définir les priorités et de commencer à les résoudre immédiatement.
Alertes de risques
La liste des alertes de risque correspond à toutes les alertes générées qui sont configurées pour indiquer un risque dans votre environnement. Traitez les alertes de risque rapidement, avant que les symptômes déclencheurs ayant généré l'alerte affecte de manière négative la santé de votre environnement.
Alertes d'efficacité
La liste des alertes d'efficacité correspond à toutes les alertes générées qui sont configurées pour indiquer les problèmes d'utilisation efficace de vos objets surveillés dans votre environnement. Traitez les alertes d'efficacité pour récupérer l'espace inutilisé ou améliorer les performances des objets dans votre environnement.

Accès aux alertes dans VMware Aria Operations

La page Toutes les alertes ou la page Alertes administratives fournit la liste de toutes les alertes générées dans VMware Aria Operations. Utilisez la liste des alertes pour déterminer l'état de votre environnement et commencer à résoudre les problèmes.

Emplacement de la page Toutes les alertes

Dans le menu de gauche, cliquez sur Dépannage > Alertes.

Emplacement de la page Alertes administratives

En tant qu'administrateur, vous pouvez afficher les alertes administratives en cliquant sur l'icône d'avertissement en regard du menu Alertes ou en cliquant sur Dépannage > Alertes dans le menu de gauche, puis en cliquant sur l'onglet Alertes administratives. Vous pouvez afficher la page Alertes administratives uniquement si vous êtes un utilisateur Administrateur général ou si vous disposez de privilèges administratifs qui vous sont attribués.

Fonctionnement des pages Toutes les alertes et Alertes administratives

Par défaut, au départ, seules les alertes actives sont répertoriées et regroupées par heure. Consultez et gérez les alertes qui figurent dans la liste à l'aide des options de la barre d'outils. Sélectionnez plusieurs lignes dans la liste grâce aux combinaisons Maj+clic et Ctrl+clic.

Pour voir les détails d'une alerte, cliquez sur son nom. Les détails de l'alerte s'affichent sur la droite, notamment les symptômes ayant déclenché l'alerte. Le système propose des recommandations pour résoudre le problème associé à l'alerte et un lien pour exécuter la recommandation. Dans les détails, un bouton Exécuter l'action peut s'afficher. Placez le pointeur de la souris sur ce bouton pour en savoir plus sur la recommandations à suivre. Vous pouvez également afficher le bouton Exécuter et le Correctif suggéré dans la grille de données Alertes. Vous pouvez filtrer les alertes en sélectionnant celles dont l'option Exécuter est activée et exécuter la tâche recommandée pour résoudre l'alerte à partir de la grille de données Alertes. Cliquez sur la petite case située sur la partie inférieure gauche de la liste des alertes pour inclure les colonnes Correctif suggéré et Exécuter dans la grille de données.

Cliquez sur le nom de l'objet pour lequel l'alerte a été générée afin d'afficher les détails correspondants et d'accéder à des informations supplémentaires relatives aux mesures et aux événements.

Si vous avez migré des alertes depuis une version précédente de VMware Aria Operations , elles sont répertoriées avec l'état Annulé et leurs détails ne sont pas disponibles.

Toutes les alertes et options d'alertes administratives

Les options d'alerte incluent les options de barre d'outils et de grille de données. Utilisez les options de la barre d'outils pour trier la liste d'alertes et annuler, interrompre ou gérer la propriété. Utilisez la grille de données pour afficher les alertes et les détails correspondants.

Sélectionnez une alerte dans la liste pour activer le menu Actions :

Tableau 1. Menu Actions
Option Description
Annuler l'alerte

Annule les alertes sélectionnées. Si vous configurez la liste des alertes pour que seules les alertes actives s'affichent, les alertes annulées sont retirées de la liste.

Vous pouvez annuler des alertes une fois que votre intervention n'est plus requise. L'annulation d'une alerte n'annule pas la condition sous-jacente qui l'a générée. L'annulation des alertes est efficace si l'alerte est déclenchée par des symptômes de panne et d'événement, car ces symptômes sont déclenchés de nouveau uniquement si des pannes ou des événements se produisent ultérieurement sur les objets surveillés. Si l'alerte a été générée à partir de symptômes liés à des mesure ou à des propriété, l'alerte est uniquement annulée jusqu'au prochain cycle de collecte et d'analyse. Si les valeurs incriminées sont encore présentes, l'alerte est à nouveau générée.

Supprimer les alertes annulées Supprimez les alertes annulées (inactives) en sélectionnant un groupe ou des alertes individuelles. L'option est désactivée pour les alertes actives.
Interrompre

Interrompez une alerte pendant un nombre de minutes donné.

Vous pouvez suspendre les alertes lorsque vous examinez une alerte et ne souhaitez pas que celle-ci affecte la santé, le risque ou l'efficacité de l'objet pendant que vous travaillez. Si le problème persiste une fois la période de suspension écoulée, l'alerte est réactivée et affecte de nouveau la santé, le risque ou l'efficacité de l'objet.

L'utilisateur qui interrompt l'alerte devient le propriétaire assigné.

Attribuer à Attribuez l'alerte à un utilisateur. Vous pouvez rechercher un nom d'utilisateur spécifique et cliquer sur Enregistrer pour attribuer l'alerte à l'utilisateur sélectionné.
S'approprier

En tant qu'utilisateur actuel, vous vous attribuez la propriété de l'alerte.

Cette action est possible s'il s'agit de vous-même, mais vous ne pouvez pas attribuer la propriété d'une alerte à d'autres utilisateurs.

Concéder

Une alerte est destituée de sa pleine propriété.

Accéder à la définition d'alerte Permet de basculer vers la page des définitions d'alerte, qui contient la définition de l'alerte sélectionnée précédemment.
Désactiver… Fournit deux options pour désactiver l'alerte :
Note : Pour activer l'option Désactiver, sélectionnez Définition dans la liste déroulante Grouper par, puis cliquez sur le nom du groupe Définition d'alerte.
  • Désactiver l'alerte dans toutes les stratégies : désactive l'alerte pour tous les objets et toutes les stratégies.
  • Désactiver l'alerte dans les stratégies sélectionnées : désactive l'alerte pour les objets ayant la stratégie sélectionnée.
Ouvrir une application externe Actions que vous pouvez exécuter sur l'objet sélectionné.

Par exemple, « Ouvrir la machine virtuelle dans vSphere Client ».

Tableau 2. Options Grouper par
Option Description
Aucun Les alertes ne sont pas classées dans des groupes spécifiques.
Heure Permet de regrouper les alertes par heure de déclenchement. Il s'agit de l'option par défaut. Vous pouvez également les regrouper selon les plages suivantes : 1 heure, 4 heures, aujourd'hui et hier, jours de la semaine en cours, semaine dernière et semaines antérieures.
Criticité Permet de regrouper les alertes par criticité. Les valeurs sont les suivantes, par ordre croissant de criticité : Info/Avertissement/Immédiat/Critique. Voir également Criticité dans le tableau des options de la grille de données Toutes les alertes, ci-dessous.
Définition Permet de regrouper les alertes par définition : les alertes similaires sont regroupées.
Type d'objet Permet de regrouper les alertes en fonction du type d'objet qui les déclenche. Par exemple, les alertes relatives aux hôtes sont regroupées.
Portée Permet de regrouper les alertes par portée. Vous pouvez rechercher des alertes dans l'étendue sélectionnée.
Tableau 3. Filtres rapides (alerte)
Filtres rapides Descriptions
Options de filtrage Permet de limiter la liste des alertes en fonction de correspondances avec des filtres que vous sélectionnez.

Par exemple, si vous avez choisi l'option Heure dans le menu Grouper par, Vous pouvez maintenant sélectionner État -> Actif dans le menu Filtres rapides pour que la page Toutes les alertes/Alertes administratives affiche uniquement les alertes actives, classées selon leur heure de déclenchement.

Options (consultez également les tableaux Grouper par et Grille de données Toutes les alertes pour obtenir des définitions de filtre supplémentaires)
ID d'alerte ID donné pour une alerte.
Alerte Nom de la définition d'alerte qui a généré l'alerte.
Propriétaire Nom de l'opérateur propriétaire de l'alerte.
Impact

Le badge d'alerte affecté par l'alerte. Le badge affecté (santé, risque ou efficacité) indique le niveau d'urgence du problème identifié.

Sous-type d'alerte Informations supplémentaires sur le type d'alerte déclenchée sur un objet sélectionné. Cela vous permet de classer les alertes dans un niveau détaillé autre que le type d'alerte afin que vous puissiez attribuer certains types d'alertes à des administrateurs système spécifiques. Par exemple : disponibilité, performances, capacité, conformité et configuration.
Statut

État actuel de l'alerte.

Par exemple, Actif ou Annulé.

Criticité

Le niveau d'importance de l'alerte dans votre environnement.

Le niveau est soit le niveau attribué à la définition d'alerte lorsqu'elle a été créée, soit la criticité la plus élevée du symptôme si le niveau attribué était Basé sur le symptôme.

Voici les valeurs possibles :
  • Critique
  • Immédiat
  • Avertissement
  • Informations
Déclenché sur

Nom et type de l'objet pour lequel l'alerte a été générée, affichés dans une info-bulle lorsque vous passez la souris sur le nom de l'objet.

Cliquez sur le nom de l'objet pour afficher les onglets présentant ses détails. Dans ces onglets, vous pouvez commencer à examiner tout problème supplémentaire relatif à l'objet.

État du contrôle
État de l'interaction de l'utilisateur avec l'alerte. Voici les valeurs possibles :
  • Ouvert. L'alerte est disponible pour une action. Elle n'a été attribuée à aucun utilisateur.
  • Attribué. L'alerte est attribuée à l'utilisateur connecté lorsqu'il clique sur S'approprier.
  • Suspendu. L'alerte a été suspendue pour une période spécifiée. Temporairement, l'alerte ne peut plus avoir d'impact sur la santé, les risques et l'efficacité de l'objet. Cet état s'avère utile lorsqu'un administrateur système travaille sur un problème et souhaite éviter que l'alerte affecte l'état de santé de l'objet.
Type d'objet

Type d'objets à partir duquel l'alerte a été générée.

Créé le

Date et heure de génération de l'alerte.

Mise à jour le

Date et heure auxquelles l'alerte a été modifiée pour la dernière fois.

Une alerte est mise à jour à chaque fois que l'une des modifications suivantes se produit :
  • Un autre symptôme dans la définition d'alerte est généré.
  • Le symptôme de déclenchement responsable de l'alerte est annulé.
Annulée le
Date et heure auxquelles l'alerte est annulée pour l'une des raisons suivantes :
  • Les symptômes qui ont déclenché l'alerte ne sont plus actifs. L'alerte est annulée par le système.
  • Les symptômes qui ont déclenché l’alerte sont annulés, car les définitions de symptômes correspondantes sont désactivées dans la stratégie appliquée à l’objet.
  • Les symptômes qui ont déclenché l'alerte sont annulés, car les définitions de symptômes correspondantes ont été supprimées.
  • La définition d'alerte pour cette alerte est désactivée dans la stratégie qui est appliquée à l'objet.
  • La définition d'alerte est supprimée.
  • L'utilisateur a annulé l'alerte.
Action Choisissez Oui pour filtrer sur les alertes dont l'option Exécuter est activée. Choisissez Non pour filtrer sur les alertes dont l'option Exécuter est désactivée.

La grille de données Alertes fournit la liste des alertes générées utilisées pour résoudre des problèmes dans votre environnement. Une flèche dans chaque en-tête de colonne permet de trier la liste par ordre croissant ou décroissant.

Tableau 4. Toutes les alertes et Grille de données Alertes administratives
Option Description
Criticité

La criticité est le niveau d'importance de l'alerte dans votre environnement.

Le niveau est soit le niveau attribué à la définition d'alerte lorsqu'elle a été créée, soit la criticité la plus élevée du symptôme si le niveau attribué était Basé sur le symptôme.

Voici les valeurs possibles :
  • Critique
  • Immédiat
  • Avertissement
  • Informations
Alerte

Nom de la définition d'alerte qui a généré l'alerte.

Cliquez sur le nom de l'alerte pour afficher les détails correspondants à droite.

Déclenché sur

Nom et type de l'objet pour lequel l'alerte a été générée, affichés dans une info-bulle lorsque vous passez la souris sur le nom de l'objet.

Cliquez sur le nom de l'objet pour afficher les onglets présentant ses détails. Dans ces onglets, vous pouvez commencer à examiner tout problème supplémentaire relatif à l'objet.

Créé le

Date et heure de génération de l'alerte.

Statut

État actuel de l'alerte.

Par exemple, Actif ou Annulé.

Type d'alerte

Décrit le type d'alerte qui s'est déclenchée pour l'objet sélectionné. Cela vous permet de classer les alertes afin d'attribuer certains types d'alertes à des administrateurs spécifiques. Par exemple : application, virtualisation/hyperviseur, matériel, stockage, réseau, administrative et résultats.

Sous-type d'alerte

Fournit des informations supplémentaires sur le type d'alerte qui s'est déclenchée pour l'objet sélectionné. Cela vous permet de classer les alertes de façon plus détaillée qu'avec le classement Type d'alerte, afin d'attribuer certains types d'alertes à des administrateurs spécifiques. Par exemple : disponibilité, performances, capacité, conformité et configuration.

Importance Affiche la priorité de l'alerte. Le niveau d'importance de l'alerte est déterminé à l'aide d'un algorithme de classement intelligent.
Correctif suggéré Affiche la recommandation permettant de résoudre l'alerte.
Action Cliquez sur ce bouton pour suivre la recommandation et résoudre l'alerte.

Affichage des informations sur l’alerte

Lorsque vous cliquez sur une alerte dans la liste contenant toutes les alertes, les informations correspondantes s'affichent à droite. Affichez les informations sur l'alerte pour connaître les symptômes qui l'ont déclenché, les recommandations permettant de résoudre le problème sous-jacent et corriger la cause de l'alerte.

Différentes manières d'afficher les informations sur l'alerte

  • Dans le menu de gauche, cliquez sur Dépannage > Alertes, puis cliquez sur une alerte dans la liste des alertes.
  • Dans le menu de gauche, cliquez sur Environnement > Navigateur d'objets, puis sélectionnez un groupe, un centre de données personnalisé, une application ou un objet d'inventaire. Cliquez sur l'objet, puis sur l'onglet Alertes.
  • Dans le menu, sélectionnez Rechercher et localisez l'objet voulu. Cliquez sur l'objet, puis sur l'onglet Alertes.
La description de l'alerte est masquée lorsque vous ouvrez les informations sur l'alerte. Cliquez sur Afficher la description pour voir la description de l'alerte. Affichez l'horodatage de début de l'alerte et sa date de mise à jour, sous le titre de l'alerte.
Onglet Détails de l'alerte
Section Description
Recommandations Affichez les recommandations pour l'alerte. Cliquez sur < ou sur > pour passer en revue les recommandations. Pour résoudre l'alerte, cliquez sur le bouton Exécuter l'action s'il s'affiche.
Autres recommandations Réduisez la section pour afficher des recommandations supplémentaires. Reportez-vous aux liens de la section Voulez-vous plus d'informations ? pour afficher les mesures supplémentaires, les événements ou les autres informations qui s'affichent sous forme de lien.
Base de l'alerte
Actif uniquement Cette option est activée par défaut. Lorsque cette option est activée, tous les symptômes/conditions actifs qui ont été satisfaits pour l'alerte s'affichent. Lorsque cette option est désactivée, tous les symptômes/conditions d'une alerte s'affichent.
Symptômes Affichez les symptômes qui ont déclenché l'alerte. Réduisez chaque symptôme pour afficher des informations supplémentaires.
Conditions Affichez les conditions qui ont déclenché l’alerte. Réduisez chaque condition pour afficher des informations supplémentaires.
Remarques Entrez vos remarques sur l'alerte et cliquez sur Envoyer pour enregistrer.
Fermer Cliquez sur l'icône X pour fermer l'onglet Détails de l'alerte.
Onglet Alertes associées

La Portée associée affichée à droite, montre les objets situés un niveau au-dessus et un niveau en dessous de l'objet sur lequel l'alerte a été déclenchée. Cette topologie est fixe. Vous ne pouvez pas modifier la portée dans l'onglet Alertes associées.

À droite, vous pouvez voir les éléments suivants :
  • Si la même alerte a été déclenchée sur l'objet au cours des 30 derniers jours. Cela vous aide à comprendre si le problème est récurrent ou nouveau.
  • Si la même alerte a été déclenchée chez d'autres homologues dans le même environnement, au cours des 30 derniers jours. Cela vous permet d'effectuer une analyse rapide chez vos homologues pour savoir si d'autres ont connu le même problème.
  • Toutes les alertes déclenchées dans la topologie actuelle. Cela vous permet de déterminer s'il existe d'autres alertes en amont ou en aval dans l'environnement, affectant la santé de l'objet.
Onglet Preuve potentielle

Reportez-vous à l'onglet Preuve potentielle pour connaître les preuves potentielles relatives au problème et établir la cause principale. Cet onglet affiche les événements, les modifications de propriétés et les mesures anormales pouvant concerner l'alerte. La portée et l'intervalle de temps sont fixes. Pour modifier la portée ou l'intervalle de temps et procéder à un examen plus poussé, cliquez sur Lancer l'assistant. L'assistant de dépannage s'exécute.

L'intervalle de temps qui s'affiche dans l'onglet Preuve potentielle est de deux heures trente minutes avant le déclenchement de l'alerte. VMware Aria Operations recherche des preuves potentielles dans cet intervalle de temps.

Alertes intelligentes

Chaque entreprise peut disposer d'au moins cinq outils de surveillance qui surveillent les différents aspects de leurs opérations de centre de données 24 heures sur 24. Cela peut entraîner une situation de saturation des alertes, dans laquelle plusieurs alertes sont générées par un outil de surveillance unique ou plusieurs outils pour le même problème. Par conséquent, les administrateurs informatiques doivent passer au crible des milliers d'alertes pour filtrer le bruit et se concentrer sur les problèmes clés, augmentant ainsi le volume même des alertes et occasionnant une tempête ou un bruit d'alerte, ce qui empêche les équipes d'identifier les alertes les plus critiques. La saturation des alertes se produit, car les outils de surveillance ne disposent pas des informations nécessaires pour comprendre que toutes les alertes décrivent le même problème.

L'apprentissage automatique (ML) permet d'automatiser la gestion de systèmes complexes qui contiennent des milliers d'objets, tels que des machines virtuelles, des hôtes et des banques de données, grâce à la surveillance de millions de mesures, d'énormes volumes de journaux et de suivis d'application, afin de capturer une image haute résolution de l'intégralité de la pile.

VMware Aria Operations, par le biais de la création de clusters d'alertes intelligentes, contribue à éliminer les interruptions de service de l'entreprise qui se produisent en raison d'un manque de capacités de dépannage plus rapides et de résolution des problèmes critiques sur plusieurs objets.

Emplacement de l'onglet Alertes intelligentes

Dans le menu de gauche, cliquez sur Dépannage > Alertes, puis cliquez sur la vignette Alertes intelligentes.

Fonctionnement de la création de clusters d'alertes intelligentes

Les alertes intelligentes, également appelées clusters d'alertes dans VMware Aria Operations, regroupent les alertes associées en fonction de leur heure de création et de leur distance de topologie. Cette approche offre une méthode de dépannage plus organisée et plus efficace, par rapport au traitement des alertes individuelles résultant du même problème sous-jacent. Le clustering d’alertes est effectué en fonction de l’algorithme DBScan. DBScan (Density-Based Spatial Clustering of Applications with Noise) est un algorithme d'apprentissage automatique de création de cluster non supervisé qui tente de regrouper des points de données étroitement rangés dans des clusters artificiels. Dans le contexte de VMware Aria Operations , DBScan a été adapté dans un algorithme de diffusion en continu avec des paramètres spécifiques configurés, tels que le nombre minimal de points défini sur cinq, la différence d'heure définie sur quinze minutes, et la distance de topologie définie sur 1, pour ne tenir compte que des enfants et des parents directs. Deux vues principales, Durée de vie des alertes intelligentes et Topologie des objets, sont fournies pour le dépannage du cluster d'alertes.

L'onglet Alertes intelligentes affiche la liste des clusters d'alertes dans le volet de gauche. Cliquez sur n’importe quel cluster d’alertes pour afficher les détails dans le volet de droite.
Option Description
Filtres Vous pouvez filtrer les clusters d’alertes en fonction de leur état. Sélectionnez Actif ou Inactif dans la liste déroulante État, puis cliquez sur Appliquer.
Cluster d'alertes La fiche du cluster d'alertes affiche les éléments suivants :
  • État : s'affiche si l'état du cluster d'alertes est actif ou inactif.
  • Objet : affiche le nom de l'objet auquel le cluster est attribué.
  • Graphique d'alertes : affiche le nombre d'alertes et d'objets, ainsi que la criticité de l'alerte. Passez la souris sur le graphique pour afficher les détails.
  • Heure de début : affiche l'heure à laquelle le premier cluster qui répond à la condition de création de cluster est identifié.
  • Heure de fin : affiche l'heure à laquelle le cluster ne remplit plus les conditions requises pour être un cluster d'alertes.
Cliquez sur le cluster d’alertes pour afficher les détails dans le volet de droite.
Objet Nom de l’objet racine.
Heure de début/Heure de fin L'heure de début du cluster d'alertes est l'heure à laquelle le premier cluster qui répond à la condition de création de cluster est identifié. L'heure de fin du cluster d'alertes est l'heure à laquelle le cluster ne remplit plus les conditions requises pour être un cluster d'alertes.
Alertes/objets Sélectionnez Alertes pour afficher la représentation graphique des alertes d'une période spécifique.

Sélectionnez Objets pour afficher le graphique de relation entre les objets d'un cluster d'alertes. Passez la souris sur l'objet et cliquez sur Détails pour ouvrir la page Résumé de l'objet.

Mode de démarrage Cliquez sur Mode de démarrage pour afficher la durée de vie d'un cluster d'alertes. Chaque bulle affiche des alertes et des objets. Passez la souris sur la bulle pour afficher plus de détails.
Dépannage Cliquez sur cette option pour lancer l'assistant de dépannage en vue d'un dépannage plus poussé.
Graphique Le graphique affiche le nombre d'alertes par heure, pour le cluster d'alertes sélectionné.
Cliquez sur la légende du diagramme pour filtrer les alertes en fonction des éléments suivants :
  • Criticité
    • Critique
    • Immédiat
    • Avertissement
    • Info
  • Objets

Cliquez sur l'icône Calendrier pour afficher les alertes passées en sélectionnant la Plage ou en sélectionnant une date dans les champs De et À.

Grouper par Vous pouvez regrouper les alertes en fonction des éléments suivants :
  • Définition
  • Portée
  • Heure
  • Criticité
  • Type d'objet
Filtres Vous pouvez filtrer les alertes selon :
  • ID d'alerte
  • Nom de l'alerte
  • Propriétaire
  • Impact
  • Type d'alerte
  • Sous-type d'alerte
  • Statut