vRealize Log Insight propose deux ensembles de notifications à propos de la santé du système, les notifications générales, applicables à toutes les configurations de produit, et les notifications relatives aux clusters pour les déploiements basés sur un cluster.

Pour afficher les notifications système, dans l'onglet Alertes, cliquez sur Alertes système. Grâce aux autorisations appropriées, vous pouvez activer ou désactiver les notifications. Pour plus d'informations, reportez-vous à la section Afficher et gérer les alertes dans Utilisation de vRealize Log Insight.

Note : Dans cette rubrique, un utilisateur Admin fait référence à un utilisateur associé au rôle de super administrateur ou à un rôle disposant des autorisations appropriées, comme décrit dans la section Créer et modifier des rôles.

Les tableaux suivants répertorient et décrivent les notifications système dans vRealize Log Insight.

Notifications système générales

vRealize Log Insight génère des notifications à propos des notifications pouvant nécessiter l'intervention de l'administrateur, notamment en cas d'échec de l'archivage ou de retards dans la planification des alertes.

Nom de la notification Description
Vous ne pourrez bientôt plus rechercher les données les plus anciennes

vRealize Log Insight est censé démarrer la désactivation des anciennes données du stockage du dispositif virtuel en fonction de la taille prévue des données pouvant être recherchées, de l'espace de stockage et de l'état d'ingestion actuel. Si vous avez configuré l'archivage, les données ayant changé sont archivées ; sinon, elles sont supprimées.

Pour résoudre ce problème, ajoutez un stockage ou ajustez le seuil des notifications de rétention. Pour plus d'informations, consultez Configurer vRealize Log Insight pour envoyer des notifications de santé.

La notification est envoyée après chaque redémarrage du service vRealize Log Insight.

Durée de rétention du référentiel

Une période de rétention correspond à la durée pendant laquelle les données sont conservées sur le disque local de votre instance vRealize Log Insight. Une période de rétention est déterminée par le volume de données que le système peut contenir et le taux d'ingestion actuel. Par exemple, si vous recevez 10 Go/jour de données (après indexation) et que vous disposez de 300 Go d'espace, votre taux de rétention est de 30 jours.

Lorsque votre limite de stockage est atteinte, les anciennes données sont supprimées pour laisser de l'espace aux données venant d'être ingérées. Cette notification vous indique à quel moment le volume de données pouvant être recherchées et que vRealize Log Insight peut stocker, en fonction des taux d'ingestion actuels, dépasse l'espace de stockage disponible sur le dispositif virtuel.

Le stockage peut s'avérer insuffisant avant la période définie à l'aide du Seuil des notifications de rétention. Ajoutez un stockage ou ajustez le seuil des notifications de rétention.

Événements annulés

vRealize Log Insight n'a pas pu ingérer tous les messages entrants du journal.

  • En cas d'annulation d'un message TCP, selon le suivi effectué par le serveur vRealize Log Insight, une notification système est envoyée comme suit :
    • Une fois par jour
    • Chaque fois que le service vRealize Log Insight est redémarré (manuellement ou automatiquement)
  • L'e-mail contient le nombre de messages ayant été annulés depuis l'envoi de la dernière notification par e-mail et le nombre total d'annulations de messages depuis le dernier redémarrage de vRealize Log Insight.
Note : L'heure indiquée sur la ligne d'envoi dépend du client de messagerie et suit le fuseau horaire local, alors que le corps de texte de l'e-mail indique l'heure UTC.
Compartiments d'index corrompus

Une partie de l'index sur disque est corrompue. ce qui indique en général de graves problèmes au niveau du système de stockage sous-jacent. La partie corrompue de l'index est exclue des requêtes de service. Un index corrompu a une incidence sur l'ingestion des nouvelles données. vRealize Log Insight vérifie l'intégrité de l'index après le démarrage du service. En cas de détection d'une corruption, vRealize Log Insight envoie une notification système comme suit :

  • Une fois par jour
  • Chaque fois que le service vRealize Log Insight est redémarré (manuellement ou automatiquement)
Disque insuffisant

L'espace disque alloué est insuffisant dans vRealize Log Insight. vRealize Log Insight a fort probablement rencontré un problème de stockage.

L'espace d'archivage va être plein L'espace disque utilisé pour l'archivage des données vRealize Log Insight sur le serveur NFS sera bientôt épuisé. Si la quantité de données archivées que le serveur NFS peut contenir au taux d'ingestion actuel est inférieure à sept jours, une notification système est envoyée. Par exemple, si vous effectuez un archivage à un taux d'utilisation de disque de 708,9 Mo par jour et que vous disposez de 2 000 Mo d'espace, il vous reste une capacité d'environ trois jours, ce qui est inférieur au seuil. Dans ce cas, vous recevrez une notification indiquant que vous êtes en dessous de cette capacité.
Modification de l'espace disque total

La taille totale de la partition de stockage des données de vRealize Log Insight a diminué. Cette notification indique en général un problème grave du système de stockage sous-jacent. Lorsque vRealize Log Insight détecte cette condition, cette notification est envoyée comme suit :

  • Immédiatement
  • Une fois par jour
Archivages en attente vRealize Log Insight ne peut pas archiver les données comme prévu. ce qui indique en général des problèmes au niveau du stockage NFS que vous avez configuré pour l'archivage des données.
Le volume de stockage d'enregistrement de journal alloué a atteint 75 % de la capacité maximale de stockage d'enregistrement de journal. vRealize Log Insight est configuré pour garantir la conformité STIG, et le volume de stockage d'enregistrement de journal alloué atteint 75 % de la capacité de stockage d'enregistrement de journal maximale du référentiel.
Note : Cette notification est envoyée par nœud.
La licence est sur le point d'expirer La licence de vRealize Log Insight est sur le point d'expirer.
La licence a expiré La licence de vRealize Log Insight a expiré.
Le certificat SSL est sur le point d'expirer Le certificat SSL du cluster vRealize Log Insight expirera dans 30 jours.
Connexion au serveur AD impossible vRealize Log Insight ne peut pas se connecter au serveur Active Directory configuré.
Impossible de récupérer l'adresse IP High Availability [adresse IP], car elle est déjà prise par une autre machine Le cluster vRealize Log Insight n'a pas pu récupérer l'adresse IP configurée pour l'équilibrage de charge intégré (ILB). Cette notification se produit le plus souvent lorsqu'un autre hôte du même réseau détient l'adresse IP et que celle-ci ne peut donc pas être prise par le cluster.

Vous pouvez résoudre ce conflit en libérant l'adresse IP de l'hôte qui la détient actuellement ou en configurant l'équilibrage de charge intégrée de Log Insight avec une adresse IP statique disponible sur le réseau. Lors de la modification de l'adresse IP de l'équilibrage de charge intégré, vous devez reconfigurer tous les clients pour envoyer les journaux à la nouvelle adresse IP ou à un nom de domaine complet/une URL dont la résolution correspond à cette adresse IP. Vous devez également annuler la configuration de chaque système vCenter Server intégré avec vRealize Log Insight, puis le reconfigurer à partir de la page Intégration vSphere.

L'adresse IP High Availability [adresse IP] n'est pas disponible en raison d'un trop grand nombre de pannes de nœuds L'adresse IP configurée pour l'équilibrage de charge intégré (ILB) n'est pas disponible. Les clients qui tentent d'envoyer des journaux à un cluster vRealize Log Insight via l'adresse IP de l'équilibrage de charge intégré ou via un nom de domaine complet/une URL dont la résolution équivaut à cette adresse IP, verront cette adresse comme non disponible. Cette notification se produit le plus souvent lorsqu'une majorité des nœuds du cluster vRealize Log Insight sont défectueux, non disponibles ou inaccessibles à partir du nœud principal. Elle peut également se produire lorsque la synchronisation de l'heure NTP n'a pas été activée ou que les serveurs NTP configurés présentent entre eux un décalage horaire significatif. Vous pouvez confirmer que le problème persiste en essayant d'exécuter une commande ping (si elle est autorisée) sur une adresse IP pour vérifier son accessibilité.

Pour résoudre ce problème, vérifiez l'intégrité et la disponibilité de la plupart de vos nœuds de clusters et activez la synchronisation de l'heure NTP sur des serveurs NTP précis.

Trop de migrations de l'adresse IP High Availability [votre adresse IP] entre nœuds vRealize Log Insight L'adresse IP configurée pour l'équilibrage de charge intégré (ILB) a migré trop souvent au cours des 10 dernières minutes.

Dans des conditions de fonctionnement normales, l'adresse IP se déplace rarement entre les nœuds de cluster vRealize Log Insight. Cependant, l'adresse IP peut se déplacer si le nœud propriétaire actuel redémarre ou passe en mode de maintenance. Il se peut également que la synchronisation de l'heure soit insuffisante entre des nœuds de clusters Log Insight. Elle est essentielle au bon fonctionnement des clusters. Dans ce dernier cas, vous pouvez corriger le problème en activant la synchronisation de l'heure NTP sur des serveurs NTP précis.

Erreur de certificat SSL

Une source Syslog a lancé une connexion à vRealize Log Insight via SSL, mais a brusquement mis fin à la connexion. Cette notification peut indiquer que la source Syslog n'a pas été en mesure de confirmer la validité du certificat SSL. Pour permettre à vRealize Log Insight d'accepter des messages syslog sur SSL, un certificat validé par le client est requis et les horloges des systèmes doivent être synchronisées. Le certificat SSL ou le service de temps du réseau peut présenter un problème.

Vous pouvez valider que le certificat SSL est approuvé par votre source Syslog, reconfigurer la source pour ne pas utiliser SSL ou réinstaller le certificat SSL. Reportez-vous à la section Configurer les paramètres SSL de l'agent vRealize Log Insight et à la section Installer un certificat SSL personnalisé.

La collecte vCenter a échoué

vRealize Log Insight ne peut pas collecter les événements, tâches et alarmes de vCenter. Pour rechercher l'erreur exacte à l'origine de l'échec de la collecte et pour vérifier si la collecte est en cours d'exécution, reportez-vous au fichier /var/log/vmware/loginsight/plugins/vsphere/li-vsphere.log.

Échec de la collecte d'événements du service vCenter Kubernetes

vRealize Log Insight ne peut pas collecter les événements, tâches et alarmes du système vCenter Kubernetes. Pour rechercher l'erreur exacte à l'origine de l'échec de la collecte et pour vérifier si la collecte est en cours d'exécution, reportez-vous au fichier /var/log/vmware/loginsight/plugins/vsphere/li-vsphere.log.

Événements abandonnés par le redirecteur d'événements

Un redirecteur abandonne les événements en raison de problèmes de connexion ou de surcharge.

Exemple :

Log Insight Admin Alert: Event Forwarder Events Dropped 
This alert is about your Log Insight installation on https://<your_url>

Event Forwarder Events Dropped triggered at 2016-08-02T18:41:06.972Z

Log Insight just dropped 670 events for forwarder target 'Test',
reason: Pending queue is full.
Requêtes d'alertes derrière la planification

vRealize Log Insight n'a pas pu exécuter une alerte définie par l'utilisateur à l'heure configurée. Le retard peut être dû à une ou plusieurs alertes définies par l'utilisateur inefficaces ou à une taille inadéquate du système pour la charge d'ingestion et de requête.

Alerte désactivée automatiquement

Si une alerte définie par l'utilisateur a été exécutée au moins 10 fois et que sa durée d'exécution moyenne est supérieure à une heure, l'alerte est considérée comme inefficace ; elle est alors désactivée pour éviter toute incidence sur d'autres alertes définies par l'utilisateur.

Requête d'alerte inefficace

Si une alerte définie par l'utilisateur met plus d'une heure à se terminer, elle est considérée comme étant inefficace.

Utilisateur créé ou utilisateur connecté pour la première fois vRealize Log Insight est configuré pour garantir la conformité STIG et un utilisateur est créé ou un utilisateur Active Directory ou VMware Identity Manager se connecte pour la première fois.

Notifications système pour les clusters

vRealize Log Insight envoie des notifications concernant les modifications de topologie des clusters, notamment l'ajout de nouveaux membres au cluster ou les problèmes de communication temporaires des nœuds.

Expéditeur Nom de la notification Description
Nœud principal Un nouveau nœud travailleur nécessite une approbation

Un nœud worker envoie une demande pour rejoindre un cluster. Un utilisateur Admin doit approuver la demande ou la rejeter.

Nœud principal Un nouveau nœud travailleur a été approuvé

Un utilisateur Admin a approuvé une demande d'appartenance d'un nœud worker souhaitant rejoindre un cluster vRealize Log Insight.

Nœud principal Un nouveau nœud travailleur a été refusé

Un utilisateur Admin a rejeté une demande d'appartenance d'un nœud worker souhaitant rejoindre un cluster vRealize Log Insight. Si la demande a été refusée par erreur, un utilisateur Admin peut envoyer de nouveau la demande depuis le travailleur, puis l'approuver dans le nœud principal.

Nœud principal Le nombre maximal de nœuds pris en charge a été dépassé à cause du nœud travailleur

Le nombre de nœuds worker du cluster Log Insight est supérieur au nombre maximal pris en charge en raison de la présence d'un nouveau nœud worker.

Nœud principal Le nombre de nœuds autorisés a été dépassé et le nouveau nœud travailleur est refusé

Un utilisateur a tenté d'ajouter au cluster davantage de nœuds que le nombre maximal autorisé et l'ajout du nœud a été refusé.

Nœud principal Nœud travailleur déconnecté

Un nœud worker précédemment connecté s'est déconnecté du cluster vRealize Log Insight.

Nœud principal Nœud travailleur reconnecté

Un nœud worker s'est reconnecté au cluster vRealize Log Insight.

Nœud principal Nœud worker révoqué par

Un utilisateur Admin a révoqué l'appartenance d'un nœud worker et ce dernier ne fait plus partie du cluster vRealize Log Insight.

Nœud principal Nœud travailleurworker inconnu rejeté

Le nœud principal vRealize Log Insight a rejeté la demande d'un nœud travailleurworker, car il lui est inconnu. Si le nœud travailleurworker est valide et qu'il doit être ajouté au cluster, connectez-vous au nœud travailleurworker, supprimez son fichier de jeton et la configuration utilisateur à l'emplacement /storage/core/loginsight/config/, puis exécutez restart loginsight service sur le nœud travailleurworker.

Nœud principal Le nœud travailleur worker est passé en mode de maintenance

Un nœud worker est passé en mode de maintenance. Pour pouvoir modifier la configuration et pour que le nœud worker puisse servir des requêtes, un utilisateur Admin doit désactiver ce mode sur le nœud.

Nœud principal Le nœud travailleur worker est revenu en mode service

Un nœud worker est sorti du mode maintenance et est revenu en mode service.

Nœud travailleurworker Le nœud principal a échoué ou s'est déconnecté du nœud travailleurworker

Le nœud travailleur worker qui envoie la notification n'est pas en mesure de contacter le nœud principal de vRealize Log Insight. Cette notification peut indiquer l'échec du nœud principal et peut nécessiter un redémarrage. En cas d'échec du nœud principal, le cluster ne peut pas être configuré et les requêtes ne peuvent pas être envoyées jusqu'à ce que le nœud soit de nouveau en ligne. Les nœuds travailleursworker continuent cependant à ingérer des messages.

Note : Il peut vous arriver de recevoir plusieurs notifications de ce genre, car plusieurs nœuds travailleurs worker peuvent détecter la panne du nœud principal et envoyer chacun une notification.
Nœud travailleurworker Nœud principal connecté au nœud workertravailleur

Le nœud travailleur worker qui envoie la notification est reconnecté au nœud principal de vRealize Log Insight.