Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1471 connectés 

 



Dernière réponse
Sujet : Alertes critiques : Comment en réduire le nombre SVP ?
cyberlabo Bonjour,  
 
Je vous remercie Saar pour la capture et les conseils. C'est déjà plus parlant pour moi car j'ai l'illustration en exemple. Je m'en vais expérimenter toutes ces pistes ! ;-)
 
Bien à vous.

Votre réponse
Nom d'utilisateur    Pour poster, vous devez être inscrit sur ce forum .... si ce n'est pas le cas, cliquez ici !
Le ton de votre message                        
                       
Votre réponse


[b][i][u][strike][spoiler][fixed][cpp][url][email][img][*]   
 
   [quote]
 

Options

 
Vous avez perdu votre mot de passe ?


Vue Rapide de la discussion
cyberlabo Bonjour,  
 
Je vous remercie Saar pour la capture et les conseils. C'est déjà plus parlant pour moi car j'ai l'illustration en exemple. Je m'en vais expérimenter toutes ces pistes ! ;-)
 
Bien à vous.
saarh le cap précis est simple :
 
- identifier et voir les valeurs qui remontent en alerte. 100% de DD sur un windows, c'est critique. ça peut même être une cause de serveur qui ne redémarre plus, et qui de toute façon va planter sous peu....donc à corriger impérativement, au delà de centreon. Mais dans tous les cas, analyser les remontées Centreon. Y a des graph, faut les lire. Un serveur qui est constamment à 85% d'usage sur 6 mois, ni plus, ni moins, c'est que c'est ce qu'il utilise normalement....donc baisser le seuil d'alerte à 90% est cohérent. Un serveur qui grossi tous les jours, même légèrement, ou exponentiellement, faut analyser le pourquoi et mettre le seuil qui te laisse le temps d'agir. (chez nous, on a quasiment tous les seuil à 90% pour les espaces disques, comme je n'ai aucun applicatif générant plus de 2% par jour d'accroissement en cas de gros pic. si ça tape une alerte, c'est que je dois leur redonner de l'air, en faisant le ménage, et / ou en agrandissant la partition.)
 
- trifouille pas les fichiers de conf si tu n'es pas à l'aise. Chaque service peut se modifier en graphique. Sur la vue principale, tu clic sur le service que tu souhaite modifier, puis la petite clef (en jaune ci dessous, à droite).
 
https://reho.st/medium/self/913f85d [...] 532302.jpg  
 
et tu modifie tes seuils.
 
https://reho.st/medium/self/355eab1 [...] 0c6bf6.jpg  
 
 
Attention aux relations. Parfois, un même check est lié à x serveurs.....libre à toi de copier les template dispo pour personnaliser un peu tout ça !
dims +1 !
sur certaines, c'est pertinent (quand je vois le disque C plein a 100%, j'ai peur pour le reste de l'infra....)
d'autres, que ça braille alors qu'il reste 350Go, c'est clair que le seuil n'est pas du tout adapté.
 
pour les services, ça braille, mais comme on sait pas pourquoi, difficile de répondre et encore plus de décider quelle action entreprendre.
 
idem sur la RAM dispo.
2Go libre sur 12, ça peut être beaucoup, comme peu !
sur un SQL server pas tuné ou un exchange, il va par défaut bouffer toute la RAM dispo. c'est donc normal qu'il reste rien ou presque.
sur un AD, faut se demander ou sont passés les 10Go occupés !!! :D
 
en clair, ya du boulot AVANT de toucher a la supervision.
nebulios

cyberlabo a écrit :

@ je@nb : Ce n'est pas un manque de volonté que j'exprime ici, juste une demande de cap précis à suivre, ne sachant pas quels fichiers de conf régler pour répondre à ma problématique.
Je m'attendais à ce type de remarque, d'ailleurs...


Mais tu as lu le contenu des alertes au moins ?

ShonGail

cyberlabo a écrit :

Bonjour les contributeurs,
 
Je vous remets le lien de la capture afin de me conseiller pour chaque ligne d'alerte
https://www.casimages.com/i/180426112500650605.jpg.html


 
 
La majorité des alertes concernent un manque d'espace disque libre.
Que veux-tu faire sous Centreon ici !?
Il faut sur les serveurs en question libérer de l'espace disque. C'est assez évident, non ?

cyberlabo Oui, n'étant plus très jeune stagiaire (reprise d'une formation diplômante suite à reconversion pro), je pourrais effectivement compter sur l'appui de l'ASR de la société, si celui-ci, overbooké à outrance, n'endossait pas moult casquettes et pouvait me consacrer plus de temps pour éviter les questions sur les fora. C'est d'ailleurs pour ces conditions de travail que l'accueil du-dit stagiaire se justifiait ici.
 
De mon point de vue, c'est un phénomène récurrent, constaté dans les petites structures, ou alors dans les structures voulant faire des économies sur le recrutement de ressources compétentes. Or ce point reste un autre débat...
nex84 Tu es stagiaire ?
Demande à tes collègues, expérimente, ...
Sinon ton stage ne servira à rien.
cyberlabo @ je@nb : Ce n'est pas un manque de volonté que j'exprime ici, juste une demande de cap précis à suivre, ne sachant pas quels fichiers de conf régler pour répondre à ma problématique.
Je m'attendais à ce type de remarque, d'ailleurs...
Je@nb tu veux pas réfléchir plutôt qu'on fasse ton boulot ?
cyberlabo Bonjour les contributeurs,
 
Je vous remets le lien de la capture afin de me conseiller pour chaque ligne d'alerte
https://www.casimages.com/i/180426112500650605.jpg.html
nex84 Attention aux seuils en %.
imaginons que tu as un disque de 100Go, si tu mets une alerte à 95% ça signifie que tu auras une alerte quand il ne te reste plus que 5Go de libre.
Si tu changes le disque par un disque de 500Go, l'alerte va se déclencher pour 25Go. Ce qui n'est plus forcément pertinent suivant l'utilisation de l'espace sur ce serveur.
saarh Oui, il va falloir analyser toutes tes erreurs, et faire en fonction. L'image est un brin petite, mais on voit déjà tes alertes critiques sur l'espace disque. Si elles ne sont pas pertinentes, tu passe le seuil de notif à 3% (par exemple) ou tu désactive les checks sur ces services si vraiment tu es certain que ça ne bouge pas (mais je prendrais plutôt la première solution sur du stockage :D ).  
A toi de voir la pertinence de la surveillance de certains services.
Après, certaines alertes critiques, en faux positifs, seront inévitables. (par exemple, sur mon serveur SAP, je monitore un service qui est en critical jusqu'à ce que les gens commencent à bosser dessus....mais je dois en garder la supervision, car en pleine journée, c'est réellement une erreur critique)
Pour ce qui est de la conf, ou la modif des check, centreon est bien documenté sur le net ;) Je pense que pour toi, ça sera surtout au niveau des check qu'il te faudra agir.
nex84 Ben tu prends toutes les alertes que tu as et tu vérifie si elles sont pertinentes (élément surveillé, seuil)

 

Par exemple :
Si l'élément surveillé n'a pas besoin de surveillence, alors le check n'a pas lieu d'être.
Si l'alerte ne nécessite pas (encore) d'action c'est que le seuil ou la criticité ne sont pas adéquat.
Et inversement : les éléments non surveillés doivent être étudiés. Devraient-ils être surveillés ?

 

Enfin, comme l'a dit aurel25000, il ne doit pas y avoir une seule alerte critique active en situation nominale.
S'il y a une alerte critique c'est que quelque chose ne va pas et qu'une action correctrice est nécessaire d'urgence.
Les autres sont soit des faux positifs, soit mal configurées. Dans les deux cas il faut les revoir.
Le but c'est de ne pas noyer un vrai problème au milieu d'évènements de moindre importance.

cyberlabo Bonjour aurel25000,
 
Je te remercie pour ta contribution mais concrètement où dois-je investiguer pour revoir la conf STP.
 
Cordialement.
aurel25000 Hello,
 
Pour moi c'est simple, une alerte centreon = une action
Si une alerte =/= action, c'est qu'elle ne doit pas être une alerte et implique de revoir la conf.
cyberlabo Bonjour,
 
Je suis actuellement stagiaire informatique dans une société et j'ai été chargé de réfléchir à la façon d'éliminer les alertes critiques récurrentes, visibles sur le tableau de bord Centreon, outil avec lequel la société d'accueil travaille.
L'objectif final est donc de ne plus banaliser l'apparition de ces notifications engendrées par ces mêmes alertes et ainsi pouvoir rester proactif, en agissant en amont de ces alertes.
 
Au point de vue base documentaire, hormis certains site web de monitoring, je travaille actuellement avec l'excellent ouvrage papier de Loïc Fontaine, intitulé : "Centreon, Maîtriser la supervision de votre système d'information", à partir duquel j'essaie d'en extraire quelques préconisations de réglages. Malheureusement, Le chapitre 6 (relatif aux notifications, graphes et rapports) de cette ouvrage ne cible pas précisément ma problématique.
 
Je fais donc appel à vos contributions respectives afin d'exploiter quelques pistes qui pourraient éventuellement m'être suggérées et sur lesquelles je n'avais pas forcément réfléchies.
 
Je vous remercie par avance...  
 
https://nsa39.casimages.com/img/201 [...] 621513.jpg

Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR