Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1410 connectés 

 



Dernière réponse
Sujet : SSID qui "décrochent" qqs minutes, plusieurs fois par jour - ALE
antoincy L'uptime est celui récupéré par Nagios :
 
https://reho.st/self/09a143164926d8 [...] 7d20fd.png  
 
Je ne trouve pas de logs qui me mettraient sur une piste sur l'OA. Effectivement on dirait un reboot mais je pense que ce n'est pas le cas : le machin mets au moins 10 minutes à ré-up lors d'un vrai reboot. Là, la coupure ne dure que qqs minutes... Donc il perd juste le réseau. En revanche tu me donnes une piste pour les alims. Je vais faire un essai en mettant une des deux alims sur un autre onduleur... Actuellement les deux sont sur le même (une en battery et l'autre en surge)

Votre réponse
Nom d'utilisateur    Pour poster, vous devez être inscrit sur ce forum .... si ce n'est pas le cas, cliquez ici !
Le ton de votre message                        
                       
Votre réponse


[b][i][u][strike][spoiler][fixed][cpp][url][email][img][*]   
 
   [quote]
 

Options

 
Vous avez perdu votre mot de passe ?


Vue Rapide de la discussion
antoincy L'uptime est celui récupéré par Nagios :
 
https://reho.st/self/09a143164926d8 [...] 7d20fd.png  
 
Je ne trouve pas de logs qui me mettraient sur une piste sur l'OA. Effectivement on dirait un reboot mais je pense que ce n'est pas le cas : le machin mets au moins 10 minutes à ré-up lors d'un vrai reboot. Là, la coupure ne dure que qqs minutes... Donc il perd juste le réseau. En revanche tu me donnes une piste pour les alims. Je vais faire un essai en mettant une des deux alims sur un autre onduleur... Actuellement les deux sont sur le même (une en battery et l'autre en surge)
saarh On dirait bien que ton OA a un "léger" soucis...
Si c'était un problème de contre mesure ou un paramétrage foireux, on ne devrait pas perdre l'OA6000 sur le lan.... qu'il coupe (éventuellement) la diffusion des SSID, ejecte les périph connectés, pourquoi pas, mais on dirait qu'il reboot un peu sans raison...l'uptime, c'est celui donné par l'OA ou par Nagios ? on le perd juste du réseau ou il reboot réellement ? (ce qui semble être le cas, puisque tout revient à la normale au bout de quelques minutes.....temps de boot)
Les alims redondées sont sur 2 sources de courant séparées ? (ondulé / non ondulé)
Je ne sais pas si il est encore possible de mettre à jour le firmware sur cet engin, mais parfois.....(bien que si il était foireux, en 10 ans, vous auriez déjà eu le soucis :) )
antoincy Oui, si l’OA tombe, les bornes sont orphelines et ne diffusent plus rien.
Le doubler n’était pas envisagé car c’est déjà costaud à la base (2x PSU voir trois à une époque) ect.
Et puis sans parler budget...
 
J’ai un OmniSwitch 6850 en cœur de réseau. C’est sur lui qu’est connecté mon OA6000. Je n’ose pas l’incriminer vu la bête (et puis lui n’a pas 10 ans par contre).  
 
Ce qui est sur c’est que Nagios me donne des uptimes différends pour le switch/ l’OA/ les AP
Le 6850 a son uptime normal (depuis dernier reboot volontaire)
L’OA a un uptime à partir du moment où il a eu ce comportement, par exemple ici il y a 13h...
Les AP ont leur uptime normal cad pas celui de l’OA...
saarh Parti comme c'est , ça sent quand même pas très bon sur L'OA. Par contre, je ne connais pas son mode de fonctionnement....par exemple, chez nous, les RFS ne servent qu'à pousser les confs, et l'administration du bordel. Si ils tombent ou défaillent, les AP continuent à fonctionner en autonomie. (je ne peux juste plus modifier le moindre paramètre dessus, diffuser un new ssid, etc)
Sur nos vieux WS 5100, ils tombaient, les AP associées tombaient. Si c'est sur le même principe que les WS, le doubler aurait été une idée ^^ (surtout si le WiFi est critique chez vous)
 
Après, pas de soucis sur un switch qui merdouillerait ? (broadcast merdique, etc, tout ce qui pourrait faire tomber le lien vers l'OA)
antoincy Merci à toi saarh pour ta réponse.
J'ai ajouté 5 AP à monitorer. Je vais voir si je remarque qqchose.
 
Sur l'OA6000 je ne suis qu'en check-host-alive. Mais je suis entrain de faire remonter cpu/ram et temperature car j'ai un doute sur l'état du chassis.
 
Et oui les AP sont sur différents switchs POE, j'ai plusieurs stacks répartis sur 6 locaux techniques.  
 
Pour le moment je ne vois toujours pas... Cela a recommencé ce matin
saarh

antoincy a écrit :


 
edit : à préciser que cela a toujours fonctionné correctement depuis des années. je n'ai fait aucune modif...
 
https://reho.st/medium/self/ebe190a [...] be5f1e.png


 
Comme ma voiture avant qu'un beau matin elle refuse de démarrer...."elle marchait pourtant bien hier" :D
 
ça serait sans doute pas mal de remonter les AP (ou au moins un bon échantillonnage) sous Nagios. Histoire de voir un peu ou chercher, et si ça bagotte par là...
Ton Nagios, il a gueulé sur un process en particulier ? Tu supervise quels services de ton OA6000 ?
 
Ici, sur le RFS, on supervise les AP adoptées, les periph connectés en wifi, et les classiques load / ram / ping, en plus des ping sur AP
 
https://reho.st/medium/self/6067ca7 [...] 7495c3.jpg
 
ça permet déjà de trouver des pistes en cas de merdouillage.
 
Effectivement, si tes AP sont sur différents switch POE, tu peux déjà éliminer un soucis d'alim....si elles sont toute sur le même, par contre....

antoincy Cela s'est produit à 17h48, pour la premier fois Nagios me dit "This host is flapping"
antoincy

saarh a écrit :

je ne connais pas non plus ce contrôleur, mais il n'y aurait pas aussi une protection style WPA countermeasure qui ferait l'andouille ? (on avait ça, déco aléatoire et simili "reboot" des AP)
Toutes les AP sont alimentées via l'Omniaccess, ou via des POE ? l'idéal serait de voir aussi la tronche des AP au moment du soucis...indépendamment du Omni.elles sont monitorées (style ping avec centreon, etc) ou pas ?  
ça pourrait donner des pistes ;)


merci à toi.
je n'ai pas trouvé de WPA countermeasure pour l'instant.
malheureusement je ne les supervise pas individuellement > l'interface web de l'OA6000 permet le monitoring basique.
peut-être que je devrais les faire remonter sur mon Nagios.
 
en attendant voici une capture du réglage d'une borne sur un des SSID :
edit : à préciser que cela a toujours fonctionné correctement depuis des années. je n'ai fait aucune modif...
edit2 : elles sont sur des OmniSwitch POE - pas alimentées via l'OA directement  
 
https://reho.st/medium/self/ebe190a [...] be5f1e.png

saarh je ne connais pas non plus ce contrôleur, mais il n'y aurait pas aussi une protection style WPA countermeasure qui ferait l'andouille ? (on avait ça, déco aléatoire et simili "reboot" des AP)
Toutes les AP sont alimentées via l'Omniaccess, ou via des POE ? l'idéal serait de voir aussi la tronche des AP au moment du soucis...indépendamment du Omni.elles sont monitorées (style ping avec centreon, etc) ou pas ?  
ça pourrait donner des pistes ;)
antoincy Merci de ta réponse. Il faut que je vérifie mais de mémoire il me semble que les canaux ont été réglés manuellement
CK Ze CaRiBoO Je connais pas ce contrôleur mais en principe les bornes ne devraient pas arrêter de broadcaster comme ça par sa faute.
Est-ce que tu aurais un paramètre d'ajustement auto des canaux qui pourrait provoquer un reboot des radios ?
antoincy Bonjour à tous,
 
Sur un de mes sites j'ai un contrôleur de bornes Alcatel-Lucent OmniAccess 6000 (oui, je sais que ça commence à dater)
Ce contrôleur manage environ 40 bornes Aruba réparties sur les bâtiments.
 
Depuis quelques temps on me fait remonter des déconnexions intempestives : (plusieurs fois par jour)
 
- les SSID disparaissent d'un coup, cela a pour effet de déconnecter les clients
- quelques minutes plus tard, sans aucune intervention, les SSID réapparaissent et tout fonctionne correctement
- cela ne se produit pas forcément quand la charge est lourde : ex vendredi soir vers 18h nous avons constaté ce dysfonctionnement, alors que je n'avais plus grand monde sur les réseaux.
 
Mon système de supervision ne me remonte absolument rien en ce qui concerne un événement quelconque sur l'OA6000.
J'ai peur que le matos commence à lâcher mais j'aimerais explorer toutes les pistes avant de me précipiter.
 
Avez vous une idée ? Des spécialistes ALE dans la salle ?
Merci

Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR