Micro-coupures réseau

Micro-coupures réseau - Réseaux - Systèmes & Réseaux Pro

Marsh Posté le 09-05-2013 à 13:55:25    

Salut,

 

Nous avons un "phénomène" étrange qui est apparu mardi après midi. Cela a commencé  par des utilisateurs qui nous ont appelé car il n'arrivaient plus à se connecter aux lecteur réseau du serveur de fichier puis cela revenait aussitôt , d'autres travaillant en tse perdaient la connections quelques secondes. Outlook qui perd la connexion quelques secondes etc..

 

Aujourd'hui, je reçois des alertes mails comme quoi certains certains ne réponde plus au Ping. Je me connecte a distance, tous mes serveurs sont ok. La preuve, je peu le connecter à distance et envoyer / recevoir des mails.

 

À quoi peut être du ce type de problème ? Et comment identifier l'origine de ce soucis ?

 

Merci de votre aide

Reply

Marsh Posté le 09-05-2013 à 13:55:25   

Reply

Marsh Posté le 09-05-2013 à 15:55:00    

switch qui déconne ? routeur qui redémarre?

Reply

Marsh Posté le 09-05-2013 à 18:32:48    

C'est vraiment une seconde, le routeur n'aurait même pas le temps de redémarrer.

 

Pour les switchs, faut voir, mais je ne vois  pas comment trouver le fautif.

 

Reply

Marsh Posté le 09-05-2013 à 18:45:25    

Pour les switchs, voir justement par rapport aux utilisateurs qui t'ont appelé : s'ils sont tous sur le même et que le problème a eu lieu au même moment sur eux tous, ça vient du switch :D
 
A tout hasard aussi, penses à compter ton nombre d'utilisateurs, et fait le comparatif avec le nombre de CAL dont tu disposes :whistle:


---------------
Grippe ? Coronavirus ? Portez votre masque correctement ! :D
Reply

Marsh Posté le 09-05-2013 à 19:27:26    

non rien à voir les CAL

Reply

Marsh Posté le 09-05-2013 à 19:31:52    

Je vais voir pour les switchs. Mais pas beaucoup d'utilisateurs nous ont appelés à cause du pont. Demain il n'y a pas beaucoup de monde, je ferais des tests...

 

Ok merci pour les cal

Reply

Marsh Posté le 09-05-2013 à 22:24:49    

Je@nb a écrit :

non rien à voir les CAL


J'ai eu le cas...


---------------
Grippe ? Coronavirus ? Portez votre masque correctement ! :D
Reply

Marsh Posté le 09-05-2013 à 22:35:19    

CAL TS/RDS alors. Les autres CAL n'étant que déclaratives ...

Reply

Marsh Posté le 09-05-2013 à 22:48:12    

Oui mais cela ne se produit pas que sur du tse. Cela se passe sur mon poste aussi...

Reply

Marsh Posté le 09-05-2013 à 22:55:32    

Aaah autant pour moi, j'avais pensé aux CAL quand j'ai lu TSE.


---------------
Grippe ? Coronavirus ? Portez votre masque correctement ! :D
Reply

Marsh Posté le 09-05-2013 à 22:55:32   

Reply

Marsh Posté le 10-05-2013 à 09:46:52    

Ce matin, quelques utilisateurs (qui ne sont pas sur le même switch) m'appel pour des lenteurs et des déconnexion...
 
Quand je ping les équipements, je n'ai pas de pertes, mais sur un équipement (la pîle de switch ou sont branché tous les switchs) j'ai parfois des grosses latences.
 
Genre, tout le temps à 1ms, puis d'un coup une grosse latence à 780ms..puis ca repasse à 1ms.
 
C'est le seul équipement qui me fait cela.

Reply

Marsh Posté le 10-05-2013 à 10:59:07    

Boucle sur le réseau ? STP qui recalcule sa topo ?


---------------
Zostere
Reply

Marsh Posté le 10-05-2013 à 11:26:52    

je vais essayer de voir pour une boucle, mais c'est pas évident..
 
C'est à dire STp qui recalcule sa topo ?

Reply

Marsh Posté le 10-05-2013 à 12:06:30    

Y'a des outils sympa concernant les micro coupures.
Moi j'men suis déjà sorti avec ça :
http://www.cfos.de/en/ping/ping.htm
et ça
http://www.colasoft.com/ping_tool/

Reply

Marsh Posté le 10-05-2013 à 12:38:07    

Merci je vais jetter un oeil.  
 
C'est vraiment galère, ça fonctionne bien pendant quelques minutes, puis ca repard avec des latence à 180ms, parfois une ou quelques pertes de paquet, puis une latence de 2000ms, et ca se restabilise à 1ms...
 
C'est vraiment que quand je ping le coeur de réseau. Si je ping les switchs autour il n'y a pas de soucis.

Reply

Marsh Posté le 10-05-2013 à 13:05:05    

Regarde la conso CPU du coeur, l'état des buffers. Et en fn de la marque du switch, les rebooter de temps en temps est nécessaire :D
 
Et le ping n'étant pas qqch de primordiale pour un équipement réseau, si il a plus important à faire il préfère le faire que de répondre à un ping

Reply

Marsh Posté le 10-05-2013 à 13:07:02    

ok, je vais regarder les cpu, et les buffers.
 
Le switch en question est un alcatel 6850. ceux autours sont des 6400.
 
J'ai rebooté l'ensemble des switchs à 12h. Cela ne semble rien changer.

Reply

Marsh Posté le 10-05-2013 à 13:17:06    

Sur 1 heure :
 
Le cpu du switch est monté au max à 54% d'utilisation, et est en moyenne à 22 %.
 
La mémoire est utilisé tout le temps à 71%.  
 
Est ce que cela parait normal ?
 
Edit : comparer aux autres switchs, cela me parait normal, les autre sont aux alentours de 66%, et sont moins sollicités.


Message édité par tony83400 le 10-05-2013 à 13:19:54
Reply

Marsh Posté le 10-05-2013 à 14:01:11    

Oui ça parait pas déconnant :)

Reply

Marsh Posté le 10-05-2013 à 14:16:58    

J'ai débranché un à un les switchs qui sont raccordé, et j'ai toujours des pertes et grosses latence.  
 
Est ce que cela peut venir d'une machine / serveur qui y est connecté ?

Reply

Marsh Posté le 10-05-2013 à 14:21:01    

Si une machine/serveur envoie des millions de petits paquets ouais mais bon dans ce cas les buffers et cpu seraient au taquet j'imagine.
 
Tu peux regarder l'utilisation des liens ? Voir les compteurs d'erreurs sur chaque lien ? (je connais pas les alcatel)

Reply

Marsh Posté le 10-05-2013 à 14:40:12    

Au niveau des liens, on est à environ 30% d'utilisation par lien.
 
J'ai regardé chaque interface, et il n'y a aucune erreur CRC.

Reply

Marsh Posté le 10-05-2013 à 16:11:50    

Bon mais sinon, que disent les log de tes switchs, doit bien y avoir des informations :)

Reply

Marsh Posté le 10-05-2013 à 16:21:12    

Dans les logs, j'ai ce message, qui revient plusieurs fois :
 
 STP    info Topology changed on VLAN/STP id 200
FRI MAY 10 15:00:23 2013          MIPGW    info === stp === stpRootPortChange trap generated
 
L'id du vlan n'est pas toujours le même

Reply

Marsh Posté le 10-05-2013 à 16:23:19    

T'as pas des câbles défaillants dans tes liaisons inter-switchs ?

Reply

Marsh Posté le 10-05-2013 à 16:26:10    

Je vais vérifier, c'est de la fibre entre les switchs.  
 
Ce message signifie cela ?

Reply

Marsh Posté le 10-05-2013 à 16:32:55    

C'est quoi la topo de tes switchs ?
Si le root port change c'est que ya un des liens dans ton archi stp qui déconne, à priori.

Reply

Marsh Posté le 10-05-2013 à 17:01:55    

ok, je vais vérifier mes liens.  
 
Sur le switch 6850, j'ai deux switchs relié en fibre. Et une pile de deux switchs relié en Ethernet via 4 câbles ethernet en port-channel

Reply

Marsh Posté le 10-05-2013 à 17:04:29    

Donc ton 6850 est ton cœur de réseau ?
Est-il configuré pour être toujours le root de ta topo stp ?

Reply

Marsh Posté le 10-05-2013 à 17:06:09    

oui, les deux 6850 stacké, sont mon coeur de réseau.
 
Par contre, je ne sais pas comment savoir si il est root. Je vais voir si je trouve cette info
 
merci de ton aide

Reply

Marsh Posté le 10-05-2013 à 17:34:39    

J'ai remplacé les 4 câbles ethernet par 1 fibre, et pour l'instant il n'y a plus de message STP    info Topology changed on VLAN/STP
 
On va voir ce que cela donne

Reply

Marsh Posté le 10-05-2013 à 17:40:00    

Ce qui est bizarre c'est de ne pas voir de logs concernant la coupure de certains ports ...

Reply

Marsh Posté le 10-05-2013 à 18:39:02    

Probablement parce qu'il n'y a pas de pertes de lien, en revanche si son channel se mélange les pinceaux (ça arrive) hop tu as une boucle et le STP recalcule sa topologie.


---------------
Zostere
Reply

Marsh Posté le 10-05-2013 à 18:45:02    

Le mieux est que je laisse comme ça ? Il vaut mieux que je double l'attachement en fibre ?

Reply

Marsh Posté le 10-05-2013 à 19:04:47    

Bah regarde qq jours comme ça si ça marche. Ensuite double la fibre voir si ça revient.

Reply

Marsh Posté le 10-05-2013 à 19:15:12    

Pour l'instant, ça à l'air de tourner.  
 
Par contre la latence du ping n'est pas "aussi" stable que les autres. Dans le sens, où quand à partir de mon pc, je ping le 6850, j'ai des pics à 11ms alors que vers un autre cela reste constant à 1ms.
 
Par contre pas de pertes de paquets. La latence n'est peut être pas si significative que ça dans ce cas là.
 
Edit : sur 200 paquets envoyé, il y a quand même 2 paquets de perdu. Ca ne me semble quand même pas normal, je vois pourquoi il y aurait des pertes...


Message édité par tony83400 le 10-05-2013 à 19:16:43
Reply

Marsh Posté le 10-05-2013 à 19:40:09    

T'as moyen de voir si il y a pas des erreurs sur certains ports de tes switchs ? Car sur du local comme ça effectivement avoir des pertes de paquets c'est pas terrible.

Reply

Marsh Posté le 10-05-2013 à 19:41:42    

J'irai voir dans un 1er temps sur le 6850 car les autres switchs n'ont semble t il pas de problème d'après tes dires.

Reply

Marsh Posté le 10-05-2013 à 19:42:11    

je vais regarder. Jusqu'à maintenant je n'ai regarder que sur les ports d'interconnexion.

Reply

Marsh Posté le 10-05-2013 à 21:29:57    

Pour l'instant, je n'ai vu que 4 ports autre que ce d'interconnexions, qui avait des erreurs. Et il y en avait maxi 2 sur le port.
 
je vais réinitialiser les compteurs pour voir si ce ne sont pas de vieilles erreurs.

Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed