Perte de paquet ?

Perte de paquet ? - Télécom - Systèmes & Réseaux Pro

Marsh Posté le 09-07-2012 à 16:56:47    

Bonjour à tous,  
 
Après plusieurs heures (répartis sur plusieurs jours) de recherches diversent, je me décide à créer un fil pour vous exposer un problème auquel je ne trouve aucune solution.
 
Voici sans plus attendre un état des lieux de la situation:
Comme beaucoup le savent un ptit schéma est bien mieux qu'un pavé de 30 lignes
 
http://img15.hostingpics.net/pics/113598probleme.jpg
 
Voici quelque info sur mes Box 1(155) et 2(157):
 
proute@oups:~$ cat /etc/lsb-release  
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=9.04
DISTRIB_CODENAME=jaunty
DISTRIB_DESCRIPTION="Ubuntu 9.04"
proute@oups:~$ uname -a
Linux ilitoo 2.6.28-11-generic #42-Ubuntu SMP Fri Apr 17 01:57:59 UTC 2009 i686 GNU/Linux
 
Mon problème comme indiqué dans le titre du topic, de la perte de paquet ! Mes box 1(155) et 2(157) ont des pertes de paquets de l'ordre de 50-80%. Autant vous dire que c'est invivable pour les utilisateurs connectés derrière. Voici un petit screen d'un mtr effectué au même instant sur les 2 box (je fait le mtr sur 8.8.8.8 dns de google):
 
Box 1(155)
http://img15.hostingpics.net/pics/776572Capturemtrbox155.png
 
Box 2(157)
http://img15.hostingpics.net/pics/378163Capturemtrbox157.png
 
Point à préciser:
Cette topologie est répété 6 fois, c'est à dire 6 modem avec 2 box derrière chaque modem et les utilisateurs derrière les box. Toutes les lignes sont des Nérim ADSL 20Mbps. Toutes les box sont parfaitement identiques au niveau hardware et software. Le câblage du réseau en interne n'est à priori pas en cause car il n'y a pas de perte jusqu'au modem. En heures de pointes il y a jusqu'à 10-18 utilisateurs connectés sur chaque box. J'ai vérifié la charge CPU et mémoire sur une journée et la box est en dessous des 10% d'utilisation même en heures de pointes.
 
Point étrange:
Sur certaine "grappe" de "modem->2box" aucune perte de paquet et sur d'autre de la perte de paquet à longueur de journée. J'ai donc entrepris de monitoré mes jolies box histoire de voir ce qu'il est, cacti c'est bien ! Je vois donc : CPU OK, MEM OK, Bande passante OK. (Après test: bande passante de 2 Mo/sec environ. On peut voir avec cacti que à peine 1Mo/sec est utilisé en heure de pointe)
 
Petit graph Cacti:
 
Box 1(155)
CPU/MEM

http://img15.hostingpics.net/pics/463413CaptureCactiCPUMEM155.png
Bande passante
http://img15.hostingpics.net/pics/975500CaptureCactirseau155.png
 
Box 2(157)
CPU/MEM

http://img15.hostingpics.net/pics/257980CaptureCactiCPUMEM157.png
(la charge MEM que l'on peut voir est un test sur un grosse copie de fichier, pas de swap donc tout va bien)
Bande passante
http://img15.hostingpics.net/pics/429439CaptureCactireseau157.png
 
Les trous dans les graph vers 5h du matin sont normaux, les box redémarre à 5h15 tout les jours.
 
Bien entendu je me pose de nombreuses questions.
Cela viendrait-il d'un défaut matériel de la box ? Peu de chance étant donné qu'il n'y a pas de perte jusqu'au modem.
Cela viendrait-il de la ligne internet ? J'ai appelé le sav Nérim pour leur signaler et le technicien m'affirme que ma ligne est parfaitement stable. Après harcelement de Nérim une vérification a était faite par FT, ligne impeccable selon eux.
Cela viendrait-il du réseau (câble/switch) ? Peut de chance aussi mes paquets arrive sans problème jusqu'au modem (voir mtr).
 
Liste de truc à checker:
J'ai également vérifié MTU et TTL rien à signalé.
Le resolv.conf est OK.
 
Voila je m'en remet à la sagesse général pour m'éclairer car je suis à court d'idée et de solution.
Si vous voulez d'autres infos n'hésitez pas à me solliciter, j'ai accès à mes box à distance en SSH H24.
 
LaBanane.
 
PS:: Pour les grands admin, je me demandai quelle sous catégorie était le mieux "Télécom" ou "Réseau" ? Etant donné que c'est un problème de perte de paquet sur une ligne internet j'ai mis dans Télécom mais libre à vous de le changer si vous trouvez sa plus cohérent.


Message édité par LaBanana le 09-07-2012 à 17:08:36
Reply

Marsh Posté le 09-07-2012 à 16:56:47   

Reply

Marsh Posté le 09-07-2012 à 17:02:25    

Il y a 0.0% de perte entre la box et le routeur, ce qui est plutôt bon signe. As-tu essayé de modifier le MTU sur tes boxes ? (tu parles de MTR et TTL, mais je n'ai rien vu concernant le MTU).  
 
as-tu éventuellement le moyen de brancher un portable en direct sur le switch pour voir si tu as le même problème ? (je présume que oui si les deux boxes ont les mêmes symptômes).
 
peux-tu essayer d'envoyer un ping en augmentant la taille pour voir jusqu'où tu peux aller (pars de 1300 comme taille initiale), et comparer entre une box sans perte et une box avec pertes.  

Reply

Marsh Posté le 09-07-2012 à 17:13:55    

Bonjour pkc,
 
Je me suis effectivement trompé, c'est pas MTR mais MTU je viens de rectifier sur le poste.
 
Voici un ifconfig:
 
proute@oups:~$ ifconfig
eth0      Link encap:Ethernet  HWaddr 44:4d:50:02:f3:58  
          inet adr:192.168.1.157  Bcast:192.168.1.255  Masque:255.255.255.0
          adr inet6: fe80::464d:50ff:fe02:f358/64 Scope:Lien
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          Packets reçus:2289954 erreurs:139 :165 overruns:139 frame:0
          TX packets:1441200 errors:0 dropped:0 overruns:15 carrier:0
          collisions:0 lg file transmission:1000  
          Octets reçus:2502793769 (2.5 GB) Octets transmis:183089962 (183.0 MB)
          Interruption:16 Adresse de base:0xe800  
 
eth1      Link encap:Ethernet  HWaddr 44:40:50:31:32:76  
          adr inet6: fe80::4640:50ff:fe31:3276/64 Scope:Lien
          UP BROADCAST RUNNING  MTU:1500  Metric:1
          Packets reçus:1433720 erreurs:334 :344 overruns:334 frame:0
          TX packets:2101207 errors:0 dropped:0 overruns:15 carrier:0
          collisions:0 lg file transmission:1000  
          Octets reçus:184529864 (184.5 MB) Octets transmis:2347280196 (2.3 GB)
          Interruption:19 Adresse de base:0xe400  
 
lo        Link encap:Boucle locale  
          inet adr:127.0.0.1  Masque:255.0.0.0
          adr inet6: ::1/128 Scope:Hôte
          UP LOOPBACK RUNNING  MTU:16436  Metric:1
          Packets reçus:4577 erreurs:0 :0 overruns:0 frame:0
          TX packets:4577 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 lg file transmission:0  
          Octets reçus:355573 (355.5 KB) Octets transmis:355573 (355.5 KB)
 
tun0      Link encap:UNSPEC  HWaddr 00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00  
          inet adr:192.168.182.1  P-t-P:192.168.182.1  Masque:255.255.255.0
          UP POINTOPOINT RUNNING  MTU:1500  Metric:1
          Packets reçus:1413672 erreurs:0 :0 overruns:0 frame:0
          TX packets:2201825 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 lg file transmission:500  
          Octets reçus:159548257 (159.5 MB) Octets transmis:2465057246 (2.4 GB)

 
On peut voir mes deux eth1 et 0, plus mon tun0 qui est l'interface créée par chillispot.
MTU de 1500.
 
Je vais voir pour tester avec des tailles différentes.
 
EDIT:: Je me relis et je vois qu'il manque des infos.
 
Eth0 est l'interface connecté au modem.
Eth1 est l'interface dont chilispot prend le contrôle.
Tun0 est l'interface créée par chilispot et qui vient par dessus Eth1.
 
Je vais donc essayer de passé Eth0 avec un MTU de 1300 et voir ce qu'il ce passe.
 
LaBanane


Message édité par LaBanana le 09-07-2012 à 17:22:05
Reply

Marsh Posté le 09-07-2012 à 17:14:04    

+1 pkc  
(et moi j'aurais mis dans réseau :) )

Reply

Marsh Posté le 09-07-2012 à 17:46:54    

Rebonjour,
 
J'avance un peu  :jap:.
 
Je viens de me rendre compte que quand je lance un mtr 8.8.8.8 sur mes 2 box en même temps la perte de paquet s'envole.
Quand je fait un mtr sur 8.8.8.8 sur une seul box les pertes sont plus faible mais non négligeable.
 
J'ai mit un MTU de 1300 sur mes 2 eth0 sur chaque box.
 
Ptit screen pour illustrer:
En même temps les 2 ci-dessous:
Capture d'un mtr sur la box 1(155) avec mtu 1300 sur google.fr
http://img15.hostingpics.net/pics/952934Capturemtr155mtu1300pinggooglefr.png
 
Capture d'un mtr sur la box 2(157) avec mtu 1300 sur 8.8.8.8
http://img15.hostingpics.net/pics/707686Capturemtr157mtu1300ping8888.png
 
En même temps les 2 ci-dessous:
Capture d'un mtr sur la box 1(155) avec mtu 1300 sur 8.8.8.8
http://img15.hostingpics.net/pics/412649Capturemtr155mtu1300.png
 
Capture d'un mtr sur la box 2(157) avec mtu 1300 sur 8.8.8.8
http://img15.hostingpics.net/pics/909450Capturemtr157mtu1300.png
 
Le fait que mon modem reçoive une double demande de ping pour 8.8.8.8 semble faire monter la perte de paquet, je trouve sa bizarre les dns de google devrai encaissé plus. Et de toute façon j'ai de la perte de paquet sur tout les routeurs entre mon modem et ma cible !
Dans tout les cas le fait de baissé le MTU semble effectivement diminuer la perte de paquet. Je ne suis pas spécialiste mais comment la taille maximum des paquets peut elle influer autant sur la perte de paquet ?
 
LaBanane.


Message édité par LaBanana le 09-07-2012 à 18:05:55
Reply

Marsh Posté le 10-07-2012 à 10:31:17    

Ca dépend de la fragmentation réalisée par le modem. (pour simplifier).
 
Peux-tu essayer d'augmenter ton MTU progressivement pour voir ce que ça améliore ?

Reply

Marsh Posté le 10-07-2012 à 13:25:14    

J'ai un déplacement à faire cette aprèm, je regarderai sa demain matin.
 
Un palier d'augmentation pour le MTU ? 50 par 50 ? 100 par 100 ?
 
Merci pour ton aide pkc.
 
 
LaBanane.

Reply

Marsh Posté le 10-07-2012 à 16:13:49    

c'est du 4 par 4 le mtu.  
à tester avec un ping en augmentant la taille.  
lorsque tu n'as plus de réponse c'est que tu a dépassé la limite.

Reply

Marsh Posté le 10-07-2012 à 17:36:05    

Hop fin d'intervention plutôt que prévu ! Je m'occupe de mon affaire =)
 
Alors ya un truc que je ne comprends pas ...
 
Quel intérêt de faire varier le MTU à partir de 1300 de 4 en 4 ? Alors que mes pings avec un MTU de 1500 passent (avec un % de perte certes mais ils passent).
En sachant qu'avec un MTU de 1300 mon % de perte est légèrement moins important.
 
De plus il ne faut pas oublier que j'accède à mes box en SSH à distance, si d'un coup le ping passe plus car le MTU est trop élevé ma connexion SSH se coupera surement ? Ce qui est potentiellement problématique car je n'aurai plus accès à la box.
 
Je te serai reconnaissant de m'en dire plus sur cette démarche et comment sa peut m'aider à identifier mon problème concernant la perte de paquet.
 
LaBanane.


Message édité par LaBanana le 10-07-2012 à 17:36:35
Reply

Marsh Posté le 10-07-2012 à 22:38:31    


Ca ressemble quand même pas mal à un problème sur ta ligne ADS-L (ou sur l'accès à la ligne). Tu n'as pas moyen de voir les stats sur l'interface ADS-L de ton modem? (erreurs CRC, FEC, HEC, etc ....) ?

Reply

Marsh Posté le 10-07-2012 à 22:38:31   

Reply

Marsh Posté le 11-07-2012 à 10:26:14    

J'ai effectivement pensé à un problème sur la ligne, j'ai appelé Nérim plusieurs fois et a force de les harcelés ils ont lancés des testes sur la ligne.
Il m'assure que la ligne n'a aucun problème.
 
Quelque petite commande en telnet sur mon modem:
> adsl status
  --------------------------- ATU-R Info (hw: annex A, f/w: annex A) -----------
   DSL Modulation          : ADSL2+(G.992.5)    
   State                   : SHOWTIME
   DS Actual Rate          : 21633303 bps   US Actual Rate       :   927927 bps
   DS Attainable Rate      : 20304000 bps   US Attainable Rate   :   927000 bps
   DS Path Mode            :  Interleave    US Path Mode         :  Interleave  
   DS Interleave Depth     :       64       US Interleave Depth  :        8  
   NE Current Attenuation  :       19 dB    Cur SNR Margin       :        8  dB
   DS actual PSD           :    16. 8 dB    US actual PSD        :    12. 2   dB
   ADSL Firmware Version   : 321311_A  
  -------------------------------- ATU-C Info ---------------------------------
   Far Current Attenuation :        6 dB    Far SNR Margin       :       10  dB
   CO ITU Version[0]       : 00004244       CO ITU Version[1]    : 0000434d
   DSLAM CHIPSET VENDOR    : < BDCM >
 
> show status
System Uptime:1:22:46
LAN Status
Primary DNS:195.5.209.150     Secondary DNS:194.79.128.150
IP Address:192.168.1.1        Tx Rate:298868    Rx Rate:265082
 
WAN 1 Status:Connected
Enable:Yes       Line:ADSL        Name:
Mode:PPPoE       Up Time:1:21:16     IP:62.212.97.217  GW IP:178.132.16.248
TX Packets:263427     TX Rate:607 RX Packets:604020     RX Rate:1348
 
WAN 2 Status:Disconnected
Enable:Yes       Line:ADSL        Name:
Mode:---         Up Time:0:00:00     IP:---            GW IP:---
TX Packets:0          TX Rate:0   RX Packets:0          RX Rate:0  
 
ADSL Information:      ADSL Firmware Version:321311_A
Mode:ADSL2+(G.992.5)   State:SHOWTIME   TX Block:661800 RX Block:2668543
Corrected Blocks:0     Uncorrected Blocks:0    
UP Speed:927927     Down Speed:21633303   SNR Margin:8   Loop Att.:19
 
On peut voir qu'elle synchronise à 21Mbps !
Je n'ai pas trouvé (erreurs CRC, FEC, HEC, etc ....) en telnet, je l'ai vue sur l'interface web mais pas en telnet.
 
LaBanane


Message édité par LaBanana le 11-07-2012 à 10:35:40
Reply

Marsh Posté le 11-07-2012 à 14:55:37    


et sur l'interface web, ça donne quoi? Sinon, ce serait étonnant qu'il n'y ait pas en ligne de commande la moyen de voir ces stats ....

Reply

Marsh Posté le 11-07-2012 à 16:02:23    

Je n'ai pas accès à l'interface web à distance hélas ! Mais je risque d'y allé sous peu j'ai une alim qui semble HS.
 
EDIT::
Je suis allé changer une alim et j'en est profité pour allé jeter un oeil sur l'interface web:
 
Voici le Dial-out triggered packet header
 
http://img11.hostingpics.net/pics/365677hex.jpg
 
Il semblerai que ce soit le "hex" que tu me demandais, par contre je ne sais pas l’interpréter.


Message édité par LaBanana le 12-07-2012 à 17:42:08
Reply

Marsh Posté le 13-07-2012 à 14:17:36    

up

Reply

Marsh Posté le 14-07-2012 à 19:29:45    


Aie ... non, le HEX, c'est  pour indiquer que le format de codage est en hexadecimal.
Ce dont je te parle, ce sont les statistiques CRC, FEC et HEC qui t'indiquent le taux d'erreur sur ta box (je peux les voir sur ma Freebox).  
 
Ci-dessous qqes explications trouvées sur Internet:
 
Fec: Foward Error Correction, méthode de détection d'erreur en transmission, la valeur indiquée donne le nombre de paquets perdus en transmission (commun à l'interleave et au fastpath).
Augmente souvent par la mauvaise qualité de raccords terminaux, par exemple rallonge téléphonique, presence du condensateur dans la prise téléphonique.
- Hec :Header Error Checksum, méthode de détection d'erreur d'entête IP, la valeur indiquée donne le nombre de paquets perdus dans l'entête IP (commun à l'interleave et au fastpath).
- Crc:  Cyclic Redundancy Check, méthode de détection d'erreur redondante des paquets par interpolation polynomiale de degré 16 (commun à l'interleave et au fastpath).
 
Fec, Hec et Crc comptent 3 types d'erreurs différents. Pour évaluer la qualité de la liaison, une bonne liaison doit avoir un rapport inférieur à 1/1000.
 
En revanche, j'ai lancé des pings vers ce que j'imagine est l'@IP publique de ta box (194.79.128.150, qui port le doux nom de Loana :)) : je n'ai aucune perte. Ce qui laisse à penser que ton pb est quand même bien local. Tu n'as pas moyen de faire des tests depuis le modem/routeur directement?
 
Sinon, as-tu bien vérifié toute la configuration réseau sur ton segment entre tes box et ton modem/routeur ? (@IP, duplex, etc).
Sur le switch, tu peux vérifier: les adresses MAC sur les ports où sont connectés tes équipements, les stats d'erreurs de tes ports, les logs sur ton switch)
 
 

Reply

Marsh Posté le 15-07-2012 à 05:46:51    

Je pense aussi que tu as déja un probleme en local car dans la capture de ton dernier mtr on voit que tu as 72% de perte, et la l'état de ta ligne adsl n'y est pour rien. Je pencherai donc pour un probléme au niveau du routeur. Si tu pouvais faire un test croisé...
 
CDLT

Reply

Marsh Posté le 17-07-2012 à 09:38:49    

Bonjour et merci pour vos réponse !
 
194.79.128.150 n'est pas l'IP de mon modem, il s'agit du DNS de Nérim =)
 
Pour ce qui est des problèmes en local j'en doute un peu, sur mes MTRs on peut clairement voir que j'ai 0% de perte jusqu’à "my routeur" qui représente mon Modem.
Le MTR est effectué sur une machine derrière le modem.
J'ai effectué des MTRs en local, de box à box et de box à modem. Aucune perte de paquet.
 
Je vais voir si je trouve les statistiques CRC, FEC et HEC. Je les aient peut être loupé.
 
France Télécom à effectué un test "mirabel", et ma dit que la ligne était bonne.
 
Un collègue ma dit de chercher au niveau des MTU comme pkc. Je vais continuer les testes la dessus.
 
LaBanane.

Reply

Marsh Posté le 17-07-2012 à 15:02:31    

J'ai refouiner à fond pour trouver les statistiques CRC, FEC et HEC mais rien :(
 
En revanche j'ai trouvé sa:
> show session
% Maximum Session Number: 5000
% Maximum Session Usage: 4850
% Current Session Usage: 499
 
Cela montre apparemment le nb de session active, 499 je trouve sa très élevé.
 
Sinon j'ai essayé de jouer sur le MTU d'une box et rien à faire j'ai toujours mes pertes de paquet ... :'(
 
LaBanane

Reply

Marsh Posté le 19-07-2012 à 04:51:54    

As-tu la possibilité d'effectuer un test croisé avec un autre modem routeur car c'est peut etre tout simplement ce dernier qui tape dans les choux...
 
CDLT


Message édité par arnaud1206 le 19-07-2012 à 04:55:59
Reply

Marsh Posté le 20-07-2012 à 09:25:27    

Inter-changer deux modem, pourquoi pas.
 
Sa va être un peu chiant à faire mais je garde l'idée pour la prochaine fois que je dois y aller.
Même peut être prévoir un autre modem pour faire des testes ...
 
Je vais pas pouvoir y aller avant un moment. Mais si d'autre personne ont des idées n'hésité pas à poster !
 
LaBanane

Reply

Marsh Posté le 20-07-2012 à 12:44:32    

Le nombre de sessions est normal si ce sont comme j'imagine des sessions TCP (une page web en génère plusieurs .. tape "netstat" en ligne de commande sur ton PC pour t'en rendre compte.
 
Sinon un test bête qui me semble ne pas avoir été fait: tester avec un PC branché directement sur le switch interconnectant ton modem et tes box. En fait, 2 tests à faire:
- 1 test avec le PC branché dessus et les box débranchées
Au cas où cela fonctionne:
- 1 nouveau test avec 1 box branchée
- 1 troisième test avec les 2 box branchées

Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed