Défaut de fiabilité avec des HD-USB : Corruption non détectée

Défaut de fiabilité avec des HD-USB : Corruption non détectée - Disque dur - Hardware

Marsh Posté le 25-09-2008 à 11:21:18    

J'ai observé le problème suivant de façon quasi systématique :  
 
Lors d'une copie entre des disques USB, il y a apparition d'erreurs NON DÉTECTÉES(!!!) par le système, avec une fréquence de l'ordre de 2 à 3 erreurs par 500 GB. Ces erreurs semblent manifestement être spécifiques à l'USB, car il s'agit d'insertion ou de deletion de bits dans des données sérielles, et non d'un simple flip.  
 
Donc en clair : Si on fait une copie intégrale d'un HD de 500GB plein vers un autre, par exemple... on trouve avec Windiff(par exemple) les fichiers corrompus (Attention l'opération peut prendre plusieurs jours ! - et certaines erreurs peuvent apparaitre non lors de la copie, mais lors de la comparaison) et ensuite, on les examine avec la commande DOS "fc /b [Fichier1] [Fichier2] | more". On trouve des trains d'erreurs qui commencent de façon aléatoire, ressemblent à des décalages et finissent aux limites de blocs.
 
J'ai fait cette expérience avec un portable Médion tournant sous Windows XP-SP2 media Center edition, des HD (principalement WD) et plusieurs HUB USB dans la chaine (les HUBs pourraient justifier l'apparition d'erreurs, mais pas le fait qu'elles ne soient pas détectées). Si d'autres personnes pouvaient faire le même test, ça m'intéresserait de savoir à quel point le problème est général ou si c'est spécifique à certaines conditions Hard ou Soft (exemple, le hardware détecte l'erreur mais le driver n'en tient pas compte - ou bien autre chose car la machine est très lente, malgré que je ne detecte aucun malware (ni avec Nod32, ni avec spybot))
 
Si ce problème est général, il est extrêmement grave, car son apparition lors de la copie d'un fichier n'est qu'un moindre mal, par rapport à son apparition lors d'une écriture dans les tables système, ou pendant un checkdisk ou une défragmentation


Message édité par ze_Camion le 25-09-2008 à 11:22:20
Reply

Marsh Posté le 25-09-2008 à 11:21:18   

Reply

Marsh Posté le 27-09-2008 à 13:04:05    

Salut,
 
Les disque durs quand ils sont mis dans les boitiers USB, ne voient pas leur fonction "S.M.A.R.T" détéctées en tout cas. Une fois placé dans un PC, le S.M.A.R.T peut fonctionner en revanche.
Ce qui veut dire qu'un disque dur qui se rend compte qu'il ne va pas bien, et qui en temps normal, alerte l'utilisateur avant même de booter windows, ne va rien vous dire derrière un port USB ^^'
 
Avec mon disque dur externe 2,5" auto alimenté en tout cas, je n'avait pas de problèmes de copies, même après des clusters defectueux : les fichiers devenaient soit illisibles, soit ils étaient bien copiés : il s'agissait de quelques DivX que j'ai regardé en entier pour m'assurer qu'ils n'avaient pas de morceaux corrompus.
Après quelques ré écritures et formatages bas niveau, le disque dur a quand même retrouvé sa santé pendant 1 an et demi. Je m'en suis servi pour transferer des tas de films sur lesquels je n'ai jamais eu de problèmes, jusqu'a ce que le disque s'arrete subitement de fonctionner sans prevenir lors d'une copie (de films toujours ^^').
Et la, j'ai tout essayé, formatages bas niveau, essais dans plein d'ordis different, début de formatage bas niveau échouant à 0%... Jusqu'a me vienne l'idée d'utiliser mon tournevis, et d'en faire un joli puzzle démonté :p

Reply

Marsh Posté le 27-09-2008 à 14:33:22    

de toute façon aucine copie n'est jamais parfaite...
les algorithmes de correction d'erreurs sont là pour çà :D
il existe un aspect fiabilité lié au système de fichiers aussi. Autrement dit : FAT n'assure pas du tout de ce côté-là.
Et effectivement les défauts de surface des disques apparaissent avec le temps. Il faut utiliser un logiciel type spinrite en level 4 pour remettre le disque à neuf.

Reply

Marsh Posté le 27-09-2008 à 20:57:55    

Nanananan... ça c'est trop facile.  
 
Il s'agit de disques neufs, pour commencer, et ensuite, effectivement, les algorithmes de détection d'erreur sont là pour détecter le problème... Or ici, rien, aucune détection, aucune correction. l'erreur est totalement silencieuse et n'a rien à voir avec un problème de surface qui aurait été détecté lors du formatage, ni avec le choix du format. l'erreur apparait de la même façon avec du FAT32 ou avec du NTFS.
 
Comme je l'ai mentionné, il ne s'agit pas d'une erreur de changement de valeur d'un bit, ni d'une erreur de support magnétique qui aurait simplement rendu le fichier illisible. Il s'agit bien d'insertions ou de deletion de bits, qui selon moi sont spécifiquement dues à un manque de détection dans le transport USB. D'ailleurs, j'ai oublié de le mentionner dans le post initial, mais quand l'erreur apparait, il suffit de refaire la copie pour résoudre le problème. Des erreurs liées à la qualité de la surface ne se résoudraient pas si facilement en lecture. - Et comme je l'ai également fait remarquer, j'ai également observé l'erreur lors d'une comparaison (l'erreur n'apparaissant plus lors d'une seconde comparaison).  
 
De toute façon, une erreur de l'ordre de 5-6 erreurs non détectées par TB de données transférée n'est en aucun cas acceptable. ça le serait sur un support physique où on pourrait marquer des secteurs comme défectueux, ou mode datagramme qui n'est pas garanti, mais pas sur un support comme des disques externes.

Reply

Marsh Posté le 27-09-2008 à 22:03:18    

Je pense que ze_Camion à tout à fait raison, d'autant qu'un 500 Go est quasiment forcement en NTFS, et que les données ne devraient pas être zigouillées un peu plus à chaque fois qu'on les copie.
Sur Internet il existe les checksum md5 pour verifier si le fichier n'a pas été corrompu, (les lignes telephoniques sont longues et remplies de parasites, les chemins du WEB font des milliers de kilometres et passent par plusieurs 10aines de routeurs...); les disques durs sont conçus pour être suffisemment perfectionnés pour ne laisser place à aucun doute entre un "1" et un "0" sur le disque et/ou sur une nappe de quelques centimetres.
 
J'expliquais toutefois qu'avec mon disque dur externe USB et qu'avec des centaines de copies, je n'ai pas ce problème de corruption : le problème ne doit exister que sur certains modèles de boitiers externes. Je verifierais tout de même avec windiff (je ne conaissait pas) si je retrouve le problème sur mon nouveau DD externe, l'experience est interessante dans tous les cas.


Message édité par Serial-killeD le 27-09-2008 à 22:07:29
Reply

Marsh Posté le 27-09-2008 à 23:35:23    

Attention, ce n'est pas parce que tu n'as pas détecté de corruption qu'elle n'a pas eu lieu. Pour rappel, les erreurs restent malgré tout rares, et puis, avec un Divx, c'est que c'est pas parce qu'on ne voit pas d'erreur qu'il n'y en a pas eu. ça ne rends par forcément le film invisionnable. Selon l'endroit où l'erreur à eu lieu, elle peut avoir juste abîmé quelques frames sans qu'on s'en soit vraiment rendu compte. C'est pour ça qu'il faut impérativement faire une comparaison binaire pour le voir.
 
Windiff est un outil fourni par microsoft avec leurs pack d'outils pour Windows. C'est un équivalent windows de l'outil diff, sous unix. Il est orienté fichier texte, mais il s'en sort très bien pour détecter les corruptions. Naturellement, tout outil de comparaison capable de comparer des arborescences entières convient.
 
Personellement, je fais systématiquement des contrôle de corruption après chaque grosse copie, et résultat ça fait plus que doubler mes temps de copie... et ça fait bien ch***. ;-)

Reply

Marsh Posté le 28-09-2008 à 01:12:05    

salut; ze_camion.
 
En fait, tu parles de test à partir d'un seul pc ? si, oui, ce n'est pas assez pour conclure sur la fiabilité ou la malfaçon des contrôleurs usb/sata/ide.
 
est-ce que tu as essayé de monter au maximum le pci latency de tous les bus par lesquels passent les données (ports usb, pci, ide, ...) ?  
 
en usb 1.1 tu observes le même problème ?
 
Fais tes tests avec des (gros) fichiers archives genre zip, rar, etc. cela devrait te faciliter le check des erreurs (lancer le check sur le hd usb depuis winrar : activer le test en click droit dans les options de winrar, sélectionner tous les fichiers archives, click droit, tester)
 
J'ai déjà eu ce genre de phénomène sur une Chaintech nf2 7NJS, c'était lié à la mobo et ses ports sata promise. Les données transitant depuis ou vers le sata via une carte réseau étaient parfois corrompues sans avertissement, cela se produisait uniquement avec les cartes ethernet gigabit (aucun problème avec les cartes ethernet 100). Je n'ai jamais résolu ce problème, je pouvais juste l'atténuer en montant le pci latency.
 
Depuis, je suis très très prudent en ce qui concerne le déplacement et la conservation de mes données.
 
PS :
 

Citation :

et plusieurs HUB USB dans la chaine

je ne vois pas trop l'intérêt de rajouter des éléments dans un test, le but étant d'isoler les phénomènes, autant commencer les tests avec le hd branché directement sur le port de la mobo.
 
j'ai déjà vu des incompatibilités entre des hub de marque différentes, je sais que j'ai un hub dlink qui foire le débit de ma carte son usb 2.0 si je le mélange (parfois dans un certain ordre ça passe) à mes autres hub noname à puce nec.

Message cité 1 fois
Message édité par c_planet le 28-09-2008 à 01:25:17
Reply

Marsh Posté le 28-09-2008 à 02:17:23    

c_planet a écrit :

salut; ze_camion.


Yo !  ;)  

c_planet a écrit :

En fait, tu parles de test à partir d'un seul pc ?
si, oui, ce n'est pas assez pour conclure sur la fiabilité ou la malfaçon des contrôleurs usb/sata/ide.


Tout à fait. c'est pour ça que dans mon post initial, je demande à qui veut de faire les mêmes tests pour voir si c'est un problème local ou général

c_planet a écrit :

est-ce que tu as essayé de monter au maximum le pci latency de tous les bus par lesquels passent les données (ports usb, pci, ide, ...) ?


Non, je n'ai rien touché de tout ça. Je ne sais même pas si j'y accès dans le setup de mon portable. De toute façon, pour moi, le problème, ce n'est pas l'apparition des erreurs, mais le fait qu'elles ne soient pas détectées.

c_planet a écrit :

en usb 1.1 tu observes le même problème ?


ça prends déjà plusieurs jours de faire une copie en USB2, alors à mon avis, le test n'est pas très pertinent en USB1 ou 1.1

c_planet a écrit :

Fais tes tests avec des (gros) fichiers archives genre zip, rar, etc. cela devrait te faciliter le check des erreurs (lancer le check sur le hd usb depuis winrar : activer le test en click droit dans les options de winrar, sélectionner tous les fichiers archives, click droit, tester)


C'est pas un test que je fais, c'est une situation réelle : J'ai un paquet de disques USB à réorganiser pour un total de plusieurs TB, et donc j'essaye d'y passer le moins de temps possible, là ça fait déjà plusieurs semaines que je suis occupé dessus. En plus , je ne travaille pas avec des fichiers d'archives, mais avec, pour une bonne partie, des avi de 150 à 350 MB.

c_planet a écrit :

J'ai déjà eu ce genre de phénomène sur une Chaintech nf2 7NJS, c'était lié à la mobo et ses ports sata promise. Les données transitant depuis ou vers le sata via une carte réseau étaient parfois corrompues sans avertissement, cela se produisait uniquement avec les cartes ethernet gigabit (aucun problème avec les cartes ethernet 100). Je n'ai jamais résolu ce problème, je pouvais juste l'atténuer en montant le pci latency.
 
Depuis, je suis très très prudent en ce qui concerne le déplacement et la conservation de mes données.


C'est également parce que j'ai déjà eu des blagues il y a longtemps, que je vérifie souvent mes copies, mais je dois dire, je ne m'attendais pas à trouver ces erreurs.

c_planet a écrit :

PS :
 

Citation :

et plusieurs HUB USB dans la chaine

je ne vois pas trop l'intérêt de rajouter des éléments dans un test, le but étant d'isoler les phénomènes, autant commencer les tests avec le hd branché directement sur le port de la mobo.
 
j'ai déjà vu des incompatibilités entre des hub de marque différentes, je sais que j'ai un hub dlink qui foire le débit de ma carte son usb 2.0 si je le mélange (parfois dans un certain ordre ça passe) à mes autres hub noname à puce nec.


Comme je le mentionne plus haut, ce n'est pas une situation de test, la raison d'être des multiples Hubs USB, c'est que pour réorganiser des HD, j'essaye d'en voir un maximum à la fois, et il est à peu près impossible de connecter simultanément une quinzaines de HDs sur un portable, sans chainer des Hubs.

Reply

Marsh Posté le 28-09-2008 à 03:18:11    

ok.
 
pour augmenter le pci latency pas besoin d'aller dans le bios il y a un soft qui peut le faire dans windows : http://www.google.be/search?q=pci+ [...] =firefox-a
 

Citation :

De toute façon, pour moi, le problème, ce n'est pas l'apparition des erreurs, mais le fait qu'elles ne soient pas détectées.
c_planet a écrit :


 
mmh, je comprends ... mais, concrètement, si t'arrives - via un réglage hard ou soft - à ne plus avoir ces erreurs ... ça sera réglé.


Message édité par c_planet le 28-09-2008 à 04:33:42
Reply

Marsh Posté le 28-09-2008 à 15:14:54    

Citation :

Et comme je l'ai également fait remarquer, j'ai également observé l'erreur lors d'une comparaison (l'erreur n'apparaissant plus lors d'une seconde comparaison).  


 
mais dans ce cas, c'est pas le fichier qui est corrompu, c'est la manière de faire la comparaison qui foire à un moment pour une raison quelconque.
 

Citation :

ça prends déjà plusieurs jours de faire une copie en USB2


 
la copie de 500go en usb2.0 ne devrait pas prendre plus de 5 heures. plus si les fichiers sont petits (dans ce cas utiliser un soft de ghost) mais des jours ça me semble bizarre.
 

Citation :

J'ai un paquet de disques USB à réorganiser pour un total de plusieurs TB


 
tu dupliques des disques, en fait ? utilises un soft de ghost et demande la copie raw. (normalement c'est superflu mais dans ce cas-ci ça peut rassurer)


Message édité par c_planet le 28-09-2008 à 15:24:41
Reply

Marsh Posté le 28-09-2008 à 15:14:54   

Reply

Marsh Posté le 29-09-2008 à 11:38:53    

ze_Camion a écrit :

Nanananan... ça c'est trop facile.  
 
Il s'agit de disques neufs, pour commencer, et ensuite, effectivement, les algorithmes de détection d'erreur sont là pour détecter le problème... Or ici, rien, aucune détection, aucune correction. l'erreur est totalement silencieuse et n'a rien à voir avec un problème de surface qui aurait été détecté lors du formatage, ni avec le choix du format. l'erreur apparait de la même façon avec du FAT32 ou avec du NTFS.
 
Comme je l'ai mentionné, il ne s'agit pas d'une erreur de changement de valeur d'un bit, ni d'une erreur de support magnétique qui aurait simplement rendu le fichier illisible. Il s'agit bien d'insertions ou de deletion de bits, qui selon moi sont spécifiquement dues à un manque de détection dans le transport USB. D'ailleurs, j'ai oublié de le mentionner dans le post initial, mais quand l'erreur apparait, il suffit de refaire la copie pour résoudre le problème. Des erreurs liées à la qualité de la surface ne se résoudraient pas si facilement en lecture. - Et comme je l'ai également fait remarquer, j'ai également observé l'erreur lors d'une comparaison (l'erreur n'apparaissant plus lors d'une seconde comparaison).  
 
De toute façon, une erreur de l'ordre de 5-6 erreurs non détectées par TB de données transférée n'est en aucun cas acceptable. ça le serait sur un support physique où on pourrait marquer des secteurs comme défectueux, ou mode datagramme qui n'est pas garanti, mais pas sur un support comme des disques externes.


 
incrimine le chip usb/ide de ton disque externe alors, ou celui de la CM. Essayer avec le même disque sur un autre convertisseur usb/ide. Essayer sur une autre CM. essayer avec une carte usb2 munie d'un vrai bon chip.
le mieux reste encore de connecter le disque en direct.

Reply

Marsh Posté le 29-09-2008 à 18:28:16    

Je vais lancer le test plein de fois sur mon petit 40 Go externe 2,5", au bout d'une dizaine de fois je verrais si je trouve déja des erreurs. Si je trouve rien, je ré essaye encore dix fois, et si toujours rien, j'abandonne. Je vous tiens au courant pour savoir si ça le fait aussi avec mon materiel donc (je commence ce soir et je pense finir demain si je le ré écrit 20 fois :p )


Message édité par Serial-killeD le 29-09-2008 à 18:31:39
Reply

Marsh Posté le 29-09-2008 à 19:14:12    

en fait, je ne sais pas si ces hd sont à toi, mais perso, je revends tous les boitiers pour me monter un vrai serveur de fichier/backup/... avec autant de To c'est un vrai bonheur (perso je suis à 9To au total :D)

Reply

Marsh Posté le 29-09-2008 à 22:07:57    

c_planet a écrit :

en fait, je ne sais pas si ces hd sont à toi, mais perso, je revends tous les boitiers pour me monter un vrai serveur de fichier/backup/... avec autant de To c'est un vrai bonheur (perso je suis à 9To au total :D)


 
9 To  :ouch: C'est immense, à nous tous dans la maison on a 160+120+320+320+400+120+250+250+40 = 1 980 Go, je ne pensais pas avoir autant dis donc ^^' enfin si on ajoute les pc portables ça fait +40 +30 +60 = 2 110 Go de disques durs  :ouch: C'est emmense ! ^^'
 
Pour le test du disque dur externe usb, je l'ai rempli et testé déja une fois (mon repertoire DivX fait pile poile la taille du disque dur externe, à 62 Mo près :p ) sans trouver d'erreur, il m'a dit que tous les fichiers etaient identiques avec WinDiff.
Je viens de finir un sdelete pour remettre à plat les bits de toute la surface du disque (en gros un formatage qui ne met que des "0" partout, bien efficace, j'ai tésté, easy recovery ne retrouve plus le moindre fichier après !) et je suis entrain de recopier une deuxième fois le repertoire de 40 Go dans le disque, histoire de relancer le test pour la deuxième fois.
 
Et donc je compte aller au moins jusqu'a dix fois  :ouch: j'ai du boulot ! Mais ça vaut le coup d'être verifié au moins une fois

Reply

Marsh Posté le 30-09-2008 à 01:17:00    

ok.
 
sinon, ça serait bien aussi dans le bios de voir si tu as accès aux options spread spectrum, dans ce cas-ci, il vaudrait mieux les activer.
 
(ps 9To en disques durs, mais tout est au moins dupliqué une fois (trois ou quatre fois pour les doc) donc ça fait à peu près 4To de données)

Reply

Marsh Posté le 01-10-2008 à 18:36:19    

J'en suis à la cinquième fois sans trouver d'erreurs (Windiff me dit "identical, identical, identical, identical, identical, identical, identical, identical..."
C'est long ^^'

Reply

Marsh Posté le 01-10-2008 à 21:24:05    

Tu peux demander à Windiff (menu options) de ne pas te montrer les identical...
C'est vrai que sans les hubs, le taux d'erreurs risque de diminuer...  
ça change rien si c'est pour la question de la détection, mais par contre, ça risque d'être plus dur d'en avoir :-(

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed