[SMART] Vérifier l'état de son HDD pour prévenir des pertes de donner

Vérifier l'état de son HDD pour prévenir des pertes de donner [SMART] - Linux et OS Alternatifs

Marsh Posté le 22-08-2002 à 20:49:34    

Je sais pas pour vous mais moi, el truc qui me ferait le plus chier c'est de perdre des données, si mon pc plantait
l'un des composants sensibles, et donc à vérifier pour ne pas perdre des données, ce sont les disques durs
 
smartsuite permet apparemment de prévenir ces pannes suffisament à l'avance, dans la plupart des cas (je parle pas des pb électrique genre mauvaise alim, surtension ...), des pannes de DD.
 
il donne pas mal d'info, mais le pb, c'est que niveau doc c'est zero !  :o  
pas moyen de capter la moitié des infos qu'il donne
 
j'espère que ce logiciel interesse d'autres personnes pour pouvoir m'expliquer toutes ces jolie infos  :D
 
moi par exemple, parmi les nombreuses infos fournies, j'ai ça pour l'un de mes DD :
 

Vendor Specific SMART Attributes with Thresholds:
Revision Number: 10
Attribute                    Flag     Value Worst Threshold Raw Value
(  1)Raw Read Error Rate     0x000f   073   068   034       45744870
(  3)Spin Up Time            0x0003   070   070   000       0
(  4)Start Stop Count        0x0032   100   100   020       245
(  5)Reallocated Sector Ct   0x0033   100   100   036       0
(  7)Seek Error Rate         0x000f   081   060   030       120093743
(  9)Power On Hours          0x0032   096   096   000       4018
( 10)Spin Retry Count        0x0013   100   100   097       0
( 12)Power Cycle Count       0x0032   100   100   020       254
(194)Temperature             0x0022   043   049   000       43
(195)Hardware ECC Recovered  0x001a   073   066   000       45744870
(197)Current Pending Sector  0x0012   100   100   000       0
(198)Offline Uncorrectable   0x0010   100   100   000       0
(199)UDMA CRC Error Count    0x003e   200   200   000       0
(200)Unknown Attribute       0x0000   100   253   000       0
(202)Unknown Attribute       0x0032   100   253   000       0

 
 
si qq'un capte, une 'tite explication serait pas de refu  :)

Reply

Marsh Posté le 22-08-2002 à 20:49:34   

Reply

Marsh Posté le 22-08-2002 à 21:04:00    

svp, c'est interessant comme prog non ?
facile à installer en plus :

apt-get install smartsuite

:D :ange:


Message édité par djoh le 22-08-2002 à 21:04:16
Reply

Marsh Posté le 22-08-2002 à 21:09:38    

Tiens, voilà la page indiqué par rpmfind :
http://csl.cse.ucsc.edu/smart.shtml


---------------
Celui qui pose une question est idiot 5 minutes. Celui qui n'en pose pas le reste toute sa vie. |  Membre du grand complot pharmaceutico-médico-scientifico-judéo-maçonnique.
Reply

Marsh Posté le 22-08-2002 à 21:20:20    

Mjules a écrit a écrit :

Tiens, voilà la page indiqué par rpmfind :
http://csl.cse.ucsc.edu/smart.shtml




 
 
oui, j'y suis déjà allé, mais y-a rien sur ce site  :heink:

Reply

Marsh Posté le 23-08-2002 à 00:06:44    

je lacherais pas l'affaire  :o
tout le monde s'en fout de ses données !?  :heink:

Reply

Marsh Posté le 23-08-2002 à 00:27:58    

bah j'avoues qu'en fait à prioris, aucune de mes bécannes n'est compatible smart, alors je regarderais ca à temps perdu ;)


---------------
-- NO SLACKERS - violators will be fsck'd & tar'd
Reply

Marsh Posté le 23-08-2002 à 01:06:14    

PinG a écrit a écrit :

bah j'avoues qu'en fait à prioris, aucune de mes bécannes n'est compatible smart, alors je regarderais ca à temps perdu ;)




 
apparemment les DD ça fait longtemps qu'ils sont compatibles
pour les MB, il faut activer l'option dans le bios
dans tous les cas, tu fais :

smartctl -i /dev/hdX

et il te dira si c'est supporté
 
c'est dommage que ça interesse personne
ça a l'air bien puissant mais j'arrive pas à décrypter ce qu'il me sort (à part la temp :o )

Reply

Marsh Posté le 23-08-2002 à 08:54:10    

Djoh > si, si ça m'intéresse ce que tu viens de dire
Et pour moi aussi les données sensibles ça veut dire qqch ...
j'ai installé smartsuite c'est vraiment excellent !
Je sens que ça va me faciliter la vie !
Pour l'interprétation voilà ce que j'ai compris !
 
* Chaque ligne représente une variable monitorée
* 1er élément de la ligne : code avec titre associé
* Flag ? moyen d'accéder à la variable en question ???
* value : Valeur actuelle
* Worst : Plus mauvaise valeur
* Threshold : Seuil (de quoi ?) avant déclenchement d'une alarme ?
* Raw Value: Valeur brute ? Avant interprétation par le soft je pense

Reply

Marsh Posté le 23-08-2002 à 14:08:55    

Grizly a écrit a écrit :

Djoh > si, si ça m'intéresse ce que tu viens de dire
Et pour moi aussi les données sensibles ça veut dire qqch ...
j'ai installé smartsuite c'est vraiment excellent !
Je sens que ça va me faciliter la vie !
Pour l'interprétation voilà ce que j'ai compris !
 
* Chaque ligne représente une variable monitorée
* 1er élément de la ligne : code avec titre associé
* Flag ? moyen d'accéder à la variable en question ???
* value : Valeur actuelle
* Worst : Plus mauvaise valeur
* Threshold : Seuil (de quoi ?) avant déclenchement d'une alarme ?
* Raw Value: Valeur brute ? Avant interprétation par le soft je pense
 




 
 
aaah ! voilà qq'un de bien  :D
donc ça j'avais déjà compris  :D
et treshold je pense que c'est le seuil en dessous duquel ça ne descend pas
ce que je comprends pas :
* la raw value : bizarre si ça sert à rien ... enfin je voudrais connaitre son utilité mais vu la gueule de la doc on est pas sortie  :o
* la signification de chaque ligne
* pk mes valeur sont toujours au nivo worst (c'est inquiétant :heink: ... t'as ça ?)
* pk j'ai des CRC error :sweat:

Reply

Marsh Posté le 23-08-2002 à 14:11:01    

bon j'ai capté que worst était la plus mauvaise valeur atteinte et non la plus mauvaise valeur atteignable
mais pk dans ma premiere ligne, le worst est plus faible que la valeur actuelle ? :??:

Reply

Marsh Posté le 23-08-2002 à 14:11:01   

Reply

Marsh Posté le 23-08-2002 à 14:15:48    

je viens de découvrir autre chose, j'ai l'impression : value c'est juste une valeur abstraite donné par le prog lui même
et raw value, c'est la valeur donnée dans une unité de mesure lisible par les hommes (par ex j'ai une temp de 141 en value là, alors que en raw j'ai 39)
 
 
y-a d l'ECC sinon dans les DD ?
pq j'ai un dur qui a l'air d'avoir des erreurs et apparemment il a recup les bonnes valeur via ECC  :??:  
enfin c'est inquiétant les valeurs, et pis là la temp dans value, est bien à 39 (valeur lisible par l'homme ... comprends pas là  :o )
 

Vendor Specific SMART Attributes with Thresholds:
Revision Number: 10
Attribute                    Flag     Value Worst Threshold Raw Value
(  1)Raw Read Error Rate     0x000f   072   068   034       116761569
(  3)Spin Up Time            0x0003   070   070   000       0
(  4)Start Stop Count        0x0032   100   100   020       245
(  5)Reallocated Sector Ct   0x0033   100   100   036       0
(  7)Seek Error Rate         0x000f   081   060   030       120311650
(  9)Power On Hours          0x0032   096   096   000       4027
( 10)Spin Retry Count        0x0013   100   100   097       0
( 12)Power Cycle Count       0x0032   100   100   020       257
(194)Temperature             0x0022   039   049   000       39
(195)Hardware ECC Recovered  0x001a   072   066   000       116761569
(197)Current Pending Sector  0x0012   100   100   000       0
(198)Offline Uncorrectable   0x0010   100   100   000       0
(199)UDMA CRC Error Count    0x003e   200   200   000       0
(200)Unknown Attribute       0x0000   100   253   000       0
(202)Unknown Attribute       0x0032   100   253   000       0


Message édité par djoh le 23-08-2002 à 14:19:10
Reply

Marsh Posté le 23-08-2002 à 14:32:15    

et ça continu à augmenter ces erreurs ...  :heink:  
c'est lourd ça  :sweat:  
 
en fait je viens de regarder, et j'ai des erreurs sur mon 3eme DD aussi
ces 2 DD sont des seagate, tandis que mon premier qui ne fait pas d'erreur est un IBM

Reply

Marsh Posté le 23-08-2002 à 19:41:22    

[:djoh]

Reply

Marsh Posté le 23-08-2002 à 22:47:03    

apt-get install smartsuite   : OK !  :sol:
 
cool il lance un daemon qui scanne tout seul a priori !
mais :
 
1)elle est où la log ?
2)c vrai que ça manque de doc tout ça ;)
 
 

djoh a écrit a écrit :

 [:djoh]  




---------------
www.fenetre8.com
Reply

Marsh Posté le 23-08-2002 à 22:55:49    

x540 a écrit a écrit :

apt-get install smartsuite   : OK !  :sol:
 
cool il lance un daemon qui scanne tout seul a priori !
mais :
 
1)elle est où la log ?
2)c vrai que ça manque de doc tout ça ;)
 
 
 




 
le log apparemment, quand y-a un pb uniquement, c'est dans /var/log/syslog
mais si tu veux obtenir ce que j'ai mis, c'est avec smartctl
celui-ci communique avec le demon smartd pour obtenir ses infos
pour plus d'info c'est man smartctl
pour avoir comme ce que j'ai poster, c'est smartctl -v /dev/hdX


Message édité par djoh le 23-08-2002 à 22:56:24
Reply

Marsh Posté le 24-08-2002 à 06:31:33    

quand tu actives S.M.A.R.T dans le bios, au boot tu as un message d'erreur ?


---------------
Mandriva : parce que nous le valons bien ! http://linux-wizard.net/index.php
Reply

Marsh Posté le 24-08-2002 à 11:16:05    

j'ai pas tout compris comment ça marche non plus mais apparemment il va tester des trucs toutes les 4 heures en offline (il va arrêté de répondre ? :heink: )
 
 

11:11:20 sam aoû 24 root ~
---$ /usr/sbin/smartctl -g /dev/hda
 
General Smart Values:  
Off-line data collection status: (0x00) Offline data collection activity was
     never started
 
Self-test execution status:      (   0) The previous self-test routine completed
     without error or no self-test has ever  
     been run
 
Total time to complete off-line  
data collection:    (  34) Seconds
 
Offline data collection  
Capabilities:     (0x1b)SMART EXECUTE OFF-LINE IMMEDIATE
     Automatic timer ON/OFF support
     Suspend Offline Collection upon new
     command
     Offline surface scan supported
     Self-test supported
 
Smart Capablilities:           (0x0003) Saves SMART data before entering
     power-saving mode
     Supports SMART auto save timer
 
Error logging capability:        (0x01) Error logging supported
 
Short self-test routine  
recommended polling time:   (   2) Minutes
 
Extended self-test routine  
recommended polling time:   (  21) Minutes
 
11:11:52 sam aoû 24 root ~
---$ /usr/sbin/smartctl -t /dev/hda
S.M.A.R.T. Automatic Offline Testing Enabled every four hours


---------------
"not everyone likes metal..... FUCK THEM" Fat Ed.
Reply

Marsh Posté le 24-08-2002 à 14:32:34    

Dark_Schneider a écrit a écrit :

quand tu actives S.M.A.R.T dans le bios, au boot tu as un message d'erreur ?




 
non
pas plus que quand je lui demande si j'en ai via la commande "smartctl -c /dev/hdX"
mais y-a juste toutes ces lignes que je capte pas, et surtout pour les seagates, ça me parait louche (et pis ils sont pas vieux, moins que mon IBM)

Reply

Marsh Posté le 24-08-2002 à 14:39:45    

911GT3 a écrit a écrit :

j'ai pas tout compris comment ça marche non plus mais apparemment il va tester des trucs toutes les 4 heures en offline (il va arrêté de répondre ? :heink: )
 
 

11:11:20 sam aoû 24 root ~
---$ /usr/sbin/smartctl -g /dev/hda
 
General Smart Values:  
Off-line data collection status: (0x00) Offline data collection activity was
     never started
 
Self-test execution status:      (   0) The previous self-test routine completed
     without error or no self-test has ever  
     been run
 
Total time to complete off-line  
data collection:    (  34) Seconds
 
Offline data collection  
Capabilities:     (0x1b)SMART EXECUTE OFF-LINE IMMEDIATE
     Automatic timer ON/OFF support
     Suspend Offline Collection upon new
     command
     Offline surface scan supported
     Self-test supported
 
Smart Capablilities:           (0x0003) Saves SMART data before entering
     power-saving mode
     Supports SMART auto save timer
 
Error logging capability:        (0x01) Error logging supported
 
Short self-test routine  
recommended polling time:   (   2) Minutes
 
Extended self-test routine  
recommended polling time:   (  21) Minutes
 
11:11:52 sam aoû 24 root ~
---$ /usr/sbin/smartctl -t /dev/hda
S.M.A.R.T. Automatic Offline Testing Enabled every four hours

 




 
j'ai comme toi et il veut pas démarrer sur /dev/hda (j'ai toujours "never started"
ça explique p-t pk j'ai pas du tout d'erreur
mais je vois pas pk il veut pas démarrer sur ce DD
et p-t que toutes ces erreurs sont normales et sont le lots de tous les DD  [:ddr555]

Reply

Marsh Posté le 24-08-2002 à 14:44:35    

j'ai ça à plusieurs reprises dans ton mon /var/log/messages depuis que j'ai lancé le -t:
 
 

Aug 24 14:39:37 KT7a-Debian kernel: hda: drive_cmd: status=0x51 { DriveReady SeekComplete Error }
Aug 24 14:39:37 KT7a-Debian kernel: hda: drive_cmd: error=0x04 { DriveStatusError }
Aug 24 14:39:37 KT7a-Debian smartd: /dev/hda:Failed to read smart values  
Aug 24 14:39:37 KT7a-Debian smartd: /dev/hda:Failed to read smart thresholds  
Aug 24 14:39:37 KT7a-Debian kernel: hda: drive_cmd: status=0x51 { DriveReady SeekComplete Error }
Aug 24 14:39:37 KT7a-Debian kernel: hda: drive_cmd: error=0x04 { DriveStatusError }

 
 
je vois pas trop quoi en faire :/


---------------
"not everyone likes metal..... FUCK THEM" Fat Ed.
Reply

Marsh Posté le 24-08-2002 à 14:49:19    

comprends rien :/ j'ai rien aborté du tout mais y a pas d'erreur et de toute façon j'ai confiance en mon dur :D

---$ /usr/sbin/smartctl -e /dev/hda
14:45:20 sam aoû 24 root ~
---$ /usr/sbin/smartctl -O /dev/hda
Completed Off-line command
Drive Command Successful offline test has begun
Please wait 34 seconds for test to complete
Use smartctl -A to abort test
14:45:25 sam aoû 24 root ~
---$ /usr/sbin/smartctl -g /dev/hda
 
General Smart Values:  
Off-line data collection status: (0x04) Offline data collection activity was  
     suspended by an interrupting command
 
Self-test execution status:      (   0) The previous self-test routine completed
     without error or no self-test has ever  
     been run
 
Total time to complete off-line  
data collection:    (1149) Seconds
 
Offline data collection  
Capabilities:     (0x1b)SMART EXECUTE OFF-LINE IMMEDIATE
     Automatic timer ON/OFF support
     Suspend Offline Collection upon new
     command
     Offline surface scan supported
     Self-test supported
 
Smart Capablilities:           (0x0003) Saves SMART data before entering
     power-saving mode
     Supports SMART auto save timer
 
Error logging capability:        (0x01) Error logging supported
 
Short self-test routine  
recommended polling time:   (   2) Minutes
 
Extended self-test routine  
recommended polling time:   (  21) Minutes
 


---------------
"not everyone likes metal..... FUCK THEM" Fat Ed.
Reply

Marsh Posté le 24-08-2002 à 14:54:37    

911GT3 a écrit a écrit :

j'ai ça à plusieurs reprises dans ton mon /var/log/messages depuis que j'ai lancé le -t:
 
 

Aug 24 14:39:37 KT7a-Debian kernel: hda: drive_cmd: status=0x51 { DriveReady SeekComplete Error }
Aug 24 14:39:37 KT7a-Debian kernel: hda: drive_cmd: error=0x04 { DriveStatusError }
Aug 24 14:39:37 KT7a-Debian smartd: /dev/hda:Failed to read smart values  
Aug 24 14:39:37 KT7a-Debian smartd: /dev/hda:Failed to read smart thresholds  
Aug 24 14:39:37 KT7a-Debian kernel: hda: drive_cmd: status=0x51 { DriveReady SeekComplete Error }
Aug 24 14:39:37 KT7a-Debian kernel: hda: drive_cmd: error=0x04 { DriveStatusError }

 
 
je vois pas trop quoi en faire :/




 
:lol:
j'ai exactement le même pb et j'ai fait un post la dessus y-a 2 jours
apparemment on peut ne pas y faire gaffe, c'est pas grave (moi j'ai ça que sur /dev/hdd, c'est mon graveur)
si tu veux le virer faut recomp ton noyau avec l'option qui va bien (activer le multimode par défaut, dans les option pour l'ide)

Reply

Marsh Posté le 25-08-2002 à 22:30:48    

:o  [:djoh]

Reply

Marsh Posté le 28-08-2002 à 02:53:20    

j'insisterais jusqu'à ce que mort s'en suive :o

Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed