Vérifier l'état de son HDD pour prévenir des pertes de donner [SMART] - Linux et OS Alternatifs
Marsh Posté le 22-08-2002 à 21:04:00
svp, c'est interessant comme prog non ?
facile à installer en plus :
apt-get install smartsuite |
Marsh Posté le 22-08-2002 à 21:09:38
Tiens, voilà la page indiqué par rpmfind :
http://csl.cse.ucsc.edu/smart.shtml
Marsh Posté le 22-08-2002 à 21:20:20
Mjules a écrit a écrit : Tiens, voilà la page indiqué par rpmfind : http://csl.cse.ucsc.edu/smart.shtml |
oui, j'y suis déjà allé, mais y-a rien sur ce site
Marsh Posté le 23-08-2002 à 00:06:44
je lacherais pas l'affaire
tout le monde s'en fout de ses données !?
Marsh Posté le 23-08-2002 à 00:27:58
bah j'avoues qu'en fait à prioris, aucune de mes bécannes n'est compatible smart, alors je regarderais ca à temps perdu
Marsh Posté le 23-08-2002 à 01:06:14
PinG a écrit a écrit : bah j'avoues qu'en fait à prioris, aucune de mes bécannes n'est compatible smart, alors je regarderais ca à temps perdu |
apparemment les DD ça fait longtemps qu'ils sont compatibles
pour les MB, il faut activer l'option dans le bios
dans tous les cas, tu fais :
smartctl -i /dev/hdX |
et il te dira si c'est supporté
c'est dommage que ça interesse personne
ça a l'air bien puissant mais j'arrive pas à décrypter ce qu'il me sort (à part la temp )
Marsh Posté le 23-08-2002 à 08:54:10
Djoh > si, si ça m'intéresse ce que tu viens de dire
Et pour moi aussi les données sensibles ça veut dire qqch ...
j'ai installé smartsuite c'est vraiment excellent !
Je sens que ça va me faciliter la vie !
Pour l'interprétation voilà ce que j'ai compris !
* Chaque ligne représente une variable monitorée
* 1er élément de la ligne : code avec titre associé
* Flag ? moyen d'accéder à la variable en question ???
* value : Valeur actuelle
* Worst : Plus mauvaise valeur
* Threshold : Seuil (de quoi ?) avant déclenchement d'une alarme ?
* Raw Value: Valeur brute ? Avant interprétation par le soft je pense
Marsh Posté le 23-08-2002 à 14:08:55
Grizly a écrit a écrit : Djoh > si, si ça m'intéresse ce que tu viens de dire Et pour moi aussi les données sensibles ça veut dire qqch ... j'ai installé smartsuite c'est vraiment excellent ! Je sens que ça va me faciliter la vie ! Pour l'interprétation voilà ce que j'ai compris ! * Chaque ligne représente une variable monitorée * 1er élément de la ligne : code avec titre associé * Flag ? moyen d'accéder à la variable en question ??? * value : Valeur actuelle * Worst : Plus mauvaise valeur * Threshold : Seuil (de quoi ?) avant déclenchement d'une alarme ? * Raw Value: Valeur brute ? Avant interprétation par le soft je pense |
aaah ! voilà qq'un de bien
donc ça j'avais déjà compris
et treshold je pense que c'est le seuil en dessous duquel ça ne descend pas
ce que je comprends pas :
* la raw value : bizarre si ça sert à rien ... enfin je voudrais connaitre son utilité mais vu la gueule de la doc on est pas sortie
* la signification de chaque ligne
* pk mes valeur sont toujours au nivo worst (c'est inquiétant ... t'as ça ?)
* pk j'ai des CRC error
Marsh Posté le 23-08-2002 à 14:11:01
bon j'ai capté que worst était la plus mauvaise valeur atteinte et non la plus mauvaise valeur atteignable
mais pk dans ma premiere ligne, le worst est plus faible que la valeur actuelle ?
Marsh Posté le 23-08-2002 à 14:15:48
je viens de découvrir autre chose, j'ai l'impression : value c'est juste une valeur abstraite donné par le prog lui même
et raw value, c'est la valeur donnée dans une unité de mesure lisible par les hommes (par ex j'ai une temp de 141 en value là, alors que en raw j'ai 39)
y-a d l'ECC sinon dans les DD ?
pq j'ai un dur qui a l'air d'avoir des erreurs et apparemment il a recup les bonnes valeur via ECC
enfin c'est inquiétant les valeurs, et pis là la temp dans value, est bien à 39 (valeur lisible par l'homme ... comprends pas là )
Vendor Specific SMART Attributes with Thresholds: |
Marsh Posté le 23-08-2002 à 14:32:15
et ça continu à augmenter ces erreurs ...
c'est lourd ça
en fait je viens de regarder, et j'ai des erreurs sur mon 3eme DD aussi
ces 2 DD sont des seagate, tandis que mon premier qui ne fait pas d'erreur est un IBM
Marsh Posté le 23-08-2002 à 22:47:03
apt-get install smartsuite : OK !
cool il lance un daemon qui scanne tout seul a priori !
mais :
1)elle est où la log ?
2)c vrai que ça manque de doc tout ça
djoh a écrit a écrit : |
Marsh Posté le 23-08-2002 à 22:55:49
x540 a écrit a écrit : apt-get install smartsuite : OK ! cool il lance un daemon qui scanne tout seul a priori ! mais : 1)elle est où la log ? 2)c vrai que ça manque de doc tout ça |
le log apparemment, quand y-a un pb uniquement, c'est dans /var/log/syslog
mais si tu veux obtenir ce que j'ai mis, c'est avec smartctl
celui-ci communique avec le demon smartd pour obtenir ses infos
pour plus d'info c'est man smartctl
pour avoir comme ce que j'ai poster, c'est smartctl -v /dev/hdX
Marsh Posté le 24-08-2002 à 06:31:33
quand tu actives S.M.A.R.T dans le bios, au boot tu as un message d'erreur ?
Marsh Posté le 24-08-2002 à 11:16:05
j'ai pas tout compris comment ça marche non plus mais apparemment il va tester des trucs toutes les 4 heures en offline (il va arrêté de répondre ? )
11:11:20 sam aoû 24 root ~ |
Marsh Posté le 24-08-2002 à 14:32:34
Dark_Schneider a écrit a écrit : quand tu actives S.M.A.R.T dans le bios, au boot tu as un message d'erreur ? |
non
pas plus que quand je lui demande si j'en ai via la commande "smartctl -c /dev/hdX"
mais y-a juste toutes ces lignes que je capte pas, et surtout pour les seagates, ça me parait louche (et pis ils sont pas vieux, moins que mon IBM)
Marsh Posté le 24-08-2002 à 14:39:45
911GT3 a écrit a écrit : j'ai pas tout compris comment ça marche non plus mais apparemment il va tester des trucs toutes les 4 heures en offline (il va arrêté de répondre ? )
|
j'ai comme toi et il veut pas démarrer sur /dev/hda (j'ai toujours "never started"
ça explique p-t pk j'ai pas du tout d'erreur
mais je vois pas pk il veut pas démarrer sur ce DD
et p-t que toutes ces erreurs sont normales et sont le lots de tous les DD
Marsh Posté le 24-08-2002 à 14:44:35
j'ai ça à plusieurs reprises dans ton mon /var/log/messages depuis que j'ai lancé le -t:
Aug 24 14:39:37 KT7a-Debian kernel: hda: drive_cmd: status=0x51 { DriveReady SeekComplete Error } |
je vois pas trop quoi en faire
Marsh Posté le 24-08-2002 à 14:49:19
comprends rien j'ai rien aborté du tout mais y a pas d'erreur et de toute façon j'ai confiance en mon dur
---$ /usr/sbin/smartctl -e /dev/hda |
Marsh Posté le 24-08-2002 à 14:54:37
911GT3 a écrit a écrit : j'ai ça à plusieurs reprises dans ton mon /var/log/messages depuis que j'ai lancé le -t:
|
j'ai exactement le même pb et j'ai fait un post la dessus y-a 2 jours
apparemment on peut ne pas y faire gaffe, c'est pas grave (moi j'ai ça que sur /dev/hdd, c'est mon graveur)
si tu veux le virer faut recomp ton noyau avec l'option qui va bien (activer le multimode par défaut, dans les option pour l'ide)
Marsh Posté le 22-08-2002 à 20:49:34
Je sais pas pour vous mais moi, el truc qui me ferait le plus chier c'est de perdre des données, si mon pc plantait
l'un des composants sensibles, et donc à vérifier pour ne pas perdre des données, ce sont les disques durs
smartsuite permet apparemment de prévenir ces pannes suffisament à l'avance, dans la plupart des cas (je parle pas des pb électrique genre mauvaise alim, surtension ...), des pannes de DD.
il donne pas mal d'info, mais le pb, c'est que niveau doc c'est zero !
pas moyen de capter la moitié des infos qu'il donne
j'espère que ce logiciel interesse d'autres personnes pour pouvoir m'expliquer toutes ces jolie infos
moi par exemple, parmi les nombreuses infos fournies, j'ai ça pour l'un de mes DD :
Vendor Specific SMART Attributes with Thresholds:
Revision Number: 10
Attribute Flag Value Worst Threshold Raw Value
( 1)Raw Read Error Rate 0x000f 073 068 034 45744870
( 3)Spin Up Time 0x0003 070 070 000 0
( 4)Start Stop Count 0x0032 100 100 020 245
( 5)Reallocated Sector Ct 0x0033 100 100 036 0
( 7)Seek Error Rate 0x000f 081 060 030 120093743
( 9)Power On Hours 0x0032 096 096 000 4018
( 10)Spin Retry Count 0x0013 100 100 097 0
( 12)Power Cycle Count 0x0032 100 100 020 254
(194)Temperature 0x0022 043 049 000 43
(195)Hardware ECC Recovered 0x001a 073 066 000 45744870
(197)Current Pending Sector 0x0012 100 100 000 0
(198)Offline Uncorrectable 0x0010 100 100 000 0
(199)UDMA CRC Error Count 0x003e 200 200 000 0
(200)Unknown Attribute 0x0000 100 253 000 0
(202)Unknown Attribute 0x0032 100 253 000 0
si qq'un capte, une 'tite explication serait pas de refu