RAID5 avec 3HDD qui rame

RAID5 avec 3HDD qui rame - Hardware - Linux et OS Alternatifs

Marsh Posté le 27-06-2004 à 14:49:31    

Salut,  
 
J'ai un serveur qui héberge un site assez visité. J'utilise un raid5 avec 3DD scsi.
 

hdparm -tT /dev/sda1
 
/dev/sda1:
 Timing buffer-cache reads:   128 MB in  0.22 seconds =581.82 MB/sec
 Timing buffered disk reads:  64 MB in 112.60 seconds =582.02 kB/sec


 
Le Timing buffered disk reads est très très bas. Pour information, le serveur mysql fait 600reqs/s donc je sais pas si c'est une limitation normale? Car il y a quand meme 3DD scsi derrière donc je trouve ca bizarre :??:
Ou peut etre que le raid est mal configuré?
 
Je vois pas trop par ou commencer pour chercher le problème.
 
merci :jap:


Message édité par POWA le 27-06-2004 à 14:49:40
Reply

Marsh Posté le 27-06-2004 à 14:49:31   

Reply

Marsh Posté le 27-06-2004 à 17:09:42    

remonte ptit topic


Message édité par POWA le 27-06-2004 à 17:09:50
Reply

Marsh Posté le 27-06-2004 à 18:56:09    


je suppose que c'est du raid hard ?
si oui ==> probleme, cf les dmesg et autre syslog
si non ==> alors tu as fait un test en lecture sur un disque alors qu'il fait partie d'un groupe raid et c'est pas forcement excellent pour les perfs.

Reply

Marsh Posté le 27-06-2004 à 19:47:21    

Le RAID-5 est "mauvais" pour l'ecriture.. Vaut mieux un RAID-10 (j'ai fais les tests avec 5 disques SCSI 10K).

Reply

Marsh Posté le 28-06-2004 à 02:46:41    

là c'est pas tellement un prob d'écriture mais plutot de lecture.
 
maxmaverick: c'est bien du raid hard.


Message édité par POWA le 28-06-2004 à 02:50:09
Reply

Marsh Posté le 28-06-2004 à 11:12:30    

Alors utilise le bios de la carte pour faire un test du raid, parce que la ... y a soucis.

Reply

Marsh Posté le 30-06-2004 à 03:03:21    

A cette heure ci, le trafic est moindre sur le site est pourtant:
 

Citation :

/dev/sda2:
 Timing buffer-cache reads:   128 MB in  0.21 seconds =609.52 MB/sec
 Timing buffered disk reads:  64 MB in  3.06 seconds = 20.92 MB/sec


20.92MB/sec c'est ridicule pour du raid5 avec 3HDD? alors que ya que mysql qui tourne et à cette heure ci seulement 350personnes sont connectés à ce serveur.
 
 
edit: parce que à coté de ca, j'ai un autre serveur avec un seul DD scsi qui donne ces résultats:

Citation :


 Timing buffer-cache reads:   128 MB in  0.26 seconds =492.31 MB/sec
 Timing buffered disk reads:  64 MB in  1.26 seconds = 50.79 MB/sec


 
Je vois pas trop d'ou vient le problème. Pourquoi le premier est si lent :??:


Message édité par POWA le 30-06-2004 à 03:04:40
Reply

Marsh Posté le 30-06-2004 à 03:33:38    

Ralph- a écrit :

Le RAID-5 est "mauvais" pour l'ecriture.. Vaut mieux un RAID-10 (j'ai fais les tests avec 5 disques SCSI 10K).


 
C'est pas comparable, un RAID 5 permet une meilleure disponibilité, de plus sur 3 disques je vois même pas l'intérêt de parler de RAID 10 :heink:

Reply

Marsh Posté le 30-06-2004 à 03:36:52    

POWA a écrit :

A cette heure ci, le trafic est moindre sur le site est pourtant:
 

Citation :

/dev/sda2:
 Timing buffer-cache reads:   128 MB in  0.21 seconds =609.52 MB/sec
 Timing buffered disk reads:  64 MB in  3.06 seconds = 20.92 MB/sec


20.92MB/sec c'est ridicule pour du raid5 avec 3HDD? alors que ya que mysql qui tourne et à cette heure ci seulement 350personnes sont connectés à ce serveur.
 
 
edit: parce que à coté de ca, j'ai un autre serveur avec un seul DD scsi qui donne ces résultats:

Citation :


 Timing buffer-cache reads:   128 MB in  0.26 seconds =492.31 MB/sec
 Timing buffered disk reads:  64 MB in  1.26 seconds = 50.79 MB/sec


 
Je vois pas trop d'ou vient le problème. Pourquoi le premier est si lent :??:


 
Carrément pas normal effectivement, c'est quoi le modèle de la carte RAID 5 ? Adaptec ? ( pas Mylex pour être en /dev/sd** )
 
Possible que ça chie si un disque est tombé en rade, la carte devant recalculer les données en fonction du CRC. Check du dmesg et syslog/message pour voir s'il y a des erreurs, sinon voir aussi à quelle vitesse sont synchros les DD sur la carte...

Reply

Marsh Posté le 30-06-2004 à 13:16:14    

Disque Dur SCA Max6 : 3 IBM/Hitachi 36 Go U320 10000 RPM 80 pins DK32EJ
Carte SCSI : 1 Adaptec 2120S RAID 0,1,5


 
Je viens de regarder et pas de messages en rapport dans /var/log/messages et rien non plus de particulier dans le dmesg.
 
Comment faire pour voir à quelle vitesse sont synchros les DD sur la carte?
merci :)

Reply

Marsh Posté le 30-06-2004 à 13:16:14   

Reply

Marsh Posté le 30-06-2004 à 13:51:25    

tu as le bon driver ? la dernière version (et du noyau) ?

Reply

Marsh Posté le 30-06-2004 à 16:02:03    

La 2120S est assez bien reconnue depuis le 2.4.20 de toute manière normalement.
 
Là j'ai pas sous la main mais je te filerai le CLI si tu n'as pas pour checker si tous les disques sont online, sinon l'ideal serait de voir sur place dans le bios ça. L'est chiante l'Adaptec pour ça, y'a pas de /proc/rd/c0/status par ex comme sur la Mylex :/

Reply

Marsh Posté le 30-06-2004 à 17:09:15    

Essaye d'augmenter le readahead, par exemple:
 
blockdev --setra=2048 /dev/sda
 
Utilise aussi iostat pour voir le ratio entre les lectures et les écritures.
Si tu as plus de 10% d'écritures, ça rame sans doute à cause du RAID 5.

Reply

Marsh Posté le 30-06-2004 à 17:16:19    

Code :
  1. $ sudo hdparm -tT /dev/sdg
  2. /dev/sdg:
  3. Timing buffer-cache reads:   2384 MB in  2.00 seconds = 1191.59 MB/sec
  4. Timing buffered disk reads:  294 MB in  3.02 seconds =  97.40 MB/sec


 
6 disques en RAID 10.

Reply

Marsh Posté le 30-06-2004 à 17:58:33    

C'est quoi comme disques ? ( 15K Seagate ou 10K Maxtor ou ... ? )


Message édité par Sly Angel le 30-06-2004 à 17:59:08
Reply

Marsh Posté le 30-06-2004 à 18:04:35    

A titre indicatif
 
hdparm -tT /dev/sdb
 
/dev/sdb:
 Timing buffer-cache reads:   2932 MB in  2.00 seconds = 1465.49 MB/sec
 Timing buffered disk reads:  222 MB in  3.01 seconds =  73.72 MB/sec
 
6 disques (U160 dans une baie ibm et reliés a une carte RAID IBM ServRAID-6M) en RAID 5


---------------
Two thousand years of misery, of torture in my name, hypocrisy made paramount, paranoia the law, my name is called religion, sadistic, sacred whore.
Reply

Marsh Posté le 30-06-2004 à 18:06:45    

surement du IBM les disques là par contre donc :D ( ou Seagate mais je doute sur un "petit" serveur IBM :o )

Reply

Marsh Posté le 30-06-2004 à 23:00:56    

Dans mon cas c'est des Seagate (Cheetah 15k), sur un controleur Storagetek.

Reply

Marsh Posté le 30-06-2004 à 23:12:06    

Ah bah forcément du Cheetah 15K ça mouline bien :D ( pis les temps d'accès :love: )
 
Ava t'as pas de la merde toi ;) :D


Message édité par Sly Angel le 30-06-2004 à 23:12:19
Reply

Marsh Posté le 30-06-2004 à 23:23:02    

axey a écrit :

Dans mon cas c'est des Seagate (Cheetah 15k), sur un controleur Storagetek.

c'est pour skyrock? skyblog?

Reply

Marsh Posté le 30-06-2004 à 23:26:36    

Sly Angel a écrit :

C'est pas comparable, un RAID 5 permet une meilleure disponibilité, de plus sur 3 disques je vois même pas l'intérêt de parler de RAID 10 :heink:


 
En effet pour 3 disque le RAID 10 c'est mal barré, mais tu entends quoi par "disponibilité" ?  

Reply

Marsh Posté le 01-07-2004 à 00:04:15    

Déjà un raid 10, tu n'as que 50% de l'espace dispo.
La disponibilité c'est de savoir si le fait qu'un DD crashe pose problème ou pas. Et normalement le raid 5 survit à la perte d'un disque et le raid 10 survit à la perte de plusieurs disques suivant où ils sont placés.

Reply

Marsh Posté le 01-07-2004 à 00:35:39    

Un RAID 5 survit à la perte d'un disque si on excepte les spare, le RAID 10 c'est un peu pareil mais effectivement selon le disque ça peut être plus ( m'enfin c'est roulette russe )
 
Mais oui en RAID 10 c'est 50% contre n-1 sur RAID 5.
 
Intéressant dans ce cas le RAID 50 consitué de de 2 RAID 5 montés en RAID 0.
 
Après ça dépend surtout des écritures c'est clair :jap:

Reply

Marsh Posté le 01-07-2004 à 08:41:37    

POWA a écrit :

c'est pour skyrock? skyblog?


 
C'est pour Skyblog. C'est une baie de 58 disques, ça clignote de partout ça fait trop joli.

Reply

Marsh Posté le 01-07-2004 à 08:44:21    

Sly Angel a écrit :

Un RAID 5 survit à la perte d'un disque si on excepte les spare, le RAID 10 c'est un peu pareil mais effectivement selon le disque ça peut être plus ( m'enfin c'est roulette russe )


 
Meme en achetant des disques de la meme serie faut vraiment avoir la poisse pour que deux disques petent en meme temps :)
 
Cela dit l'intéret du RAID 10 quand il y a un disque pété c'est aussi le temps de reconstruction. Sur du RAID 5 ça peut être trèèsssssss long et pendant ce temps, les données restent accessibles mais ça rame à mort.
Sur du RAID 10, il y a juste un disque à cloner, ça ne perturbe pas trop les accès et c'est vite fait.

Reply

Marsh Posté le 01-07-2004 à 09:23:23    

POWA a écrit :

ouch :ouch:  
Est-ce vraiment nécessaire? :pt1cable:  
 
Je m'occupe d'un site (80M pap mois) et j'ai rien de tout ca :D


 
Malheureusement oui, uniquement pour les temps d'accès. Vu que c'est comme des pages perso, il n'y a que des accès aléatoires et jamais rien en cache. Et comme il y a environ 25% d'écritures (mises à jour des pages et commentaires), ça s'écroule en RAID 5 :(
 
On a environ 20 millions de PAP par jour.
 
Mais c'est cool une baie de disque. On a trouvé comment controler les diodes de chaque disque à partir d'une machine distante et on va essayer de faire un pong ou un casse-brique avec. Bientôt le code source et les photos en ligne :)

Reply

Marsh Posté le 01-07-2004 à 09:38:06    

D'ailleurs l'achat de la baie de disques a été assez folklorique.
Tous nos serveurs sont sous Gentoo et OpenBSD.
J'ai contacté IBM, Hitachi et Storagetek pour nous conseiller dans le choix d'une baie adaptée à notre environnement.
Pour résumer la situation :
 
* IBM : "hein ? Gentoo c'est quoi ça ? Ca marchera pas". On leur explique que ça fonctionnera sans doute, qu'un Linux c'est un Linux et ils semblent ok pour nous préter une baie. On poireaute et 2 mois plus tard ils nous recontactent "bon désolé, on vous livre pas le matériel, on est pas sûrs que ça fonctionne sur votre distribution bizarre". Plus jamais de nouvelles depuis.
 
* Hitachi :
Les commerciaux : "Ok aucun soucis, ça marchera". Ils nous pretent le matériel. Ca marche malgré des performances de merde vu le prix du bouzin. Enfin les disques marchent mais la baie nécessite un outil proprio (HDLM) pour le failover qui lui n'est livré que pour le kernel 2.4.21 . Je leur explique que ça fait chier ces drivers de merde en closed source. Un mec d'Hitachi me rappelle. Après 45 minutes de "vous faites chier avec votre distrib, on supporte que les standards de l'industrie à savoir Redhat et Suse. Les mauvaises performances c'est à cause de votre distribution". Et bizarrement il finit par se calmer et par dire "effectivement, euh c'est parce que l'outil est nouveau, mais on sortira peut-être bientôt les sources". Le mec va aussi se renseigner pour voir s'il est possible de préter du matériel et de fournir de la doc aux développeurs d'OpenBSD pour que le failover fonctionne dessus. Si c'est vrai, c'est cool. Mais bon, le mec est avant tout un commercial.
 
* Storagetek :
Les commerciaux : "Ah, euh ? Kernel 2.6 ? Gentoo ? Euh... faut essayer". Deux jours plus tard un de leur techos m'appelle "hey je suis en train d'installer une Gentoo sur mon portable, c'est cool, je kiffe trop portage. Puis l'image en fond de console ça roxore". Bon il a fallu bien se prendre la tete avec les multipath-tools, evms et le firmware des controleurs pour que le multipath fonctionne, mais apparemment c'est bon. Ils ont parlé rapidement de la possibilité de filer un accès distant à des baies pour aider les développeurs de logiciels libres à créer des outils adaptés. Rien de concret pour l'instant par contre.
 
C'est vraiment chiant la réaction des boites quand on leur sort autre chose que "Redhat" (et encore, RedHat 8 maximum). Genre pour le soft qui nous sert à balancer les pubs sur les sites, y a rien de spécial, c'est juste un module tout con pour Apache. Bein les mecs ont hurlé quand on leur a dit qu'on utilisait des noyaux 2.6 "non notre soft marchera jamais sur un noyau 2.6 !!!".


Message édité par axey le 01-07-2004 à 10:02:58
Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed