Compter le nombre de lignes differentes

Compter le nombre de lignes differentes - Codes et scripts - Linux et OS Alternatifs

Marsh Posté le 25-09-2008 à 23:30:31    

Bonjour, je m'adresse a vos lumieres car j'ai un enorme fichier (1.5MB) texte qui contient pleeeein de lignes identiques... qui se suivent.
VOila comment ca se presente :  

Code :
  1. unelignequiditunpermiertruc
  2. unelignequiditunpermiertruc
  3. unelignequiditunpermiertruc
  4. unelignequiditunpermiertruc
  5. unelignequiditunpermiertruc
  6. unelignequiditunpermiertruc
  7. unelignequiditunAUTRETRUC
  8. unelignequiditunAUTRETRUC
  9. unelignequiditunAUTRETRUC
  10. unelignequiditunAUTRETRUC
  11. ...


 
Le nombre d'occurence de chaque "type" de ligne est tres variable, tout ce que je veut savoir c'est le nombre de lignes qui different (dans l'exemple, ce serait deux). Je me fiche pas mal de ce qui est ecrit, je le sais deja :-)
 
J'ai un peu la flemme d'ecrire un bout de code en c et de le compiler, en bash y'aurait pas moyen de faire ca vite fait ? J'ai aucune idee de quels outils utiliser... (oui je suis nul en script bash...)
 
Merci !


---------------
Un blog qu'il est bien
Reply

Marsh Posté le 25-09-2008 à 23:30:31   

Reply

Marsh Posté le 26-09-2008 à 00:18:22    

Citation :

cat file |sort |uniq |wc -l


---------------
Never f**k with your systems administrator. Why? Because they know what you do with all that free time! |?? | SAVE Jericho !
Reply

Marsh Posté le 26-09-2008 à 00:20:40    

Le_Tolier a écrit :

Citation :

cat file |sort |uniq |wc -l



ahhh je ne connaissais pas uniq... alors la c'est super cool ! Merci, merci beaucoup !  [:al_bundy]

Message cité 1 fois
Message édité par guepe le 26-09-2008 à 00:20:47

---------------
Un blog qu'il est bien
Reply

Marsh Posté le 26-09-2008 à 09:58:38    

cat file | sort -u | wc -l :)


---------------
Les avis, c'est comme les anus, tout le monde en a un.
Reply

Marsh Posté le 26-09-2008 à 10:45:54    

guepe a écrit :


ahhh je ne connaissais pas uniq... alors la c'est super cool ! Merci, merci beaucoup !  [:al_bundy]


 
de rien ;)


---------------
Never f**k with your systems administrator. Why? Because they know what you do with all that free time! |?? | SAVE Jericho !
Reply

Marsh Posté le 26-09-2008 à 11:07:59    

Le_Tolier a écrit :

Citation :

cat file |sort |uniq |wc -l



uniq -c < file

 

edit : :o


Message édité par black_lord le 26-09-2008 à 11:08:16

---------------
uptime is for lousy system administrators what Viagra is for impotent people - mes unixeries - github me
Reply

Marsh Posté le 26-09-2008 à 11:18:09    

:o


---------------
Never f**k with your systems administrator. Why? Because they know what you do with all that free time! |?? | SAVE Jericho !
Reply

Marsh Posté le 26-09-2008 à 12:51:41    

uniq -c seul ne convient pas forcément, puisque le fichier d'entré doit déja être trié.

Reply

Marsh Posté le 26-09-2008 à 15:08:51    

matafan a écrit :

uniq -c seul ne convient pas forcément, puisque le fichier d'entré doit déja être trié.


Bah c'est mon cas, mais c'est sur que la premiere solution est plus generique... en tout cas bravo  :D


---------------
Un blog qu'il est bien
Reply

Marsh Posté le 27-09-2008 à 09:26:28    

Oh un truc utile :love:


---------------
Ce n'est point ma façon de penser qui a fait mon malheur, c'est celle des autres.
Reply

Marsh Posté le 27-09-2008 à 09:26:28   

Reply

Marsh Posté le 27-09-2008 à 20:05:36    

e_esprit a écrit :

Oh un truc utile :love:


de ? compter des lignes ?  [:pingouino]


---------------
uptime is for lousy system administrators what Viagra is for impotent people - mes unixeries - github me
Reply

Marsh Posté le 27-09-2008 à 20:09:28    

De virer les doublons en shell :D


---------------
Ce n'est point ma façon de penser qui a fait mon malheur, c'est celle des autres.
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed