Compter le nombre de lignes differentes

Marsh Posté le 25-09-2008 à 23:30:31

Bonjour, je m'adresse a vos lumieres car j'ai un enorme fichier (1.5MB) texte qui contient pleeeein de lignes identiques... qui se suivent.
VOila comment ca se presente :

Code :

unelignequiditunpermiertruc
unelignequiditunpermiertruc
unelignequiditunpermiertruc
unelignequiditunpermiertruc
unelignequiditunpermiertruc
unelignequiditunpermiertruc
unelignequiditunAUTRETRUC
unelignequiditunAUTRETRUC
unelignequiditunAUTRETRUC
unelignequiditunAUTRETRUC
...

Le nombre d'occurence de chaque "type" de ligne est tres variable, tout ce que je veut savoir c'est le nombre de lignes qui different (dans l'exemple, ce serait deux). Je me fiche pas mal de ce qui est ecrit, je le sais deja :-)

J'ai un peu la flemme d'ecrire un bout de code en c et de le compiler, en bash y'aurait pas moyen de faire ca vite fait ? J'ai aucune idee de quels outils utiliser... (oui je suis nul en script bash...)

Merci !

---------------
Un blog qu'il est bien

Reply

Marsh Posté le 25-09-2008 à 23:30:31

Reply

Marsh Posté le 26-09-2008 à 00:18:22

Citation :

cat file |sort |uniq |wc -l

Message cité 2 fois

---------------
Never f**k with your systems administrator. Why? Because they know what you do with all that free time! |?? | SAVE Jericho !

Reply

Marsh Posté le 26-09-2008 à 00:20:40

Le_Tolier a écrit :

Citation :

cat file |sort |uniq |wc -l

ahhh je ne connaissais pas uniq... alors la c'est super cool ! Merci, merci beaucoup ! [:al_bundy]

Message cité 1 fois
Message édité par guepe le 26-09-2008 à 00:20:47

---------------
Un blog qu'il est bien

Reply

Marsh Posté le 26-09-2008 à 09:58:38

cat file | sort -u | wc -l

---------------
Les avis, c'est comme les anus, tout le monde en a un.

Reply

Marsh Posté le 26-09-2008 à 10:45:54

guepe a écrit :

ahhh je ne connaissais pas uniq... alors la c'est super cool ! Merci, merci beaucoup ! [:al_bundy]

de rien

---------------
Never f**k with your systems administrator. Why? Because they know what you do with all that free time! |?? | SAVE Jericho !

Reply

Marsh Posté le 26-09-2008 à 11:07:59

Le_Tolier a écrit :

Citation :

cat file |sort |uniq |wc -l

uniq -c < file

edit :

Message édité par black_lord le 26-09-2008 à 11:08:16

---------------
uptime is for lousy system administrators what Viagra is for impotent people - mes unixeries - github me

Reply

Marsh Posté le 26-09-2008 à 11:18:09

---------------
Never f**k with your systems administrator. Why? Because they know what you do with all that free time! |?? | SAVE Jericho !

Reply

Marsh Posté le 26-09-2008 à 12:51:41

uniq -c seul ne convient pas forcément, puisque le fichier d'entré doit déja être trié.

Message cité 1 fois

Reply

Marsh Posté le 26-09-2008 à 15:08:51

matafan a écrit :

uniq -c seul ne convient pas forcément, puisque le fichier d'entré doit déja être trié.

Bah c'est mon cas, mais c'est sur que la premiere solution est plus generique... en tout cas bravo

---------------
Un blog qu'il est bien

Reply

Marsh Posté le 27-09-2008 à 09:26:28

Oh un truc utile :love:

Message cité 1 fois

---------------
Ce n'est point ma façon de penser qui a fait mon malheur, c'est celle des autres.

Reply

Marsh Posté le 27-09-2008 à 09:26:28

Reply

Marsh Posté le 27-09-2008 à 20:05:36

e_esprit a écrit :

Oh un truc utile :love:

de ? compter des lignes ? [:pingouino]

---------------
uptime is for lousy system administrators what Viagra is for impotent people - mes unixeries - github me

Reply

Marsh Posté le 27-09-2008 à 20:09:28

De virer les doublons en shell

---------------
Ce n'est point ma façon de penser qui a fait mon malheur, c'est celle des autres.

Reply

Compter le nombre de lignes differentes

Sujets relatifs:

Leave a Replay