compression de texte : algo efficace même sur peu de données - Algo - Programmation
Marsh Posté le 28-07-2004 à 00:27:53
Taz a écrit : plop. je cherche un algo pour compresser du texte uniquement (du code, donc de l'ascii pur). Mais je cherche un algo efficace même sur un petit volume (typiquement < 1Ko, voir beaucoup plus petit), je me demande si Huffman n'irait pas ... si vous avez des idées |
non, il ne répond pas a tes attentes
Marsh Posté le 28-07-2004 à 00:47:51
Taz > c'est un truc style pleins de petits fichiers du même type ?
tu peux pas faire un alphabet quelconque dont les tables de convertion sont dans les clients ?
Marsh Posté le 28-07-2004 à 00:49:09
pourquoi ? je stocke du code, ma table est prédéfinie (code en anglais), j'ai 63 caractères différents d'ailleurs
Marsh Posté le 28-07-2004 à 00:56:29
bon, bah roule, tu peux peut-être même tenter un Huffman sur moins d'un octet.
Marsh Posté le 28-07-2004 à 05:12:41
Pour compresser des données perso,
J'utilisais une fenetre glissante.
L'avantage c'est qu'il n'y a aucun charge fixe et que c'est très rapide à compresser et à décompresser. Par contre c'est probablement moins efficace qu'un huffman générique.
Ceci dit c'était des données très spécifiques dont je savais à l'avance qu'elles se compresserait bien avec cet algo. (un peu comme quand tu fais du RLE).
Marsh Posté le 28-07-2004 à 08:03:58
en fait, voilà l'application que je fais. actuellement, je génère des signatures avec du md. seulement dans pas mal de cas, les données sont de taille du même ordre que l'empreinte. et moi ce qui me rendrait service, c'est justement d'avoir la donnée, mais sans rajouter d'octet
Marsh Posté le 28-07-2004 à 08:39:53
Google me donne un bon site : http://datacompression.info/
Si tu n'as pas de contraintes CPU tu peux p-ê essayer le codage arithmétique, qui est plus efficace qu'Huffman.
Sinon, dans le temps, j'avais implémenté un Huffman canonique (http://www.compressconsult.com/huffman/), une ruse qui permet d'éviter d'avoir à stocker la table de correspondances.
Et Huffman adaptatif (la méthode de la fenêtre glissante) est généralement nettement plus efficace qu'Huffman tout court. Je ne sais pas s'il est possible de faire un Huffman canonique adaptatif.
Marsh Posté le 28-07-2004 à 08:51:22
ok, je vais regarder tout ça au boulot, merci (mais c'est pas pour le boulot n'est-ce pas:
Marsh Posté le 28-07-2004 à 08:54:26
pour l'adaptif > ça va pas me servir à grand chose vu que j'ai (très) peu de données
Marsh Posté le 28-07-2004 à 08:57:19
Oui, l'adaptatif n'est utile que pour les grands textes.
Marsh Posté le 31-07-2004 à 19:50:07
Reply
Marsh Posté le 28-07-2004 à 00:26:41
plop. je cherche un algo pour compresser du texte uniquement (du code, donc de l'ascii pur). Mais je cherche un algo efficace même sur un petit volume (typiquement < 1Ko, voir beaucoup plus petit), je me demande si Huffman n'irait pas ... si vous avez des idées