débutante: fréquence des mots sur Python

débutante: fréquence des mots sur Python - Python - Programmation

Marsh Posté le 27-12-2009 à 20:37:09    

Bonjour à tous. (et bonnes fêtes!)
 
Je débute avec Python, et j'ai un petit problème concernant le calcul de la fréquence de mots.
Je travaille sur un texte conséquent (livre numérisé) et je dois calculer la fréquence de mots (combien de token pour chaque type).  
Je dois faire la liste des mots les plus fréquents et garder les mots qui apparaissent par exemple 10, 15, 20 fois dans le texte.  
Seulement je suis vraiment perdue, je n'ai strictement aucune idée de comment je peux trouver ce résultat. Le tutoriel avec lequel je travaille ne m'a pas aidé..
 
SVP, une petite aide serait le bienvenue.
Merci d'avance.
Bonne soirée =)

Reply

Marsh Posté le 27-12-2009 à 20:37:09   

Reply

Marsh Posté le 27-12-2009 à 20:49:23    

solution:
 */ str.split
 */ dict (ou mieux: collections.defaultdict)


---------------
Nos estans firs di nosse pitite patreye...
Reply

Marsh Posté le 28-12-2009 à 13:28:07    

> kasis : donne-nous un bout de code pour que nous puissons t'aider... Après avoir ouvert ton fichier, effectue un str.split() sur le contenu (mais en terme de consommation mémoire je ne sais pas si ça va passer si ton livre est vraiment gros). Une fois que, grâce à split(), tu auras récupéré les mots, un dictionnaire te permettra de les ranger et d'en calculer la fréquence. Mais écris d'abord un peu de code !


Message édité par suizokukan le 28-12-2009 à 13:28:32

---------------
rule #1 : trust the python
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed