non - Python - Programmation
Marsh Posté le 23-04-2012 à 10:58:12
Il faut spécifier dans une structure les mots que tu considères comme inutiles et les enlever du corpus de mots que tu as obtenus. Un programme ne peut pas savoir ce que tu veux si tu ne le lui dit pas.
Je ne sais pas comment tu as obtenu les mots à partir d'un texte. Dans mon code suivant, j'utilise re.split
Je fais de exclure un tuple, car un tuple est un objet qui prend moins de place en mémoire qu'une liste.
Code :
|
Résultat
Code :
|
Marsh Posté le 23-04-2012 à 18:11:36
merci beaucoup ^^ je peux vous demander autre chose j'ai besoin de classé ces mots en fonctions des phrases essayer de trouver la matrice d'occurrence terme-phrase (elle représente les mots en fonction des phrases) et cela en calculant le nombre d'occurrence d'un terme dans une phrase.
les mettre dans une matrice booléenne et je ne sais pas comment faire
Marsh Posté le 23-04-2012 à 18:12:53
pour la segmentation des mots vous utilisez la fonction split
code : q= ss.split(' ')
Marsh Posté le 22-04-2012 à 21:46:30
bonsoir tout le monde je cherche une fonction pour filtrer les mots inutiles (vides) j'ai un corpus après avoir fait la segmentation en phrase et en mot maintenant je dois enlever les mots inutiles par exemple : le la mais ....etc mais je ne sais pas comme faire merci d'avance ^^