Nettoyer Liste de Mots Clefs

Nettoyer Liste de Mots Clefs - PHP - Programmation

Marsh Posté le 28-11-2008 à 15:49:09    

Bonjour, je dois récemment nettoyer une liste de mots clefs ..
ex => on relève la densité dans un texte de 1500 mots ..
jusque là on les mets en array
$tab["MotClef"]++; // à chaque occurence

 

Hors comment procéder ( rapidement et efficacement ) à grouper les mots clefs similaires sous la même bannière ?
Pour l'instant je pensais procéder comme ça mais je trouve ça très moche

Code :
  1. //$b et $c sont les mêmes tableaux de mots clefs
  2. foreach($b as $k=>$nb){
  3.   foreach($c as $tk=>$tnb){if($tk==$k)continue;
  4.     $score=(strlen($k)/levenshtein($k,$tk));
  5.     if($score>2.6){$b[$k]+=$nb;unset($b[$tk]);
  6.   }
  7. }


Qq'un possède la bonne idée ?


Message édité par grosbin le 28-11-2008 à 15:53:16

---------------
Photos Panoramiques Montagnes Haute Savoie
Reply

Marsh Posté le 28-11-2008 à 15:49:09   

Reply

Marsh Posté le 28-11-2008 à 15:54:32    

euh c'est pas très bon, ça.
Mettons que tu as 3 mots $a, $b et $c.
$a et $b ont un score > 40
$b et $c ont un score > 40
$a et $c ont un score < 40

 

si tu commences par $a tu vas regrouper $a et $b, mais pas $c, ce qui est complètement arbitraire...puisqu'en commençant par $b tu regroupes les 3.


Message édité par skeye le 28-11-2008 à 15:55:39

---------------
Can't buy what I want because it's free -
Reply

Marsh Posté le 28-11-2008 à 16:10:26    

justement je recherche un truc moins improvisé à ce jour .. c'est assez chiatesque je dois reconnaitre, il faudrait limite une clé de similarité des mots clefs ( SOUNDEX ou je ne sais quoi encore qui doit bien exister qqpart )

 

$lev=levenshtein($kw1,$kw2);$len=strlen($kw1);$score=($len/$lev);
if($score>2.7)//ça l'air assez similaire

 

vu le bordel que c'est d'improviser une fonction que je trouve pas ;...


Message édité par grosbin le 28-11-2008 à 16:10:49

---------------
Photos Panoramiques Montagnes Haute Savoie
Reply

Marsh Posté le 28-11-2008 à 16:13:14    

question con : ça sert à quoi, derrière, ton bordel?


---------------
Can't buy what I want because it's free -
Reply

Marsh Posté le 28-11-2008 à 16:17:40    

Densité des Mots Clefs en groupant leurs déclinaisons ( accents, terminaisons pluriel/singulier )
similar_text est une fonction rapide, mais pas super adaptée .. A Noter que le but est Purement SEO / Optimisation des pages / Mots Clefs contenus

 

Obtenir les successions de mots clefs ( expression jusqu'à 4 mots clefs successifs ) etc ..


Message édité par grosbin le 28-11-2008 à 16:31:01

---------------
Photos Panoramiques Montagnes Haute Savoie
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed