Création d'un moteur et indexation, j'ai besoin de votre aide! [ PHP ] - PHP - Programmation
Marsh Posté le 16-07-2002 à 12:56:53
bah, ça a l'air faisable...
je m'interroge plus sur l'utilité de la colonne troislettres. Si tu utilises un index sur la colonne mot, ça devrait suffir, non?
Marsh Posté le 16-07-2002 à 14:18:11
oui en fait je me suis inspiré de phpdig.
Je pense que ça permet déjà de sélectionner toutes les entrées commençant par les trois lettres spécifiées en ensuite parmi ces entrées de rechercher celle qui contiennent le mot demandé... Gain de temps?
Marsh Posté le 20-07-2002 à 23:44:03
dsl je suis plus très souvent sur le forum.
je vois bien ce que tu veux en faire, mais je pense que c'est le rôle d'un index...
si c'est déjà fait, faut pas le refaire, ça risque d'être moins efficace (surtout si tu traite ça en php...)
A+
Marsh Posté le 16-07-2002 à 08:23:27
Salut à tous!
J'aimerais réaliser un moteur de recherche intrne à mon site moi même... Ca n'est pas le moteur en lui même qui me pose problème mais plutôt la partie indexation...
Tout le contenu de mon site n'est en effet pas dans la base de données, et je voudrais pouvoir indexer toutes les pages sans forcément faire appel aux métas.
Je voudrais pouvoir indexer mon site automatiquement quand j'en ferais la demande.
Pour ça voici la structure des deux tables que je compte créer (je me suis un peu inspiré de PHPDig) :
id_mot
mot
troislettres
poids
id_mot
chemin
contenu
titre
La colonne "troislettres" (c'est twoletters dans phpdig), je pense, sert plutôt à accélerer la requête de recherche...
La colonne contenu contiendrais 50 caractères de la page avant le mot et 50 caractères de la page après le mot.
La colonne titre, le titre de la page.
Pour l'indexation, je compte ouvrir le fichier index.php et rechercher toutes les balises <a href=""> et ouvrir le fichier contenu dans ces balises. Je vire alors toutes les balises html, de ce fichier, les ", les' ' ) caractère spéciaux ect... et je stockes tous les mots de plus de trois lettres.
Pensez vous que le principe est bon? Auriez-vous des sugestions?
Merci!