Moteur de recherche GNU pour Linux/PHP - PHP - Programmation
Marsh Posté le 24-11-2004 à 10:00:36
Arjuna a écrit : Salut. |
Je vais tester swish-e d'ici peu. C'est un moteur de recherche full-text qui parait-il tourne bien. Nous allons l'integrer dans un environnement PHP également
Marsh Posté le 24-11-2004 à 10:30:06
Ha be, si tu peux tout simplement me tenir au courant de tes tests
Parceque je dois moi-même bencher ensuite la ou les solutions trouvées afin de choisir celle à mettre en place.:whistle:
Marsh Posté le 24-11-2004 à 11:27:58
http://www.phpdig.net/navigation.php?action=doc#toc3
c'est celui que j'ai mis en place sur l'Intranet où je bosse sur un plateforme FreeBSD/apache/php4/MySQL
les résultats sont plus que satisfaisants
Marsh Posté le 24-11-2004 à 11:32:57
arjuna > t'as essayé http://www.htdig.org/ ?
Marsh Posté le 24-11-2004 à 12:19:42
Merci pour ces infos
Je vais voir ces trois produits et ce que ça donne !
Marsh Posté le 24-11-2004 à 15:34:54
Pour Swish-e, d'après la dac, il est capable de rechercher des mots de la même famille et des homonymes.
Par contre, rien n'est spécifié pour les fichiers XLS et DOC.
phpdig, lui, estcapable de lire ces fichiers. Par contre, rien n'est indiqué quant à sa capacité à chercher des mots avec une orthographe variante... Paulmuadib, tu peux me dire si ça marche ? Par exemple, rechercher "boulangerie" et il ressort "boulangère".
Quand à htdig, idem que phpdig. Simogeo, tu sais si je peux faire des recherches comme je veux ?
Grossomodo, je veux un truc qui est capable de faire comme google (et je ne veux pas d'un moteur qui bouffe directement une string, je veux pouvoir écrire à la main les critères que je veux).
C'est à dire que :
- Rechercher l'orthographe exacte
- Rechercher avec une orthographe avoisinante
- Rechercher dans un scope particulier de documents
- AND, OR et NOT évidement
- Mettons que j'ai un client qui appartient à un groupe particulier, je veux pouvoir le faire taper dans un catalogue spécifique, ou alors inclure un certain nombre de critères supplémentaires
Grossomodo, pour ceux qui connaissent Index Server ou Oracle Text Search, je recherche un moteur équivalent, et à la même logique d'implémentation.
Marsh Posté le 24-11-2004 à 15:41:08
En fait, et c'est un point très important pour moi, je ne veux pas que le langage de requêtage soit fixé.
Je veux un truc analogique à ce que j'ai fait sur mon site perso avec SQL Server Full Text Search :
Code :
|
=> Je récupère la requête demandée par l'utlisateur, et avec des fonctions en interne, je vais parser sa demande avec une grammaire qui est propre au site, pour ensuite lancer manuellement ma recherche avec les critères que j'ai décidé en fonction de ce que j'ai compris de la requête de l'utilisateur.
Marsh Posté le 24-11-2004 à 15:44:15
OK, a m'a l'air pas mal. Payant par contre... Vais voir le prix (à la base, si je demande pour PHP/Linux, c'est pour des clients qui ne veulent pas payer pour leur serveur )
Euh...
Mais
Ca marche que sous Windows ???
Ben oui mais non, à ce moment on utilise Index Server, ça marche très bien et ça a l'avantage de pas coûter un centime de plus que la licence Windows
-- Edit : Ah non, j'ai rien dit, dans la page "download" il y a une version Unix qui est gratuite --
Marsh Posté le 24-11-2004 à 15:50:05
Arjuna > c'est de l'opensource, rien ne t'empeche de l'implementer.
http://fr.php.net/manual/fr/function.soundex.php
Marsh Posté le 24-11-2004 à 15:50:22
Oui voila c payant pour windows tout comme mysql normalement, mais pour unix (testé et approuve sous debian) c'est gratuit.
Marsh Posté le 24-11-2004 à 15:52:20
simogeo a écrit : Arjuna > c'est de l'opensource, rien ne t'empeche de l'implementer. |
Mouais. En effet, c'est à voir. Cela dit, soundex ne fait pas tout, j'ai surtout besoin de fuzzy (orthographe légèrement variable, prononciation comprise)
Cela dit, je ne vous pas trop comment faire bouffer 'H416' au moteur de recherche et lui faire comprendre que c'est "Hilbert" que je recherche
Marsh Posté le 24-11-2004 à 09:49:42
Salut.
On me demande ce qu'il existe comme moteurs de recherche utilisable avec PHP sur plateforme Linux (sur plateforme Windows, je préconise définitivement Index Server qui est présent pas défaut)
- Ce moteur de recherche doit indexer des documents sur le disque dur, que ce soit HTML, XML, DOC, XLS ou PDF (principalement).
- Lors d'une recherche, on doit pouvoir réduire le scope de recherche sur un répertoire donné, ou plusieurs répertoires à la fois (pas forcément inclus les uns dans les autres)
- Si possible, un lien avec une BDD MySQL ou PostGre serait le bien venu (pour récupérer un lien entre les fichiers et des éléments de la base par exemple, et filtrer les fichiers par ces éléments BDD), mais ce n'est pas du tout obligatoire.
J'ai rapidement commencé à cherché, et j'ai pas trouvé de moteur de recherche qui me convenait. Il faut notamment qu'il puisse indexer les meta des documents (sujet, auteur, etc.) et faire des recherches sur des "mots de la même famille", homonyme et pourquoi pas synonimes.
Merci pour votre éclairage.
Ha, et si la syntaxe d'interrogation pouvait être simple, ce serait pas mal (TextSearch de Microsoft reprends par exemple une syntaxe SQL)
Message édité par Arjuna le 24-11-2004 à 09:50:44