Fulltext et Fuzzy search sur SQL Server

Fulltext et Fuzzy search sur SQL Server - SQL/NoSQL - Programmation

Marsh Posté le 12-07-2012 à 14:47:43    

Bonjour,
 
Nous avons une base qui contient plusieurs milions de champs VARCHAR(MAX) sur SQL Server 2008 R2.
Nous aurions besoin de faire une recherche dessus pour chercher des noms de famille en trouvant aussi ceux avec des typos. Donc si je cherche Charles Dupont, je devrais matcher Chorles Dupond .
 
Vous avez une idée de comment on peut s'y prendre? Pour le moment la seule option qu'on a trouvé serait de lister tous les typos possibles et de jouer avec le full text search .. Donc vraiment pas optimal.
 
Merci d'avance pour vos idées!


---------------
Si la vérité est découverte par quelqu'un d'autre,elle perd toujours un peu d'attrait
Reply

Marsh Posté le 12-07-2012 à 14:47:43   

Reply

Marsh Posté le 13-07-2012 à 08:32:30    

Tu peux essayer SOUNDEX (http://msdn.microsoft.com/en-us/library/ms187384%28v=sql.105%29.aspx) et DIFFERENCE (http://msdn.microsoft.com/en-us/library/ms188753%28v=sql.105%29.aspx).
C'est pas parfait (en fait c'est meme loin d'etre parfait :) ) mais ca fonctionne super pour les noms/prenom ou les mots aves des typos assez courante.
 
Sinon SSIS a un Fuzzy lookup (http://msdn.microsoft.com/en-us/library/ms137786%28v=sql.105%29.aspx) qui fonctionne super et qui est configurable, mais pas tres utile pour une recherche interactive.

Reply

Marsh Posté le 13-07-2012 à 09:09:35    

Salut,
 
J'ai regardé les deux premières solutions et il me semble qu'il faut leur donner une chaine de caractères en entrer non? Il faudrait donc que je fasse un curseur sur tous les éléments de ma colonne? Je suis pas sûr que ça marche parce qu'on a plusieurs milions d'éléments ..
 
Je regarde SSIS maintenant et je reviens. Merci!


---------------
Si la vérité est découverte par quelqu'un d'autre,elle perd toujours un peu d'attrait
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed