Matching entre profils utilisateurs dans une base - Algo - Programmation
MarshPosté le 31-07-2005 à 14:07:21
Bonjour,
Y-a-t-il des pros du data mining dans la salle ?
Je ne trouve pas la moindre info, si quelqu'un pouvait m'aider en me mettant sur la piste, ca serait sympa....
Cas fictif, mais qui pourrait m'aider a expliquer :
Soit une base de donnees utilisateurs comportant plusieurs millions d'utilisateurs. (d'ou l'interet d'utiliser des vrais algos, pas des trucs a l'arrache)
Chaque utilisateur possede des attributs : sexe, age, poids, ville, etc...
Comment effectuer une recherche, un "match", entre deux profils de maniere la plus efficace possible ?...
Par exemple une personne A recherche qqun de X ans et d'un poids Y.
Le but etant de ressortir les profils les plus pertinants et d'eviter les profils qui ne le sont pas.
Mais de maniere optimisee, c'est a dire, ne pas lire 100% des enregistrements de la table, et ne pas les comparer betement a un a un....
Limiter le nombre d'enregistrement a prendre, je vois a peu pres....
Il me suffit dans mon SELECT de limiter en prenant les criteres de selections tres important et discrimants...
Genre : SELECT * FROM users WHERE age > x_min AND age < x_max AND {CRITERES IMPORTANTS ICI}
Supposons que de 10'000'000 d'enregistrements, je sois passe a un echantillon de 50'000...
C'est une enorme avancee, mais 50'000 enregistrements a comparer betement dans une boucle ca prend du temps quand meme....
Il y a surement des moyens mathematiques de faire ressortir que les n profils les plus pertinents rapidement....
Bref, si vous avez la moindre idee ou indice, je suis preneur
Merci beaucoup
Message édité par rebirth2k1 le 31-07-2005 à 20:19:09
Marsh Posté le 31-07-2005 à 14:07:21
Bonjour,
?
Y-a-t-il des pros du data mining dans la salle
Je ne trouve pas la moindre info, si quelqu'un pouvait m'aider en me mettant sur la piste, ca serait sympa....
Cas fictif, mais qui pourrait m'aider a expliquer :
Soit une base de donnees utilisateurs comportant plusieurs millions d'utilisateurs. (d'ou l'interet d'utiliser des vrais algos, pas des trucs a l'arrache)
Chaque utilisateur possede des attributs : sexe, age, poids, ville, etc...
Comment effectuer une recherche, un "match", entre deux profils de maniere la plus efficace possible ?...
Par exemple une personne A recherche qqun de X ans et d'un poids Y.
Le but etant de ressortir les profils les plus pertinants et d'eviter les profils qui ne le sont pas.
Mais de maniere optimisee, c'est a dire, ne pas lire 100% des enregistrements de la table, et ne pas les comparer betement a un a un....
Limiter le nombre d'enregistrement a prendre, je vois a peu pres....
Il me suffit dans mon SELECT de limiter en prenant les criteres de selections tres important et discrimants...
Genre : SELECT * FROM users WHERE age > x_min AND age < x_max AND {CRITERES IMPORTANTS ICI}
Supposons que de 10'000'000 d'enregistrements, je sois passe a un echantillon de 50'000...
C'est une enorme avancee, mais 50'000 enregistrements a comparer betement dans une boucle ca prend du temps quand meme....
Il y a surement des moyens mathematiques de faire ressortir que les n profils les plus pertinents rapidement....
Bref, si vous avez la moindre idee ou indice, je suis preneur
Merci beaucoup
Message édité par rebirth2k1 le 31-07-2005 à 20:19:09