Moteur de recherche ? - PHP - Programmation
Marsh Posté le 27-05-2008 à 14:45:44
Code :
|
Te reste plus qu'à parser la réponse!
Marsh Posté le 27-05-2008 à 16:26:09
aphelion a écrit : ok merci d'avoir été rapide |
il faut bien sur que le get_file_contents autorise les urls
Marsh Posté le 27-05-2008 à 17:11:30
ben pour le moment ca marche, mais mon seule souci c'est que je n'arrive pas a filtrer les informations, car la plupart du text obtenue est du HTML.
Marsh Posté le 27-05-2008 à 17:19:17
aphelion a écrit : car la plupart du text obtenue est du HTML. |
oui forcément
donc tu peux :
- parser le résultat (avec simple dom par exemple)
- ou utiliser l'API de google, ou d'un autre moteur
Marsh Posté le 27-05-2008 à 20:52:39
Citation : |
ben, j'ai utiliser la fonction strip_tags ($string); qui me retire toute les balises HTML.
maintenant plus qu'a utilisé des regex pour filtrer les URL (vu que c'est ce que je veux)
Code :
|
mais apparement j'aurai une faute dans ma synthaxe car quand je veux afficher le tableau, ben ca m'affiche rien ^^
Marsh Posté le 27-05-2008 à 23:11:46
Voila après 2h de réflexion,
je vous donne ma regex pour scanner des page susceptible d'être des liens URL.
Code :
|
il scan aussi bien les adresse IP que les page sans "http://" ou sans les www.
Mais, on obtient que les noms de domaine avec ce genre de regex, si vous voulez m'aider a la pofiner un peu c'est pas de refus
Marsh Posté le 28-05-2008 à 15:37:51
ben trop tard ^^ mais je suis curieux de savoir ce qu'est DOM. ca fait quoi ?
Marsh Posté le 28-05-2008 à 15:46:37
http://fr.wikipedia.org/wiki/Document_Object_Model
exemple de lib : http://simplehtmldom.sourceforge.net/
Marsh Posté le 29-05-2008 à 10:52:11
tu sai je suis un peu débutant, et peut etre un peu car j'ai rien compri sur tes site xD si t'avais un lien vers un cours compréhensible ou un bref exemple d'utilisation je comprendrais mieux ^^
Marsh Posté le 29-05-2008 à 15:09:08
aphelion a écrit : tu sai je suis un peu débutant, et peut etre un peu car j'ai rien compri sur tes site xD si t'avais un lien vers un cours compréhensible ou un bref exemple d'utilisation je comprendrais mieux ^^ |
Et bien par exemple, l'url http://www.google.fr/search?q=keyword contient le div <div id="res" style="padding-top: 11px; min-width: 500px;">
Ce div contient les résultats de la recherche.
Donc tu fais (en javascript, mais il existe des équivalents PHP)
Code :
|
Et après, en fonction de ce que tu cherches, tu te balades dans l'arborescence XML :
Code :
|
Te donnera un tableau qui contiendra tous les urls des liens ayant un attribut class="l"
Tu peux aussi te balader avec des trucs de ce genre :
a=div.childNodes[5];
childNodes étant le tableau de tous les éléments fils.
ou b=div.parentNode;
En fait, il y a énormément de possibilités pour parcourir du XML avec le DOM ...
http://fr.selfhtml.org/javascript/objets/node.htm en javascript
http://fr.php.net/manual/en/class.domnode.php en PHP
Par exemple en PHP
Code :
|
Marsh Posté le 27-05-2008 à 14:41:54
Bonjour,
j'aimerais créer un script qui me permette dentrer un mot clé dans un moteur de recherche et de recupéré les informations de la page obtenu.
si quelqun peut m'aider