un script pour récupérer des infos sur Allocine ? [PHP] - PHP - Programmation
Marsh Posté le 12-10-2003 à 12:57:57
Lex a écrit : Est ce que quelqu'un aurait eu vent d'un script permettant de récupérer des infos sur un film sur Allocine.com à partir de son id ? |
C'est vendredi pour les trolls...
Tu penses sérieusement que tu vas pouvoir te connecter à la base de données d'allo-ciné ?
Sinon, pour parser les pages en HTML, ben faut faire un script à la main, je vois que ça... Je ne suis pas sûr que ce soit très légal, et pas sûr non plus qu'on va te laisser faire très longtemps...
Marsh Posté le 12-10-2003 à 13:21:59
Hermes le Messager a écrit : |
Ça fait plus de 1 an ½ que Ant Movie Catalog (mon soft de gestion de film) le fait, ils ont pas encore râlé (j'utilise un agent-id spécial, donc si ça provoque un surcharge de leur serveur ils devraient le voir).
Le script que j'ai fait et que j'utilise dans mon soft :
http://www.antp.be/temp/Allocine%2 [...] 20pic).ifs
(c'est pas du PHP, mais bon...)
Marsh Posté le 12-10-2003 à 17:52:15
Merci antp, c'est le genre de script dont j'ai besoin
Je vais m'en peut-être m'en inspirer si ça ne te dérange pas
edit : mais bon avant de réinventer la roue je vais qd même essayer ton soft pour voir ce qu'il donne
Marsh Posté le 12-10-2003 à 18:16:17
Lex a écrit : |
bah idéalement tu peux dire dans l'aboutbox ou la page "credits" ou autre tu du genre que l'importation Allociné est insipirée de moi
Lex a écrit : |
Si tu fais un truc de gestion de film, tu peux tj essayer en effet...
Marsh Posté le 12-10-2003 à 19:12:26
Ouaip, c'est pour gérer des films
Mon but n'est pas de faire une vraie appli que je vais distribuer mais un p'tit truc tout simple pour moi et ma copine avec les options minimums et un maximum d'automatisation ...
Marsh Posté le 23-01-2007 à 18:35:45
Désolé de déterrer ce post, mais bon c'est exactement ce que je cherche et le script donné plus haut n'est plus valide.
Si vous avez des idées, merci.
Marsh Posté le 25-01-2007 à 20:47:22
ReplyMarsh Posté le 25-01-2007 à 20:53:14
red faction a écrit : 4 an apres il nest jamais trop tard.... |
Il n'est jamais trop tard.
Ne répondez pas : C'est interdit, car je m'arrange avec eux pour le copyright.
Marsh Posté le 25-01-2007 à 22:38:41
Tiens mon topic
Si tu t'arranges avec eux, ben faut leur demaner un Web Service ou un feed XML.
Marsh Posté le 26-01-2007 à 12:59:55
Lex a écrit : Tiens mon topic |
Ils t'en ont fournis un ?
Leur XML n'est constitué que des dernières sorties, je doute qu'ils fassent la liste de toute leur BDD
Marsh Posté le 26-01-2007 à 13:27:43
Non, perso j'avais finalement fait qq chose de simple et efficace.
Dans l'explorateur Windows : on fait un clic droit sur un fichier >> "chercher sur allocine" et hop ça ouvre IE avec la recherche
Marsh Posté le 26-01-2007 à 15:59:30
Lex a écrit : Non, perso j'avais finalement fait qq chose de simple et efficace. |
Non moi faut vraiment que ce soit du PHP. J'ai trouvé un truc avec cURL mais bon .
Marsh Posté le 26-01-2007 à 19:11:48
Franchement, c'est archi trop compliqué de parser le code HTML de Allocine. Tu ferais mieux de laisser tomber, sauf si tu as 1 ou 2 mois devant toi
Marsh Posté le 26-01-2007 à 19:49:43
celui qui a besoin d1 a 2 mois pour faire ca ferait mieux de faire autre chose que de la programmation
a moins que les pages soients cryptees en SSL 192bits je vois pas comment ca peut prendre autant de temps....
un coup de regexp et c bon
Marsh Posté le 27-01-2007 à 15:11:48
Vous pouvez me donner une idée de code et les fonctions que je dois utiliser ?
( J'ai pas trouvé regexp . )
Marsh Posté le 27-01-2007 à 18:11:34
http://fr3.php.net/file_get_contents
http://fr3.php.net/preg_match
http://www.regular-expressions.info/
Marsh Posté le 28-01-2007 à 13:55:07
sielfried a écrit : http://fr3.php.net/file_get_contents |
Merci beaucoup
Marsh Posté le 28-01-2007 à 16:35:33
Lex a écrit : Non, perso j'avais finalement fait qq chose de simple et efficace. |
Ton truc m'interesse beaucoup pour voir directement les détails d'un fichier fim
Tu le partages?
Marsh Posté le 28-01-2007 à 20:51:55
Premières idées venues :
Code :
|
Marsh Posté le 28-01-2007 à 21:10:05
ReplyMarsh Posté le 28-01-2007 à 21:11:35
Fused a écrit : Ton truc m'interesse beaucoup pour voir directement les détails d'un fichier fim |
C'est plutot simple en fait
Faire un .bat genre (à modifier selon les URLS actuelles de Allocine)
Code :
|
et associer ce .bat dans l'Explorateur Windows > Outils > Options des Dossiers > Types de ficheirs > .avi
Marsh Posté le 28-01-2007 à 21:13:04
red faction a écrit : celui qui a besoin d1 a 2 mois pour faire ca ferait mieux de faire autre chose que de la programmation |
Je compte la maintenance que cela engendre (lorsque Allociné change son code par ex), et contourner leurs systèmes de protection. Car plein de malins allimentent leurs bases comme ça.
Marsh Posté le 28-01-2007 à 21:33:26
ReplyMarsh Posté le 28-01-2007 à 23:14:44
Fais déjà voir la partie de la source html qui contient ce que tu veux récupérer (dans des balises code... et laisse tomber si c'est beaucoup trop volumineux).
Marsh Posté le 30-01-2007 à 02:26:19
Lex a écrit : C'est plutot simple en fait
|
Merci
Très simple en effet mais efficace! Il fallait y penser!
Marsh Posté le 31-01-2007 à 22:35:33
Merci j'ai compris ce qu'était les regex et le fonctionnement de preg_match.
J'ai reussi à intercepter tout ce que je souhaitais sur la page.
Mais un gros problème devant moi : La page de recherche.
Bon déjà je met un formulaire qui donne :
http://www.allocine.fr/recherche/?motcle=<? echo $_POST['nom']; ?>&f=4&rub=0
Après je recupère le nombre de Films avec preg_match ( Il renvoie "Films
(x réponses)" ).
Mais après je sèche un peu.
Je pensais faire une boucle for ($i=0;$i<$nbreponse;i++)
Et que pour chacun il rajoute une partie de regex. Mais là ...
Voilà j'espère que vous pourrez m'éclairer.
Marsh Posté le 01-02-2007 à 09:40:21
ReplyMarsh Posté le 01-02-2007 à 10:03:59
heu tu veux faire quoi sur la page de recherche exactement ?
sinon pas besoin de "un mois ou deux" faut pas exagérer
Marsh Posté le 01-02-2007 à 20:06:57
Lex a écrit : Quand je disais qu'il fallait un mois ou deux ... |
M'a même pas fallu 1 semaine pour dégrossir déjà pas mal.
soju a écrit : heu tu veux faire quoi sur la page de recherche exactement ? |
Je souhaite que depuis mon site on puisse faire une recherche sur Allocine, qu'il liste les réponses, qu'on puisse choisir ( bouton radio ) et qu'il récupère le tout.
Marsh Posté le 01-02-2007 à 20:19:34
Déjà fait gaffe avec le echo $_POST['nom'], t'as une grosse faille XSS. Ne jamais afficher directement une donnée provenant de l'extérieur (à moins que la source soit 100% sûre éventuellement, mais certainement pas pour un visiteur lambda donc).
Bref : utilise htmlentities/htmlspecialchars (éventuellement combiné à du urlencode dans ton cas).
Pour le reste, commence par faire un print_r sur le troisième paramètre ("matches" ) de preg_replace après l'avoir exécuté. Tu verras comment il récupère les données (sachant que le comportement peut être changé, voir doc), et à partir de là fais la boucle adaptée.
Marsh Posté le 01-02-2007 à 22:34:41
sielfried a écrit : Déjà fait gaffe avec le echo $_POST['nom'], t'as une grosse faille XSS. Ne jamais afficher directement une donnée provenant de l'extérieur (à moins que la source soit 100% sûre éventuellement, mais certainement pas pour un visiteur lambda donc). |
Le $_POST['nom'] c'était juste pour la démonstration. Merci pour le conseil de htmlentities/htmlspecialchars/urlencode.
Mais le problème vient de la boucle ... Je vois pas comment faire.
Marsh Posté le 01-02-2007 à 22:46:19
Je n'ai qu'une chose a vous dire : SEARCH THE FUCKING WEB !
http://nepomiachty.developpez.com/ [...] /index.php
Un pas a pas pour parser ... allociné.
Marsh Posté le 01-02-2007 à 23:02:39
Fais voir ce qu'affiche ton print_r.
Marsh Posté le 02-02-2007 à 13:34:14
WiiDS a écrit : Je n'ai qu'une chose a vous dire : SEARCH THE FUCKING WEB ! |
Déjà vu .. Mais ils utilisent cURL. Vais voir ce que je peux faire à partir de ça.
sielfried a écrit : Fais voir ce qu'affiche ton print_r. |
Désolé je peux pas desuite.
Marsh Posté le 02-02-2007 à 15:04:40
La méthode de Developpez est pas mal. Il utilise les strpos et les sbustr. Je vais tenter çe côté là .
Marsh Posté le 23-04-2007 à 15:53:20
Hello,
des nouvelles sur ce script d'interrogation Allocine en php ?
Je suis très intéressé...
Vinz.
Marsh Posté le 12-10-2003 à 12:31:30
Est ce que quelqu'un aurait eu vent d'un script permettant de récupérer des infos sur un film sur Allocine.com à partir de son id ?
Sinon quelle méthode utiliser pour parser les pages HTML ?
merci
Message édité par Lex le 12-10-2003 à 12:32:31