[PHP] un script pour récupérer des infos sur Allocine ?

un script pour récupérer des infos sur Allocine ? [PHP] - PHP - Programmation

Marsh Posté le 12-10-2003 à 12:31:30    

Est ce que quelqu'un aurait eu vent d'un script permettant de récupérer des infos sur un film sur Allocine.com à partir de son id ?
 
Sinon quelle méthode utiliser pour parser les pages HTML ?
 
merci


Message édité par Lex le 12-10-2003 à 12:32:31
Reply

Marsh Posté le 12-10-2003 à 12:31:30   

Reply

Marsh Posté le 12-10-2003 à 12:57:57    

Lex a écrit :

Est ce que quelqu'un aurait eu vent d'un script permettant de récupérer des infos sur un film sur Allocine.com à partir de son id ?
 
Sinon quelle méthode utiliser pour parser les pages HTML ?
 
merci


 
C'est vendredi pour les trolls... [:ddr555]
 
Tu penses sérieusement que tu vas pouvoir te connecter à la base de données d'allo-ciné ?  :lol:  
 
Sinon, pour parser les pages en HTML, ben faut faire un script à la main, je vois que ça... Je ne suis pas sûr que ce soit très légal, et pas sûr non plus qu'on va te laisser faire très longtemps...


Message édité par Hermes le Messager le 12-10-2003 à 12:58:14
Reply

Marsh Posté le 12-10-2003 à 13:21:59    

Hermes le Messager a écrit :


et pas sûr non plus qu'on va te laisser faire très longtemps...


 
Ça fait plus de 1 an ½ que Ant Movie Catalog (mon soft de gestion de film) le fait, ils ont pas encore râlé :D (j'utilise un agent-id spécial, donc si ça provoque un surcharge de leur serveur ils devraient le voir).
 
Le script que j'ai fait et que j'utilise dans mon soft :
http://www.antp.be/temp/Allocine%2 [...] 20pic).ifs
 
(c'est pas du PHP, mais bon...)


Message édité par antp le 12-10-2003 à 13:24:58

---------------
mes programmes ·· les voitures dans les films ·· apprenez à écrire
Reply

Marsh Posté le 12-10-2003 à 17:52:15    

Merci antp, c'est le genre de script dont j'ai besoin ;)  
 
Je vais m'en peut-être m'en inspirer si ça ne te dérange pas :)
 
edit : mais bon avant de réinventer la roue je vais qd même essayer ton soft pour voir ce qu'il donne :D :D  :whistle:


Message édité par Lex le 12-10-2003 à 17:53:37
Reply

Marsh Posté le 12-10-2003 à 18:16:17    

Lex a écrit :


Je vais m'en peut-être m'en inspirer si ça ne te dérange pas :)


 
bah idéalement tu peux dire dans l'aboutbox ou la page "credits" ou autre tu du genre que l'importation Allociné est insipirée de moi :whistle:  
 

Lex a écrit :


edit : mais bon avant de réinventer la roue je vais qd même essayer ton soft pour voir ce qu'il donne :D :D  :whistle:  


 
Si tu fais un truc de gestion de film, tu peux tj essayer en effet...


Message édité par antp le 12-10-2003 à 18:16:37

---------------
mes programmes ·· les voitures dans les films ·· apprenez à écrire
Reply

Marsh Posté le 12-10-2003 à 19:12:26    

Ouaip, c'est pour gérer des films ;)  
 
Mon but n'est pas de faire une vraie appli que je vais distribuer mais un p'tit truc tout simple pour moi et ma copine avec les options minimums et un maximum d'automatisation ...

Reply

Marsh Posté le 23-01-2007 à 18:35:45    

Désolé de déterrer ce post, mais bon c'est exactement ce que je cherche et le script donné plus haut n'est plus valide.
 
Si vous avez des idées, merci.

Reply

Marsh Posté le 24-01-2007 à 19:58:41    

up

Reply

Marsh Posté le 25-01-2007 à 20:39:42    

up

Reply

Marsh Posté le 25-01-2007 à 20:47:22    

4 an apres il nest jamais trop tard....

Reply

Marsh Posté le 25-01-2007 à 20:47:22   

Reply

Marsh Posté le 25-01-2007 à 20:53:14    

red faction a écrit :

4 an apres il nest jamais trop tard....


 
Il n'est jamais trop tard.
 
Ne répondez pas : C'est interdit, car je m'arrange avec eux pour le copyright.

Reply

Marsh Posté le 25-01-2007 à 22:38:41    

Tiens mon topic :D
 
Si tu t'arranges avec eux, ben faut leur demaner un Web Service ou un feed XML.

Reply

Marsh Posté le 26-01-2007 à 12:59:55    

Lex a écrit :

Tiens mon topic :D
 
Si tu t'arranges avec eux, ben faut leur demaner un Web Service ou un feed XML.


 
Ils t'en ont fournis un ?
 
Leur XML n'est constitué que des dernières sorties, je doute qu'ils fassent la liste de toute leur BDD  [:petrus75]

Reply

Marsh Posté le 26-01-2007 à 13:27:43    

Non, perso j'avais finalement fait qq chose de simple et efficace.
 
Dans l'explorateur Windows : on fait un clic droit sur un fichier >> "chercher sur allocine" et hop ça ouvre IE avec la recherche ;)

Reply

Marsh Posté le 26-01-2007 à 15:59:30    

Lex a écrit :

Non, perso j'avais finalement fait qq chose de simple et efficace.
 
Dans l'explorateur Windows : on fait un clic droit sur un fichier >> "chercher sur allocine" et hop ça ouvre IE avec la recherche ;)


 
Non moi faut vraiment que ce soit du PHP. J'ai trouvé un truc avec cURL mais bon :/.

Reply

Marsh Posté le 26-01-2007 à 19:11:48    

Franchement, c'est archi trop compliqué de parser le code HTML de Allocine. Tu ferais mieux de laisser tomber, sauf si tu as 1 ou 2 mois devant toi  [:spamafote]


Message édité par Lex le 26-01-2007 à 19:11:59
Reply

Marsh Posté le 26-01-2007 à 19:49:43    

celui qui a besoin d1 a 2 mois pour faire ca ferait mieux de faire autre chose que de la programmation
 
a moins que les pages soients cryptees en SSL 192bits je vois pas comment ca peut prendre autant de temps....
 
 
un coup de regexp et c bon

Reply

Marsh Posté le 27-01-2007 à 15:11:48    

Vous pouvez me donner une idée de code et les fonctions que je dois utiliser ?
 
( J'ai pas trouvé regexp :(. )

Reply

Marsh Posté le 27-01-2007 à 18:11:34    

Reply

Marsh Posté le 28-01-2007 à 16:35:33    

Lex a écrit :

Non, perso j'avais finalement fait qq chose de simple et efficace.
 
Dans l'explorateur Windows : on fait un clic droit sur un fichier >> "chercher sur allocine" et hop ça ouvre IE avec la recherche ;)


Ton truc m'interesse beaucoup pour voir directement les détails d'un fichier fim :)
Tu le partages?

Reply

Marsh Posté le 28-01-2007 à 18:48:02    

( Les Regex ca torture vraiment le cerveau :o )

Reply

Marsh Posté le 28-01-2007 à 20:51:55    

Premières idées venues :
 

Code :
  1. $html = file_get_contents("http://www.allocine.fr/filmblabla.htm" );
  2. // La je dois isoler les lignes concernées mais pas d'idée  :sweat:  
  3. $html = preg_replace('#<h1 style="color: #D20000"><b>(.+)</b>#i', '<b>Film :</b> $2', $html);
  4. echo $html;

Reply

Marsh Posté le 28-01-2007 à 21:10:05    

preg_match
 
tu veux pas quon te fasse le script non plus

Reply

Marsh Posté le 28-01-2007 à 21:11:35    

Fused a écrit :

Ton truc m'interesse beaucoup pour voir directement les détails d'un fichier fim :)
Tu le partages?


 
C'est plutot simple en fait ;)
 
Faire un .bat genre (à modifier selon les URLS actuelles de Allocine)
 

Code :
  1. start "Titre" "C:\Program Files\Internet Explorer\iexplore.exe" "http://www.allocine.fr/recherche/?f=3&rub=0&motcle=%~n1"


 
et associer ce .bat dans l'Explorateur Windows > Outils > Options des Dossiers > Types de ficheirs > .avi

Reply

Marsh Posté le 28-01-2007 à 21:13:04    

red faction a écrit :

celui qui a besoin d1 a 2 mois pour faire ca ferait mieux de faire autre chose que de la programmation
 
a moins que les pages soients cryptees en SSL 192bits je vois pas comment ca peut prendre autant de temps....
 
 
un coup de regexp et c bon


 
Je compte la maintenance que cela engendre (lorsque Allociné change son code par ex), et contourner leurs systèmes de protection. Car plein de malins allimentent leurs bases comme ça.

Reply

Marsh Posté le 28-01-2007 à 21:33:26    

red faction a écrit :

preg_match
 
tu veux pas quon te fasse le script non plus


 
M'aider au moins  :sweat:

Reply

Marsh Posté le 28-01-2007 à 23:14:44    

Fais déjà voir la partie de la source html qui contient ce que tu veux récupérer (dans des balises code... et laisse tomber si c'est beaucoup trop volumineux).

Reply

Marsh Posté le 30-01-2007 à 02:26:19    

Lex a écrit :

C'est plutot simple en fait ;)
 
Faire un .bat genre (à modifier selon les URLS actuelles de Allocine)
 

Code :
  1. start "Titre" "C:\Program Files\Internet Explorer\iexplore.exe" "http://www.allocine.fr/recherche/?f=3&rub=0&motcle=%~n1"


 
et associer ce .bat dans l'Explorateur Windows > Outils > Options des Dossiers > Types de ficheirs > .avi


Merci :)
 
Très simple en effet mais efficace! Il fallait y penser!

Reply

Marsh Posté le 31-01-2007 à 22:35:33    

Merci j'ai compris ce qu'était les regex et le fonctionnement de preg_match.
 
J'ai reussi à intercepter tout ce que je souhaitais sur la page.
 
Mais un gros problème devant moi : La page de recherche.
 
Bon déjà je met un formulaire qui donne :
 
http://www.allocine.fr/recherche/?motcle=<? echo $_POST['nom']; ?>&f=4&rub=0
 
Après je recupère le nombre de Films avec preg_match ( Il renvoie "Films
(x réponses)" ).
 
Mais après je sèche un peu.
 
Je pensais faire une boucle for ($i=0;$i<$nbreponse;i++)
 
Et que pour chacun il rajoute une partie de regex. Mais là ...
 
 
Voilà j'espère que vous pourrez m'éclairer.

Reply

Marsh Posté le 01-02-2007 à 09:40:21    

Quand je disais qu'il fallait un mois ou deux ...

Reply

Marsh Posté le 01-02-2007 à 10:03:59    

heu tu veux faire quoi sur la page de recherche exactement ?
 
sinon pas besoin de "un mois ou deux" faut pas exagérer

Reply

Marsh Posté le 01-02-2007 à 20:06:57    

Lex a écrit :

Quand je disais qu'il fallait un mois ou deux ...


 
M'a même pas fallu 1 semaine pour dégrossir déjà pas mal.
 

soju a écrit :

heu tu veux faire quoi sur la page de recherche exactement ?
 
sinon pas besoin de "un mois ou deux" faut pas exagérer


 
Je souhaite que depuis mon site on puisse faire une recherche sur Allocine, qu'il liste les réponses, qu'on puisse choisir ( bouton radio ) et qu'il récupère le tout.

Reply

Marsh Posté le 01-02-2007 à 20:19:34    


 
Déjà fait gaffe avec le echo $_POST['nom'], t'as une grosse faille XSS. Ne jamais afficher directement une donnée provenant de l'extérieur (à moins que la source soit 100% sûre éventuellement, mais certainement pas pour un visiteur lambda donc).
 
Bref : utilise htmlentities/htmlspecialchars (éventuellement combiné à du urlencode dans ton cas).
 
Pour le reste, commence par faire un print_r sur le troisième paramètre ("matches" ) de preg_replace après l'avoir exécuté. Tu verras comment il récupère les données (sachant que le comportement peut être changé, voir doc), et à partir de là fais la boucle adaptée.

Message cité 1 fois
Message édité par sielfried le 01-02-2007 à 20:20:19

---------------
StarCraft Professional Gaming Database | [Ze Topic] Starcraft/BroodWar
Reply

Marsh Posté le 01-02-2007 à 22:34:41    

sielfried a écrit :

Déjà fait gaffe avec le echo $_POST['nom'], t'as une grosse faille XSS. Ne jamais afficher directement une donnée provenant de l'extérieur (à moins que la source soit 100% sûre éventuellement, mais certainement pas pour un visiteur lambda donc).
 
Bref : utilise htmlentities/htmlspecialchars (éventuellement combiné à du urlencode dans ton cas).
 
Pour le reste, commence par faire un print_r sur le troisième paramètre ("matches" ) de preg_replace après l'avoir exécuté. Tu verras comment il récupère les données (sachant que le comportement peut être changé, voir doc), et à partir de là fais la boucle adaptée.


 
Le $_POST['nom'] c'était juste pour la démonstration. Merci pour le conseil de htmlentities/htmlspecialchars/urlencode.
 
Mais le problème vient de la boucle ... Je vois pas comment faire.

Reply

Marsh Posté le 01-02-2007 à 22:46:19    

Je n'ai qu'une chose a vous dire : SEARCH THE FUCKING WEB ! :o
 
http://nepomiachty.developpez.com/ [...] /index.php
 
Un pas a pas pour parser ... allociné.

Reply

Marsh Posté le 01-02-2007 à 23:02:39    


 
Fais voir ce qu'affiche ton print_r.


---------------
StarCraft Professional Gaming Database | [Ze Topic] Starcraft/BroodWar
Reply

Marsh Posté le 02-02-2007 à 13:34:14    

WiiDS a écrit :

Je n'ai qu'une chose a vous dire : SEARCH THE FUCKING WEB ! :o
 
http://nepomiachty.developpez.com/ [...] /index.php
 
Un pas a pas pour parser ... allociné.


 
Déjà vu .. Mais ils utilisent cURL. Vais voir ce que je peux faire à partir de ça.
 

sielfried a écrit :

Fais voir ce qu'affiche ton print_r.


 
Désolé je peux pas desuite.

Reply

Marsh Posté le 02-02-2007 à 15:04:40    

La méthode de Developpez est pas mal. Il utilise les strpos et les sbustr. Je vais tenter çe côté là :o.

Reply

Marsh Posté le 23-04-2007 à 15:53:20    

Hello,  
 
des nouvelles sur ce script d'interrogation Allocine en php ?
 
Je suis très intéressé...
 
 
Vinz.

Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed