[Java] Récupération infos depuis page web

Récupération infos depuis page web [Java] - Java - Programmation

Marsh Posté le 27-07-2011 à 19:41:03    

Bonjour à tous,  
 
Je souhaiterais réaliser un petit programme JAVA me permettant de récupérer des informations contenues sur une (ou plutôt plusieurs) page web.
 
A l'heure actuelle, je dois :
- 1) me connecter sur l'URL d'accueil du site en question ;  
- 2) cliquer un lien (pas possible d'accéder directement à la page ciblée par le lien, le lien provoque en fait un javascript) ;  
- 3) saisir un nom dans sur la page (il s'agit d'un INPUT de type TEXT) ;  
- 4) cliquer sur un autre lien (idem étape 2) ;
- 5) lire les informations
- 6) parcourir les 20 pages de résultats une à une en cliquant à nouveau sur un lien pour passer d'une page à l'autre.
 
Je souhaiterais "automatiser" ce processus sachant que l'étape 5 se fera facilement à partir du code source de la page. Pensez-vous qu'un tel programme est réalisable et si oui pouvez-vous me donner des "pistes" (des exemples de classes existantes par exemple) me permettant de le réaliser ?
 
Je précise que ce programme est destiné à être exécuté une fois tous les deux mois pour lire le contenu d'une quarantaine de pages en tout ; pas dans le but de saturer un serveur...
 
D'avancer merci de votre aide.

Reply

Marsh Posté le 27-07-2011 à 19:41:03   

Reply

Marsh Posté le 28-07-2011 à 10:38:22    

HtmlUnit fait tout ce que tu veux (dont la prise en charge du JS) et bien plus, c'est une lib Java sous licence Apache 2.

Reply

Marsh Posté le 02-08-2011 à 15:04:36    

Selenium ??
 
http://seleniumhq.org/

Reply

Marsh Posté le 14-01-2012 à 16:21:49    

As-tu réalisé ton projet ?

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed