Extraction chaine d'un fichier html

Extraction chaine d'un fichier html - Divers - Programmation

Marsh Posté le 19-07-2004 à 10:49:56    

bonjour,
 
Voilà, je souhaite extraire une chaine de caractères d'un fichier html.
Je sais pas comment m'y prendre.
 
Je souhaite extraire la ligne où il a un .zip sachant que le dat-4378.zip est amené à changer (dat-4379, dat-4380.... c'est des fichiers de signature de virus)

Code :
  1. 07/18/04 09:32      3,912,640 <A HREF="ftp://ftp.nai.com/pub/antivirus/datfiles/4.x/dat-4378.zip">dat-4378.zip</A>
  2. 07/18/04 09:32          1,299 <A HREF="ftp://ftp.nai.com/pub/antivirus/datfiles/4.x/delta.ini">delta.ini</A>


 
Si on pouvais me donner une piste parce que je n'ai pas d'idée sur quel language utiliser pour faire cela, juste que la chaine récupérer servira par la suite dans un batch.
Merci

Reply

Marsh Posté le 19-07-2004 à 10:49:56   

Reply

Marsh Posté le 19-07-2004 à 11:10:36    

Faisable avec tout langage gérant les expressions régulières :o


---------------
J'ai un string dans l'array (Paris Hilton)
Reply

Marsh Posté le 19-07-2004 à 11:13:31    

même que la regexp c :
 
dat-\d+


---------------
Jubi Photos : Flickr - 500px
Reply

Marsh Posté le 19-07-2004 à 11:14:28    

Harkonnen a écrit :

Faisable avec tout langage gérant les expressions régulières :o


 
ok disons que j'utilise un language que je connais , le c  :D  
si par hasard je reussi a resortir la chaine que je souhaite comment m'en resservir dans un bat?

Reply

Marsh Posté le 19-07-2004 à 11:23:56    

Jubijub a écrit :

même que la regexp c :
 
dat-\d+


 
 :??:  je comprend pas

Reply

Marsh Posté le 19-07-2004 à 11:26:09    

c'est la syntaxe d'une expression régulière...
 
ca veut dire en l'occurrence :  
- chaine commençant par dat-
- suivi de 1 ou + chiffres...
 
faut voir comment on peut les utiliser en C, et comment tu peux renvoyer la sortie dans un batch...
 
typiquement, si c pour un script, le perl me semble appliqué...
 
cherche expressions régulières ou regexp dans google


---------------
Jubi Photos : Flickr - 500px
Reply

Marsh Posté le 19-07-2004 à 15:16:38    

Bon voilà j'ai testé cela
 

Code :
  1. open(F,'q:\boulot\Wget_nav\index.html');
  2. $i=0;
  3. while($ligne=<F> ){
  4. if ( ($h) = ($ligne =~ /<A HREF=\"([^\"]+)\.zip">/)){
  5.  $lien=$h.".zip";
  6.  print "$lien\n";
  7.                 $i=$i+1;
  8. }
  9. }
  10. close F;


 
çà affiche ftp://ftp.nai.com/pub/antivirus/d [...] t-4378.zip
 
maintenant si il ya plusieur dat-XXXX.zip, dois-je utiliser un tableau pour stocker tout les liens?
 
Comment je peux récupérer la valeur de $lien pour s'en servir comme argument au lancement d'un batch?


Message édité par Profil supprimé le 19-07-2004 à 15:34:36
Reply

Marsh Posté le 19-07-2004 à 17:37:46    

bon laisser tomber j'ai réussi à faire ce que je voulais

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed