Récupération données .html dans un fichier .txt

Récupération données .html dans un fichier .txt - Perl - Programmation

Marsh Posté le 06-03-2008 à 15:46:43    

Bonjour à tous,
 
Je souhaiterai créer un programme Perl, pour :
-prendre en entrée (Input) un fichier .html. Et grâce à ce programme .pl
-créer un fichier texte en sortie (Output), pour récupérer des informations précises dans la page .html.
 
Je m'explique dans un exemple :
C'est une page .html qui concerne la liaison entre gênes, maladies et médicaments.
Et je voudrais grâce au programme parcourir et ressortir dans un fichier texte que 3 informations : les noms du gêne, du médicament et de la maladie.
 
Je suis débubante dans ce langage, donc si vous pouvez me donner quelques pistes...On m'a parlée de "parsage d'un fichier", "expressions régulières"...
 
Je vous remercie

Reply

Marsh Posté le 06-03-2008 à 15:46:43   

Reply

Marsh Posté le 06-03-2008 à 15:48:07    

avec le module HTML::Parser

Reply

Marsh Posté le 06-03-2008 à 15:51:46    

Merci, mais pourrais tu me donner plus d'informations...
Je n'arrête pas d'effectuer des recherches, mais c'est assez mal expliquées et souvent compliquées..
 
++

Reply

Marsh Posté le 06-03-2008 à 16:33:28    

Documentation sur les modules : http://perldoc.perl.org/perlmod.html
 
HTML Parser : http://search.cpan.org/~gaas/HTML- [...] /Parser.pm
 
Et de manière plus générale :
Documentation complète sur PERL : http://perldoc.perl.org
CPAN (catalogue de modules PERL) : http://search.cpan.org

Reply

Marsh Posté le 06-03-2008 à 17:07:28    

Merci beaucoup pour toutes ces informations !!!
 
Avant de me lancer dans un gros truc, j'essaie tout d'abord de prendre des informations d'un simple texte, pour les renvoyé sur un autre texte...
Par exemple:
 
Test1.txt :
/////
voila un fichier exemple dont il faut extraire des choses,
 
gene:LDLR,
drug:atrovastatine,
disease: hypecholesterolemia
/////
 
Et grâce à un programme Perl, je pourrai ressortir sur un autre fichier texte seulement :
 
Test2.txt :
/////
LDLR
astrovastatine
hypecholesterolemia
/////
 
 
Cependant je ne manipule pas encore assez bien Perl, pourrai vous m'aider à commencer ce programme
 
Merci

Reply

Marsh Posté le 06-03-2008 à 17:26:45    

Code :
  1. #!/usr/bin/perl


---------------
Software and cathedrals are much the same - first we build them, then we pray.
Reply

Marsh Posté le 06-03-2008 à 17:37:14    

???

Reply

Marsh Posté le 06-03-2008 à 18:07:10    

Il t'aide à commencer ton programme.

Reply

Marsh Posté le 06-03-2008 à 18:11:52    

oui voila :o
 
Dit autrement, montre ce que tu as déjà fait pour qu'on t'aide et non qu'on te fasse...


---------------
Software and cathedrals are much the same - first we build them, then we pray.
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed