Lecture de données structurées (HTML ici) ? - Programmation
Marsh Posté le 05-02-2002 à 12:17:35
en Java tu as un parseur HTML built-in mais je ne sais pas quelle norme il respecte.
De manière générale, dirige toi vers un parseur HTML dans le language que tu utilises. Ensuite définis le pour qu'il fasse du processing sur ton document HTML. Une fois les infos extraites, c'est assez trivial de reconstruire un autre fichier.
Ta question, c'est quelle techno choisir ou comment faire?
Marsh Posté le 05-02-2002 à 12:18:30
callista a écrit a écrit : en Java tu as un parseur HTML built-in mais je ne sais pas quelle norme il respecte. De manière générale, dirige toi vers un parseur HTML dans le language que tu utilises. Ensuite définis le pour qu'il fasse du processing sur ton document HTML. Une fois les infos extraites, c'est assez trivial de reconstruire un autre fichier. Ta question, c'est quelle techno choisir ou comment faire? |
grrr ma copine s'est encore inscrite sur ma session
Marsh Posté le 05-02-2002 à 15:27:51
callista a écrit a écrit : Ta question, c'est quelle techno choisir ou comment faire? |
Vi en fait ma question c'est un peu ca... (sachant que je dois le faire en C#)
Car j'ai trouvé quelques pdf qui parlait de la lecture de données structurées, mais jamais de l'html en particulier... Et en plus ca fait souvent des centaines de pages plutôt archi technique et difficiles à comprendre...
Marsh Posté le 05-02-2002 à 15:59:56
bin si c'est en C# tu l'as ta techno. Regarde comment c'est gére dans ce language là. Je peux pas t'aider plus.
Marsh Posté le 05-02-2002 à 17:06:56
Mais qu'est-ce qu'il a ce msdn qui veut plus marcher !
En plus c'est la merde car j'ai po les privilèges pour le réinstaller...
Marsh Posté le 06-02-2002 à 09:15:36
Jesus Army a écrit a écrit : Je voudrais pouvoir lire une page html sequentiellement afin d'en faire un fichier texte classique sans certaines balises, de l'analyser et de faire des modifs dessus, puis de regenerer un troisième fichier html replacant les anciennes balises. Voila, c'est en gros ce dont j'ai besoin, et je voudrais surtout savoir comment m'y prendre pour lire ce type de données structurées.. |
vas sur mon site, j'ai fait un parser de html : c'est un composant pour delphi 4
http://perso.libertysurf.fr/chris.jav
Marsh Posté le 05-02-2002 à 12:10:18
Je voudrais pouvoir lire une page html sequentiellement afin d'en faire un fichier texte classique sans certaines balises, de l'analyser et de faire des modifs dessus, puis de regenerer un troisième fichier html replacant les anciennes balises.
Voila, c'est en gros ce dont j'ai besoin, et je voudrais surtout savoir comment m'y prendre pour lire ce type de données structurées..