Access:extraire des données à partir de HTML

Access:extraire des données à partir de HTML - SQL/NoSQL - Programmation

Marsh Posté le 10-07-2006 à 14:30:00    

Bonjour,
 
Actuellement en stage, j'ai une mission de conception de base de données (Access) sur les bras.
 
Le problème ne concerne pas la conception mais l'importation de données. Je vais avoir une table concernant des pays, table qui va contenir des informations généralistes (surface,PIB, nb d'habitants... etc).
Or, l'objectif est d'y entrer des informations à jour, et de les maintenir automatiquement à jour.
 
Une des sources les plus connues (et dont la fiabilité serait suffisante pour ce qui va être fait de ces données), est le CIA World Factbook, dont les informations sont libres de droit.
Seulement, ces informations sont uniquement disponibles sous forme de pages HTML, ce qui rend moins évident leur traitement...
 
Quelle piste me conseilleriez vous pour extraire ces données et les importer dans ma base? Un parser pourrait fonctionner? Est il possible d'utiliser une solution à base de VBA (que je connais très peu)?


Message édité par Alphajet le 10-07-2006 à 15:42:58

---------------
Bien joué! Mais une brique ne rend jamais les coups.
Reply

Marsh Posté le 10-07-2006 à 14:30:00   

Reply

Marsh Posté le 12-07-2006 à 10:18:51    

Pas de propositions ?
 
J'ai fait des recherches, trouvé des logiciels sympas comme Happy Harvester mais qui est malheureusement payant...
 
Je ne peux pas non plus travailler à partir de sed ou autres outils Linux vu que dans ma boite c'est Windows partout.


---------------
Bien joué! Mais une brique ne rend jamais les coups.
Reply

Marsh Posté le 13-07-2006 à 09:08:21    

Salut,
 
tu peux pas parser ta page html en vba ?
 
:hello:

Reply

Marsh Posté le 13-07-2006 à 12:53:19    

Justement, j'aimerais savoir si c'est possible, et pas trop casse pied (je connais pas vraiment VBA)...


---------------
Bien joué! Mais une brique ne rend jamais les coups.
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed