Creation d'un site internet d'information

Creation d'un site internet d'information - HTML/CSS - Programmation

Marsh Posté le 17-11-2016 à 12:06:28    

Bonjour a tous  
 
je suis en train de regarder pour faire un site web interne qui permettrai de faire un concentrer d'info des unes/news/nouveau article ... de plein de sites internet (d'information, news constructeur, blog divers et variés... ) sur un domaine bien précis (c'est biensur moi qui donnerai la liste des sites à checker)
Dans le meilleurs des cas irai chercher ces articles et les mettraient en page (en fonction du site d'où ils proviennent) ou au moins irait chercher les nouveautés de ces sites et me les proposerait (pour que je les mette en page moi-même)  
 
Bien sûr tout ceci se fera avec l'accord des sites externes et en citant toujours les sources
 
Avez-vous une idée de comment faire ? Des outils ? ...
 
Par avance merci
 
 

Reply

Marsh Posté le 17-11-2016 à 12:06:28   

Reply

Marsh Posté le 17-11-2016 à 14:12:33    

En gros t'as eu l'idée mais sans la moindre idée de comment faire ? Tu pars de loin...
 
Un premier indice : "RSS"


---------------
Réalisation amplis classe D / T      Topic .Net - C# @ Prog
Reply

Marsh Posté le 17-11-2016 à 14:20:57    

Wordpress, RSS, PHP, MySQL, HTML/CSS et JS (peut-être) :o


---------------
Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta
Reply

Marsh Posté le 17-11-2016 à 14:21:35    

TotalRecall a écrit :

En gros t'as eu l'idée mais sans la moindre idée de comment faire ? Tu pars de loin...
 
Un premier indice : "RSS"


 
exactement
 
Si j'utilise du RSS il faut que les sites sources en ai , non ?

Reply

Marsh Posté le 17-11-2016 à 14:36:27    

ah oui, c'est le minimum. Sinon, tu seras obligé de faire du parsing des pages HTML et là, ça va être galère pour détecter les nouveaux articles. Cela dit, maintenant, tout site sérieux propose un flux RSS.


---------------
Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta
Reply

Marsh Posté le 17-11-2016 à 14:48:17    

C'est clair.
Parser du HTML pour ce genre d'usage c'est hyper casse gueule : tu ramasses pleins de trucs "inattendus" qu'il faut filtrer, il faut être capable de reconnaitre ce qui est nouveau de ce qui est connu, tu dois scanner à intervalle régulier, gérer la nav dans le site (crawling), et en cadeau si le design du site change du jour au lendemain ton parser est mort et t'es bon pour l'adapter à chaque fois.

 

De toute façon si tu as un "partenariat" avec les sites concernés ils seront capables de te fournir un truc moins horrible, genre un webservice ou un export brut dans un format convenu si jamais ils ne font pas de RSS.


Message édité par TotalRecall le 17-11-2016 à 14:49:08

---------------
Réalisation amplis classe D / T      Topic .Net - C# @ Prog
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed