Un aspirateur de site ?

Un aspirateur de site ? - Logiciels - Linux et OS Alternatifs

Marsh Posté le 19-04-2003 à 10:41:31    

Bonjour je cherche un soft (si possible dispo en paquet Debian) pour "aspirer" les sites. Si en plus ça pouvai avoir une GUI...  :hello:

Reply

Marsh Posté le 19-04-2003 à 10:41:31   

Reply

Marsh Posté le 19-04-2003 à 10:44:07    

je connais que wget et il a pas de GUI.

Reply

Marsh Posté le 19-04-2003 à 10:56:57    

Putain c'est génial ce truc ! Par contre j'ai pas trouvé d'option pour ne pas lui dire de sortir du nom de domaine du site qu'on aspire. C'est normal ou j'ai mal cherché ?

Reply

Marsh Posté le 19-04-2003 à 11:18:57    

mal cherché
 
-m = mirror, en principe il va pas trop loin...


---------------
Bitcoin, Magical Thinking, and Political Ideology
Reply

Marsh Posté le 19-04-2003 à 11:22:15    

et aussi -np (no parent) pour lui dire de ne pas remonter dans l'arborescence du site s'il y a des liens qui y mène.

Reply

Marsh Posté le 24-04-2003 à 21:56:03    

Il y a httrack, très efficace.
et son interface graphique sous KDE, khttrack.

Reply

Marsh Posté le 10-02-2005 à 10:23:42    

il y a également une extension Firefox :
Spiderzilla.
 
Pas testé.
 
khttrack à l'air très bien. Je vais l'installer.


Message édité par Profil supprimé le 10-02-2005 à 10:24:13
Reply

Marsh Posté le 10-02-2005 à 10:34:18    

httrack +1
Jamais testé de front end.

Reply

Marsh Posté le 10-02-2005 à 10:36:37    

httrack forever ! :o


---------------
-~- Libérez Datoune ! -~- Camarade, toi aussi rejoins le FLD pour que la flamme de la Révolution ne s'éteigne pas ! -~- A VENDRE
Reply

Marsh Posté le 21-02-2005 à 15:22:24    

Bonjour  :) ,
 
Suite à vos échanges, j'ai utiliser HTTrack pour aspirer un site mais il n'a que partiellement répondu à mon attente  :( .
En effet, ce site dispose de 2 "portails". Un tout public et un avec un accès réservé (login + mot de passe).
Le téléchargement de la 1ère partie est très bien mais le téléchargement de la seconde partie ne se fait pas.
Je précise que je rentre le login et le mot de passe lors du choix de l'URL à télécharger dans HTTrack mais rien n'y fait.
 
Comment dois-je procéder pour accéder hors connexion à la partie "réservé" ?
Je sais que certains sites se protègent contre les aspirateurs, existe-t'il un procédé pour contourner ces protections ?
 
Merci de votre aide.
 
Johann

Reply

Marsh Posté le 21-02-2005 à 15:22:24   

Reply

Marsh Posté le 21-02-2005 à 15:42:01    

Ben c po bien ça de contourner les protections ^^

Reply

Marsh Posté le 21-02-2005 à 20:36:17    

IQJG a écrit :

Bonjour  :) ,
 
Suite à vos échanges, j'ai utiliser HTTrack pour aspirer un site mais il n'a que partiellement répondu à mon attente  :( .
En effet, ce site dispose de 2 "portails". Un tout public et un avec un accès réservé (login + mot de passe).
Le téléchargement de la 1ère partie est très bien mais le téléchargement de la seconde partie ne se fait pas.
Je précise que je rentre le login et le mot de passe lors du choix de l'URL à télécharger dans HTTrack mais rien n'y fait.
 
Comment dois-je procéder pour accéder hors connexion à la partie "réservé" ?
Je sais que certains sites se protègent contre les aspirateurs, existe-t'il un procédé pour contourner ces protections ?
 
Merci de votre aide.
 
Johann


 
le meilleur des meilleurs des aspirateurs, c'est inconstestablement wget. Ce qui est amusant j'ai voulu le telecharger à mon taf pour tester la connexion du firewall, et bien je n'ai meme pas pu le dezipper. Panda antivirus, le considerer comme un outil de hacker. Sur ce point il a pas tout a faire tort. Ce logiciel, c''est une brute.
 
Pour faire passer le login et le pass, je conseille de le faire par l'adresse (http://monlogin:monpass@monurl.com) et non pas par les option --password et --login (ou un truc dans le ganre)
 

Reply

Marsh Posté le 22-02-2005 à 08:17:48    

[quote=639759,0,11,68046]Ben c po bien ça de contourner les protections ^^[/quote]
 
Ok mais ça pas avancer le problème...

Reply

Marsh Posté le 22-02-2005 à 08:18:52    

[quote=639917,0,12,54005]le meilleur des meilleurs des aspirateurs, c'est inconstestablement wget. Ce qui est amusant j'ai voulu le telecharger à mon taf pour tester la connexion du firewall, et bien je n'ai meme pas pu le dezipper. Panda antivirus, le considerer comme un outil de hacker. Sur ce point il a pas tout a faire tort. Ce logiciel, c''est une brute.
 
Pour faire passer le login et le pass, je conseille de le faire par l'adresse (http://monlogin:monpass@monurl.com) et non pas par les option --password et --login (ou un truc dans le ganre)[/quote]
 
Je vais essayer Wget.
Merci.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed