Protection contre les aspirateurs de site.

Protection contre les aspirateurs de site. - HTML/CSS - Programmation

Marsh Posté le 10-07-2007 à 11:52:02    

bonjour,
est-ce que vous sauriez comment portéger un site centre les aspirateurs de site ?


Message édité par chrisllers le 10-07-2007 à 11:52:32
Reply

Marsh Posté le 10-07-2007 à 11:52:02   

Reply

Marsh Posté le 10-07-2007 à 12:51:15    

on ne peut pas. Si ton site est consultable, il est aspirable.


---------------
Can't buy what I want because it's free -
Reply

Marsh Posté le 10-07-2007 à 13:54:04    

si j' ai vu qu' on pouvait le faire, mais j' ai besoin de précision sur la méthode.
essaie d' aspirer le site du zéro par exemple.
http://www.toulouse-renaissance.ne [...] access.htm

Reply

Marsh Posté le 10-07-2007 à 13:57:24    

Non. Si quelqu'un veut vraiment aspirer ton site, rien ne l'empêchera. Et surtout pas avec seulement une vérification sur l'user-agent.:o


---------------
Can't buy what I want because it's free -
Reply

Marsh Posté le 10-07-2007 à 14:30:25    

la majorité des personnes utilisants des aspirateurs de sites s' arrêteront s' il y a une erreur.
Il n' y a que quelques personnes connaissants bien celà qui pourront aspirer le site.
je recherche donc un moyen d' empêcher la plupart des gens s' aspirer mon site si tu préfères.

Reply

Marsh Posté le 10-07-2007 à 14:32:29    

Dans ce cas le site que tu as linké plus haut me parait traiter du sujet. Même si je me suis toujours demandé pour quelle raison saugrenue on voudrait faire ce genre de choses.:o


---------------
Can't buy what I want because it's free -
Reply

Marsh Posté le 10-07-2007 à 15:00:48    

skeye a écrit :

Même si je me suis toujours demandé pour quelle raison saugrenue on voudrait faire ce genre de choses.:o


 
Surement pour la même raison qui pousse certains "webmasters" a vouloir empecher le clic droit... :sarcastic:


---------------
When it's from Finland it's good.  - Mon blog
Reply

Marsh Posté le 10-07-2007 à 15:10:03    

faut bloquer google (et les autres moteurs de recherches également), sinon il va "aspirer" ton site et le mettre en cache.
L'inconvénient c'est que ton site ne sera pas référencé.
L'avantage c'est que de fait personne ne le trouvera et personne ne pourra l'aspirer.

Reply

Marsh Posté le 10-07-2007 à 15:17:04    

tu peux configurer ton serveur (ou meme ton site) pour limiter le nombre de requetes par client et par minutes
 
seulement, tu risques aussi de bloquer les robots des moteurs.
 
Pourquoi veut tu limiter cela ? Surtout que avec la généralisationdes connexions actuelles, ces techniques ne sont plus vraiment utilisées

Reply

Marsh Posté le 10-07-2007 à 15:51:43    

Le mieux garde ton site en local, le met jamais sur le net, et montre le seulement à tes potes qui viennent à la maison...ououou...
 
Un site c'est là pour partager des données, ça me fait bien rire les gens, qui pensent, mettre du contenu unique sur la toile, et qui cherche à tout pris à le protéger...

Reply

Marsh Posté le 10-07-2007 à 15:51:43   

Reply

Marsh Posté le 10-07-2007 à 16:06:36    

Faut mettre du DRM dans le code HTML pour éviter de se le faire voler :whistle:


---------------
When it's from Finland it's good.  - Mon blog
Reply

Marsh Posté le 10-07-2007 à 16:22:33    

De toute façon dans les cas ou j'avais VRAIMENT l'intention d'aspirer un site (souvent juste parceque ca me permettait d'automatiser la récupération de documents pénibles à sauver manuellement sans cliquer 10000 fois), bah...
.... je l'ai aspiré 'manuellement' page par page :D

Reply

Marsh Posté le 10-07-2007 à 17:24:58    

wget

Reply

Marsh Posté le 10-07-2007 à 17:28:38    

vous êtes gentil les gugus moralisateurs, si vous n' avez pas d' aide à m' apporter vous pouvez peut être vous abstenir.
 

Citation :

Pourquoi veut tu limiter cela ?


 
pour que le site soit visité tout simplement, qu' il vive.
sinon, on met tout en téléchargement et il n' y a pas de site proprement dit, d' autant plus quand tu paies un hébergement.
merci à ceux qui ont une aide concrète, pour les polémiqueur, vous allez au bistrot du coin merci.

Reply

Marsh Posté le 10-07-2007 à 18:01:49    

Tu te rend compte que ce que tu dis, c'est nul ?

Reply

Marsh Posté le 10-07-2007 à 18:10:51    

chrisllers a écrit :

pour que le site soit visité tout simplement, qu' il vive.
sinon, on met tout en téléchargement et il n' y a pas de site proprement dit, d' autant plus quand tu paies un hébergement.


Je ne comprends pas.[:chacal_one333]
Si tu veux qu'il soit visité, il faut améliorer et faire vivre son contenu et travailler sur son référencement, pas gaspiller ton énergie à empêcher une minorité d'utilisateurs de récupérer son contenu pour consultation offline, non? :??:


---------------
Can't buy what I want because it's free -
Reply

Marsh Posté le 10-07-2007 à 19:01:54    

est-ce qu' on peut en revenir au sujet SVP.
est-ce que vous sauriez m' indiquer comment empêcher la majorité des aspirateurs de site de sévir sur un site ?
merci.

Reply

Marsh Posté le 10-07-2007 à 19:08:02    

chrisllers a écrit :

pour que le site soit visité tout simplement, qu' il vive.
sinon, on met tout en téléchargement et il n' y a pas de site proprement dit, d' autant plus quand tu paies un hébergement.


 
Bah oui, regarde moi, j'ai aspiré le site de la SNCF et depuis j'ai plus besoin de retourner le voir. Par contre j'arrive pas à trouver les nouveaux horaires de trains, c'est normal ?  :lol:  
 

chrisllers a écrit :

merci à ceux qui ont une aide concrète, pour les polémiqueur, vous allez au bistrot du coin merci.


 
Il n'y a pas "d'aide concrète" à donner : tu essayes de faire quelque chose d'impossible et de complètement inutile, en te basant sur un raisonnement totalement faux. Si tu ne veux pas comprendre ça, tant pis pour toi, mais n'espère pas qu'on t'aide à perserver dans une mauvaise voie.
 


---------------
When it's from Finland it's good.  - Mon blog
Reply

Marsh Posté le 10-07-2007 à 19:16:28    

ok alors on retourne le problème:
a quoi sert un aspirateur de site ?

Citation :

mais n'espère pas qu'on t'aide à perserver dans une mauvaise voie.


donc à partir du moment où on ne partage pas tes gouts et tes préférences, tu ne respectes ni le gout ni les préférences d' une autre personne ?
Si je te demande un coup de main pour mettre l' image de fond de mon site en bleu alors que tu n' aimes pas le bleu, tu vas me répondre:

Citation :

mais n'espère pas qu'on t'aide à perserver dans une mauvaise voie.

Message cité 1 fois
Message édité par chrisllers le 10-07-2007 à 19:23:19
Reply

Marsh Posté le 10-07-2007 à 19:36:19    

chrisllers a écrit :

ok alors on retourne le problème:
a quoi sert un aspirateur de site ?


 
A part pour les moteurs de recherches et autres bots : aucune idée, je n'en ai jamais utilisé, et je ne connais personne qui en utilise (ni dans le privé ni dans mes différents boulots). Donc selon moi : à rien
 

chrisllers a écrit :

donc à partir du moment où on ne partage pas tes gouts et tes préférences, tu ne respectes ni le gout ni les préférences d' une autre personne ?
Si je te demande un coup de main pour mettre l' image de fond de mon site en bleu alors que tu n' aimes pas le bleu, tu vas me répondre:

Citation :

mais n'espère pas qu'on t'aide à perserver dans une mauvaise voie.



 
Il y a une différence entre mes gouts et mes préférences (totalement subjectives), que je sais mettre de côté quand il faut, et des éléments objectifs basé sur des faits concrets (ex : il est impossible de différencier avec certitude un "aspirateur" d'un "user agent" légitime) et et sur mon experience (ex : je bosse dans le domaine d'Internet et je n'ai JAMAIS recontré quelqu'un qui considère les aspirateurs de site comme une menace pour ses VU).
 
Pour reprendre ton exemple, je te répondrais ça uniquement si mettre une image de fond bleue sur ton site n'est objectivement pas une bonne solution (image beaucoup trop lourde, nuit à la lisibilité, etc.).


---------------
When it's from Finland it's good.  - Mon blog
Reply

Marsh Posté le 10-07-2007 à 20:16:49    

Un aspirateur de site, était utilisé dans les temps ancien. quand tu avais 1h de connexion.
Donc de nos jours aucun intérêt.
 
et comme essaye de te le faire comprendre cgo2 et skeye.
Si ton site, est dynamique, personne aura un intérêt à le pomper...pour le mater sur ça machine plus tard.
 
Et si il est statique, ben, aucun blaireau sur terre, penserais à l'aspirer  car ça sert à rien.
 
Si, ça peut servir, je pense, de pomper des mégas site de documentation, comme W3C et autre...comme ça tu peux toujours avoir ce que tu veux sous la main...Mais sinon.

Reply

Marsh Posté le 10-07-2007 à 20:56:40    

décidémment...si je peux avoir de l' aide SVP pour ce que je souhaite faire.
merci.

Reply

Marsh Posté le 10-07-2007 à 22:44:25    

Reply

Marsh Posté le 10-07-2007 à 23:13:15    

chrisllers a écrit :

si j' ai vu qu' on pouvait le faire, mais j' ai besoin de précision sur la méthode.
essaie d' aspirer le site du zéro par exemple.


Tu parles de http://www.siteduzero.com/?
 
http://img526.imageshack.us/img526/8660/crawlsq0.png


---------------
Stick a parrot in a Call of Duty lobby, and you're gonna get a racist parrot. — Cody
Reply

Marsh Posté le 11-07-2007 à 11:24:33    

xtof_83 a écrit :

Un aspirateur de site, était utilisé dans les temps ancien. quand tu avais 1h de connexion.
Donc de nos jours aucun intérêt.
(...)
Si, ça peut servir, je pense, de pomper des mégas site de documentation, comme W3C et autre...comme ça tu peux toujours avoir ce que tu veux sous la main...Mais sinon.


Bah non j'utilise souvent un aspirateur lorsque je tombe sur un site avec des galleries qui me plaisent.
 
Plutot qu'ouvrir et sauvegarder chaque image une par une (donc 'visiter' le site, ce qui dans certains cas est passablement lourd, à cause d'options sensées améliorer l'affichage de la gallerie, mais à l'usage sont peu pratiques et demande de cliquer à outrance), je lance un aspirateur configuré en mode 'image only' sur la page de la gallerie.
 

chrisllers a écrit :

décidémment...si je peux avoir de l' aide SVP pour ce que je souhaite faire.
merci.


 
autre idée (pas bete en effet mais pas décrite).
 
Sinon y'a toujours la solution d'utiliser des captchas, ou obliger les visiteurs à s'inscrire.
 
Mais de mon point de vue ce sont des solutions qui me font un peu fuir... forcer le visiteur à s'inscrire (et se retrouver spammé après, non merci), remplir des cases à partir d'images à moitié lisibles ou cliquer 3 fois plus pour accéder à une info, pour moi c'est signe de site pas user-friendly = à oublier.

Reply

Marsh Posté le 11-07-2007 à 16:35:29    

merci, on va finir par y arriver.
je suis tombé sur les mêmes pistes.
est-ce que je dois recopier les lignes du code et les mettre simplement à la suite de ce que j' ai déjà dans mon fichier htaccess ?

Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed