Site web référencé

Site web référencé - HTML/CSS - Programmation

Marsh Posté le 09-02-2015 à 15:18:01    

Bonjour,
 
Il m'arrive un truc bizarre. J'ai un blog et un wiki fait via des logiciels GPL, hébergés chez Free. Je n'ai jamais souhaité que ces sites sois référencés par Google ou similaire. J'ai donc mis un robots.txt qui contient :

Code :
  1. User-agent: *
  2. Disallow: /


Par ailleurs, je n'ai jamais posté sur un site web référencé l'url de mon blog et wiki. Ils existent depuis fin 2007 et, jusqu'à il y a peu (je dirais depuis le 01/01/2015), le contenu de mes 2 sites n'était pas référencé par Google : c'est ce que je voulais. mais depuis le début de l'année, plusieurs pages apparaissent dans les résultats de google et quand je fais "site:monsite.fr", je découvre que 200 pages environ sont référencées.
 
Je ne comprends pas pourquoi. :??: Quand je veux savoir quels sites pointent vers mon blog et wiki, je fais link:monsite.fr. J'obtiens aucune réponse. pareil avec "related:monsite.fr" :??:
 
J'ai quelques notions de référencement, donc je comprends pas comment c'est possible si aucun site web ne mentionne un lien vers mon blog ou wiki et avec le contenu de mon robots.txt.
 
Une idée d'où ça pourrait provenir ? Il m'est arrivé d'envoyer à des personnes l'url de mon blog, certains étant chez Gmail. Ca pourrait venir de là ? :heink:
 
Merci par avance si vous avez une idée... :jap:


Message édité par rufo le 09-02-2015 à 15:18:28

---------------
Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta
Reply

Marsh Posté le 09-02-2015 à 15:18:01   

Reply

Marsh Posté le 14-02-2015 à 01:10:33    

J'ai laché la seo y a plusieurs mois, mais quelques idées en vrac
 
La commande link: chez google renvoie des résultats partiels. Eventuellement essaye avec ahrefs / majesticseo / ... avec le risque d'être encore plus référencé.
 
Une fois dans l'index Google, difficile de ressortir. J'ai un domaine expiré depuis plus d'un an qui apparaît encore dans l'index.
 
Certains moteurs / annuaires ignorent le robots.txt - testé et approuvé
 
Ton hébergeur fournit des logs ? Tu pourrais peut être voir d'où ca vient


Message édité par scvo0ne le 14-02-2015 à 01:21:32
Reply

Marsh Posté le 16-02-2015 à 10:19:10    

Pour robots.txt, je pensais que les règles de bienséance "imposaient" aux bots de référencement de Google de respecter ces instructions :/ Je dis pas pour un obscure moteur de recherche, mais que le moteur n°1 dans le monde ne respecte pas le contenu de robots.txt, c'est quand même très bof :/


---------------
Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed