Comment sont gérés les sites dynamiques par les moteurs de recherche?

Comment sont gérés les sites dynamiques par les moteurs de recherche? - PHP - Programmation

Marsh Posté le 26-10-2003 à 11:57:42    

Bonjour à tous!
Ca fait un certain temps que je me pose cette question. J'ai constaté plusieurs choses concernant le comportement des robots des moteurs de recherche sur un site dynamique, mais j'ai rien pu confirmer, alors je compte un peu sur vous et sur votre expérience pour m'aider!
 
Premièrement, il semble que les robots ne tiennent pas en compte les variables dans un url. Par exemple, index.php et index.php?p=contact sera considéré comme une seule page, et seul index.php sera référencé. Par conséquent il serait déconseillé de baser son site sur une seule page gérant des includes et la connexion à MySQL par exemple.
 
Deuxièmement, est-ce que si une page utilise un include pour son contenu, sera-t-il référencé? Personnellement j'ai l'impression que non, mais ça me semble très bizzare.
Mais il est possible que, par exemple, l'include est pris en compte que si il est indépendant de toute variable.
 
Et troisièmement, est-ce que les requêtes SQL sont prises en compte?
J'ai observé des phénomènes bizzares: parfois, on tombe sur des mots contenus dans un post d'un forum (bien que le lien référencé soit viewpost.php dans le cas de phpBB, ce qui nous aide pas beaucoup vu qu'il nous ammènera pas au post recherché). Cela impliquerait que les robots effectuent des requêtes SQL sans tenir compte des variables (car d'après ma première question, ils n'en tiennent pas compte)... Mais alors comment peuvent-ils tomber sur un post précis? Effectuent-ils des requêtes au hasard?
 
 
Bon j'ai pas vraiment réussi à être très clair mais j'espère que vous avez un peu cerné les questions que je me pose.
Pour terminer, d'après les trois points ci-dessus, l'idéal serait-il de construire son site comme ça:
 
Une page pour chaque page (cela n'empêche pas vraiment une gestion dynamique... il suffit de créer une page générique avec un script), qui ressemble à ceci:
 

Code :
  1. <?
  2. include("conf.php" );
  3. (une requête sql basée sur le nom de la page qui récupère son contenu)
  4. include("haut.php" );
  5. (affichage du contenu provenant de la requête précédente)
  6. include("bas.php" );
  7. ?>


 
Et la page haut.php
 

Code :
  1. <html>
  2. ...
  3. <meta name="keywords" content="(mots clé provenant de la requête sql">


 
Avec cette technique il n'y a plus de variables dans l'url, et chaque page a sa propre page. Chaque page a ses propres mots clés, sa propre description, et son propre contenu. Les includes ne dépendent pas de variables. Le seul problème qu'il peut y avoir c'est à propos de SQL... est-ce que les robots en dépendent ou non.
 
Qu'en pensez-vous? Avez-vous plus d'informations?


Message édité par Xizor le 26-10-2003 à 12:00:52
Reply

Marsh Posté le 26-10-2003 à 11:57:42   

Reply

Marsh Posté le 26-10-2003 à 13:01:13    

Sinon tu peux continuer a developper ton site a partir d'un seul fichier qui se charge de lancer les modules en fonction des parametres passes, mais tu utilise mod_rewrite.
 
C'est un module d'apache qui te permet d'appliquer des regles de reecriture des tes url.
En gros tu peux avoir une url du style :
www.site.com/forum+viewtopic+5325+highlight+mamam
quand tu tape cette url, mod_rewrite va la reecrire en interne en une url qui existe du genre :
www.site.com/index.php?module=foru [...] ight=mamam
Bien sur tout ceci ce passe en interne.
Cette methode a l'avantage de bien fonctionner avec les moteurs ainsi qu'avec les utilisateurs :P . Il est plus facile de memoriser des url du premier type.
 
Bon ceci ne repond pas vraiment a ta question de savoir comment les moteurs references les sites dynamiques, mais te donne une solution sans devoir reecrire ton site.
Malheuresement je n'ai pas de liens generaux pour cette methode. Mais j'ai des liens qui concernent cette methode et un CMS (www.postnuke.com). Si tu veux je peux te les donner, cela ne doit pas etre tres dificile de l'apliquer a ton site.

Reply

Marsh Posté le 26-10-2003 à 14:19:47    

Citation :

Cela impliquerait que les robots effectuent des requêtes SQL sans tenir compte des variables


 
 :??:

Reply

Marsh Posté le 26-10-2003 à 22:15:49    

je ne sais pas pour les autres moteurs, mais en tout cas google référence bien les pages du style index.php?categorie=truc&page=bidule etc, mais ce que j'ai remarqué avec mon site c'est qu'il semblait ne référencer que 2 variables maximum
 
par exemple il ne référencera pas une page du style index.php?categorie=truc&section=bidule&page=chouette car il y a 3 variables (categorie, section, page)

Reply

Marsh Posté le 26-10-2003 à 23:47:06    

il prendra des pages avec plusieurs variables si le site à un page Rank elevé (6 et +)  
 
sinon le rewrinting est une bonne solution dont voici un bon tuto : http://developpeur.journaldunet.co [...] ing2.shtml
 
et pour finir voila un bon site pour mieux comprendre les moteurs de recherches et Google en particulier http://www.webrankinfo.com/

Reply

Marsh Posté le 27-10-2003 à 07:25:49    

Si vous utilisez mod_rewrite, faites attention, certains moteurs ne gerent pas biens les repertoires virtuels ...
Donc une url du style : http://www.monsite.com/forum/1/3123/msg/56
risque de poser problemes si la partie "forum/1/3123/msg/56" sont des rep virtuels utilises par mod_rewrite.
Les moteurs n'aiment pas trop :/


Message édité par cerel le 27-10-2003 à 07:26:09
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed