Grosso modo, il y a combien de pages sur Internet ?

Grosso modo, il y a combien de pages sur Internet ? - Sciences - Discussions

Marsh Posté le 07-02-2003 à 14:50:52    

Juste histoire d'avoir un ordre d'idée ... je sais que déjà le nombre de pages qui apparaissent tout les mois est gigantesque ...


---------------
Securis c'est plus de 200 logiciels de sécurité gratuits !
Reply

Marsh Posté le 07-02-2003 à 14:50:52   

Reply

Marsh Posté le 07-02-2003 à 14:54:34    

Je sais pas, je te dis ça dès que j'ai finis ....
 
 
 
 
 
 
 
 
 
http://site.voila.fr/kazkonneries/downloadwww.gif
 
 [:gilbert gosseyn]


---------------
C'est en se plantant qu'on devient cultivé  
Reply

Marsh Posté le 07-02-2003 à 14:58:33    

:??: Je croyais que blabla avait été fermé pourtant ...


---------------
Securis c'est plus de 200 logiciels de sécurité gratuits !
Reply

Marsh Posté le 07-02-2003 à 14:59:29    

Pseudo réponse:
 
2003 Google - Nombre de pages Web recensées par Google : 3,083,324,652

Reply

Marsh Posté le 07-02-2003 à 15:00:24    

"Grosso modo, il y a combien de pages sur Internet ?"
 
Pourquoi les insulter ? :/


---------------
A+++ Bruce - http://www.bheller.com
Reply

Marsh Posté le 07-02-2003 à 15:01:37    

Nicobule a écrit :

Pseudo réponse:
 
2003 Google - Nombre de pages Web recensées par Google : 3,083,324,652


 
sachant qu'une petite partie est référencée [:seyar]

Reply

Marsh Posté le 07-02-2003 à 15:03:49    

sygus a écrit :


 
sachant qu'une petite partie est référencée [:seyar]  


 
Je sais ya que le statique de réferencé, mais ça peut l'aider un peu.  :hello:

Reply

Marsh Posté le 07-02-2003 à 15:04:00    

Bruce a écrit :

"Grosso modo, il y a combien de pages sur Internet ?"
 
Pourquoi les insulter ? :/


[:totoelectro]


---------------
sauvez les arbres Mangez des castors
Reply

Marsh Posté le 07-02-2003 à 15:06:09    

Nicobule a écrit :


 
Je sais ya que le statique de réferencé, mais ça peut l'aider un peu.  :hello:  


 
Merci ! Il y en a qui bossent pendant que d'autres passent leur aprèm sur Discuss' ;)


---------------
Securis c'est plus de 200 logiciels de sécurité gratuits !
Reply

Marsh Posté le 07-02-2003 à 15:27:39    

on les estimais à 15 millions en 2001, il me semble

Reply

Marsh Posté le 07-02-2003 à 15:27:39   

Reply

Marsh Posté le 07-02-2003 à 15:29:35    

tristanf a écrit :

on les estimais à 15 millions en 2001, il me semble


 
[:xp1700]

Reply

Marsh Posté le 07-02-2003 à 15:38:26    

tristanf a écrit :

on les estimais à 15 millions en 2001, il me semble


 
qui "on" ? :heink:  la concierge de ton immeuble ? :D
 
Puis on entend quoi par "page" ? ce forum ça compte ? pcq rien qu'ici y a des milliers/millions de pages possibles :o


Message édité par antp le 07-02-2003 à 15:38:52
Reply

Marsh Posté le 07-02-2003 à 15:50:22    

antp a écrit :


 
qui "on" ? :heink:  la concierge de ton immeuble ? :D
 
Puis on entend quoi par "page" ? ce forum ça compte ? pcq rien qu'ici y a des milliers/millions de pages possibles :o

page centrale d'un même groupe exemple : forum.hardware.fr pas tt les topics...

Reply

Marsh Posté le 07-02-2003 à 15:52:58    

antp a écrit :


 
qui "on" ? :heink:  la concierge de ton immeuble ? :D
 
Puis on entend quoi par "page" ? ce forum ça compte ? pcq rien qu'ici y a des milliers/millions de pages possibles :o


 
puis faudrais aussi definir ce ke l on appel page:
 
kan il y a des frames, c est koi ?
kan un site est fait avec une seul page dans lekel il y a un gigantesque anim flash ?


---------------
#mais-chut
Reply

Marsh Posté le 07-02-2003 à 16:44:53    

il y en a beaucoup, tu peux essayer de les compter si tu veux !  :whistle:


---------------
"La Terre est le berceau de l'humanité, mais on ne passe pas toute sa vie au berceau." - Konstantine Tsiolkovski
Reply

Marsh Posté le 02-03-2010 à 14:40:20    

je te hais, B-52. j'ai donne mes 7 dernieres annees et je continue a compter.

Reply

Marsh Posté le 02-03-2010 à 14:42:10    

qu'est ce que tu nous fais là ! [:prodigy]


---------------
Ma cinémathèque
Reply

Marsh Posté le 02-03-2010 à 15:47:41    

[:mauvlam]

Reply

Marsh Posté le 02-03-2010 à 15:50:40    

42 :o


---------------
Mon image publique est étonnamment négative, est-ce à cause de mon hobbie qui consiste à gifler des orphelines ? | Je dois aller faire quelque chose de masculin, tel conquérir une nation ou uriner debout.  
Reply

Marsh Posté le 02-03-2010 à 16:03:15    


:jap: tu me rassures dans mes calculs.

Reply

Marsh Posté le 02-03-2010 à 16:59:59    

tristanf a écrit :

page centrale d'un même groupe exemple : forum.hardware.fr pas tt les topics...


Ben quand on parles de pages on parle de pages. On peut aussi compter les "sites" ou les "noms de domaines", mais c'est pas pareil.
 
HFR a plusieurs pages (sachant qu'elle sont générées dynamiquement, il en a même une infinité, c'est pour ça que c'est dur de toutes les compter). Quand le web était statique c'était facile, mais maintenant que le web est dynamique faudrait définir un concept de page compliqué si on veut répondre à la question...
 
Si on compte les pages indexées par google c'est plus de 10 milliards à l'heure actuelle (mais google est loin de tout indexer).
 
Par exemple, sur Wikipédia (anglophone) il y a 3,210,006 articles (tous indexés par google) mais en fait il y a 19,594,200 pages wiki (en comptant les pages de discussion, qui ne sont pas indexées et les redirect).  
 
Si on compte les pages dynamiques c'est encore pire... En moyenne chaque article est édité 115 fois sur la Wikipédia anglophone... Donc pour chaque article il existe 115 pages correspondant aux anciennes versions de l'article, et (115*114)/2 "diff" (les diff sont les pages correspondant aux différences entre deux versions d'un même article, elle sont générées dynamiquement).
 
Donc rien qu'avec les articles, l'historique des articles et les diffs, Wikipédia a plus de 21 041 589 330 pages... Et Wikipédia n'est qu'une toute petite partie du web.


Message édité par Koko90 le 02-03-2010 à 17:23:14

---------------
Découvrez l'anthologie des posts de Mikhail. Je suis le cinéphile déviant.
Reply

Marsh Posté le 02-03-2010 à 22:21:21    

koko90, tu m'as etonne sur ce coup.
la vraie question, le nombre de 'page', quel interet a-t-il? la projection de l'enregistrement en papier sur ce en virtuel ne fonctionne pas.

Reply

Marsh Posté le 02-03-2010 à 22:48:48    

L'idée est peut-être d'essayer de définir "page" comme étant quelque chose sur internet
-plus ou moins créé consciemment par un ou plusieurs humains
-évoquant vaguement les pages d'un livre ou d'un magazine
Et d'en estimer le nombre sur internet, à quelques milliards près.  
 
Ca permettrait de savoir combien de ces pages ont été pondues par les internautes depuis la généralisation d'internet, ou sur internet en un an.
Et de comparer avec plein de choses : le nombre d'internautes, le nombre de pages de livres ou de magazines sur la même période, etc etc...
 
J'ai conscience des très grosses approximations qui seraient mises en oeuvre, et de l'intérêt à première vue limité d'une telle démarche.


---------------
"It became necessary to destroy the town to save it"
Reply

Marsh Posté le 03-03-2010 à 09:19:47    

alphaville a écrit :

koko90, tu m'as etonne sur ce coup.
la vraie question, le nombre de 'page', quel interet a-t-il? la projection de l'enregistrement en papier sur ce en virtuel ne fonctionne pas.


A la base, la page web (un fichier html avec des images éventuellement liées) est une unité intéressante car élémentaire.
 
Mais de nos jours, le nombre de "pages" est infini (puisque certains sites peuvent générer dynamiquement une infinité de pages différentes).
 
Reste que les moteurs de recherche travaillent avec des pages (indexées par des URL uniques) et qu'ils arrivent à s'en tirer... J'ai pris l'exemple de Wikipédia pour expliquer à quel point ils n'indexent qu'une infime parti des pages qui existent (ce qui est normal, puisque le nombre de pages existant est arbitrairement grand, il faut qu'ils choisissent celles qui ont un réel contenu en évitant la redondance).
 
Les pages ne sont pas une bonne unité pour mesurer la taille du web. Mais le problème c'est qu'il n'y a pas de bonne unité pour mesurer la taille du web... Donc c'est perdu d'avance.
 
PS : Pour ceux qui connaissent la Bibliothèque de Babel de Jorge Luis Borges, elle est intégralement en ligne (et contient tout les ouvrages possibles et imaginables) :
http://www.babellibrary.com/index.cfm?lang=fr

Message cité 1 fois
Message édité par Koko90 le 03-03-2010 à 10:17:01

---------------
Découvrez l'anthologie des posts de Mikhail. Je suis le cinéphile déviant.
Reply

Marsh Posté le 03-03-2010 à 12:21:13    

Empificator a écrit :

L'idée est peut-être d'essayer de définir "page" comme étant quelque chose sur internet
-plus ou moins créé consciemment par un ou plusieurs humains
-évoquant vaguement les pages d'un livre ou d'un magazine
Et d'en estimer le nombre sur internet, à quelques milliards près.  
 
Ca permettrait de savoir combien de ces pages ont été pondues par les internautes depuis la généralisation d'internet, ou sur internet en un an.
Et de comparer avec plein de choses : le nombre d'internautes, le nombre de pages de livres ou de magazines sur la même période, etc etc...
 
J'ai conscience des très grosses approximations qui seraient mises en oeuvre, et de l'intérêt à première vue limité d'une telle démarche.


:jap: je trouve l'idee de definir l'unite d'internet interessante. byte, debit, hit count, and so on... un autre topic peut-etre.
je ne vois toujours pas l'interet ni la possibilite de savoir le nombre de page sur l'internet, les 'pages' pouvant etre creees dynamiquement.
 

Koko90 a écrit :


A la base, la page web (un fichier html avec des images éventuellement liées) est une unité intéressante car élémentaire.
 
Mais de nos jours, le nombre de "pages" est infini (puisque certains sites peuvent générer dynamiquement une infinité de pages différentes).
 
Reste que les moteurs de recherche travaillent avec des pages (indexées par des URL uniques) et qu'ils arrivent à s'en tirer... J'ai pris l'exemple de Wikipédia pour expliquer à quel point ils n'indexent qu'une infime parti des pages qui existent (ce qui est normal, puisque le nombre de pages existant est arbitrairement grand, il faut qu'ils choisissent celles qui ont un réel contenu en évitant la redondance).
 
Les pages ne sont pas une bonne unité pour mesurer la taille du web. Mais le problème c'est qu'il n'y a pas de bonne unité pour mesurer la taille du web... Donc c'est perdu d'avance.
 
PS : Pour ceux qui connaissent la Bibliothèque de Babel de Jorge Luis Borges, elle est intégralement en ligne (et contient tout les ouvrages possibles et imaginables) :
http://www.babellibrary.com/index.cfm?lang=fr


facile, on l'a appele une page au lieu de creer un autre mot. un html de 2 metre long a l'epoque (si si ca existait et existe encore) ne corresspond a ce que c'est, imfho. or, une piece de '.php' ou autre est capable de creer tant de differentes pages selon le IP du viewer, son browser, l'heure,... million de choses.
 
:jap: le nombre de "pages" est infini.
 
sinon borges [:allah_4]

Reply

Marsh Posté le 03-03-2010 à 13:33:46    

Je l'ai dit dès le départ. Le nombre de pages (avec la définition naïve du terme) est infini dénombrable. Donc on le connait.
 
Le nombre de noms de domaines est également infini (il existes des domaines du type "truc.com" où le nom de domaine "bidule.truc.com" est valide pour tout bidule).

Message cité 2 fois
Message édité par Koko90 le 03-03-2010 à 13:34:35

---------------
Découvrez l'anthologie des posts de Mikhail. Je suis le cinéphile déviant.
Reply

Marsh Posté le 03-03-2010 à 13:48:22    

Koko90 a écrit :

Je l'ai dit dès le départ. Le nombre de pages (avec la définition naïve du terme) est infini dénombrable. Donc on le connait.
 
Le nombre de noms de domaines est également infini (il existes des domaines du type "truc.com" où le nom de domaine "bidule.truc.com" est valide pour tout bidule).


sous-domaine  :o


---------------
création de site - photo
Reply

Marsh Posté le 03-03-2010 à 14:14:15    

Il me semble que l'ensemble "bidule.truc.com" est bien un nom de domaine, avec com comme TLD, truc comme second-level domain et bidule comme third-level domain.
 
Les sous-domaines sont des cas particuliers de domaines...
 
Pour en revenir à la discussion, on veut compter un truc, on peut se limiter aux domaines du second ordre, mais c'est complètement artificiel (d'autant plus que ce sont déjà des sous-domaines des TLD)...


---------------
Découvrez l'anthologie des posts de Mikhail. Je suis le cinéphile déviant.
Reply

Marsh Posté le 03-03-2010 à 14:16:31    

alphaville a écrit :

je te hais, B-52. j'ai donne mes 7 dernieres annees et je continue a compter.


 
moi je viens de finir la.
 
Tout ce que je peu dire c'est que ya moins de qualitay sur tout le net que dans ce topac!


---------------
antithéiste
Reply

Marsh Posté le 03-03-2010 à 14:36:28    

Koko90 a écrit :

Je l'ai dit dès le départ. Le nombre de pages (avec la définition naïve du terme) est infini dénombrable. Donc on le connait.
 
Le nombre de noms de domaines est également infini (il existes des domaines du type "truc.com" où le nom de domaine "bidule.truc.com" est valide pour tout bidule).

:non: Le nombre de caractères de chaque label (ce qui est séparé par un . dans un truc.foo.bar) est limité a 63.  
Donc le nombre d'adresses de la forme truc.foo.bar est largement majoré (car en fait, la liste des labels autorisés pour la dernière partie est très limitée) par (63*1,114,111)^3 = 345785704704869176782657 [1,114,111 est le nombre de caracteres unicodes exprimables en utf-8]. Bref, ce nombre est grand, mais pas infini.
A+,


---------------
There's more than what can be linked! --    Iyashikei Anime Forever!    --  AngularJS c'est un framework d'engulé!  --
Reply

Marsh Posté le 03-03-2010 à 14:43:56    

J'ai en effet oublié de tenir compte de la limitation de la longueur des label.
 
Reste que ton calcul me semble faux, ça devrait plutôt faire du (X^63)^3...  où X est le nombre de caractères autorisés.
 
Par ailleurs X n'est pas égal à 1,114,111 (il me semble que les caractères unicodes exprimables en utf-8 ne sont pas tous autorisés).


Message édité par Koko90 le 03-03-2010 à 14:48:28

---------------
Découvrez l'anthologie des posts de Mikhail. Je suis le cinéphile déviant.
Reply

Marsh Posté le 03-03-2010 à 14:57:26    

Citation :

J'ai en effet oublié de tenir compte de la limitation de la longueur des label.

Réflexe d'informaticien: c'est surement implémenté dans des tables de taille fixe :)

Citation :

(X^63)^3.

:o C'est ca en effet. Donc X^189

Citation :

X n'est pas égal à 1,114,111

Je ne l'ai jamais prétendu. Mais c'en est un majorant.
A+,

Message cité 1 fois
Message édité par gilou le 03-03-2010 à 15:00:47

---------------
There's more than what can be linked! --    Iyashikei Anime Forever!    --  AngularJS c'est un framework d'engulé!  --
Reply

Marsh Posté le 03-03-2010 à 15:01:01    

kriloner a écrit :


 
moi je viens de finir la.
 
Tout ce que je peu dire c'est que ya moins de qualitay sur tout le net que dans ce topac!


 
attends, tu n'as encore vu que les preliminaires ici [:mike hoksbiger]

Reply

Marsh Posté le 03-03-2010 à 15:03:44    

gilou a écrit :

C'est ca en effet. Donc X^189


multiplier par le nombre de pages (visuel) potentiellement generables par chaque domain/sous-domain, si on veut rester dans le sujet :o


Message édité par alphaville le 03-03-2010 à 15:04:24
Reply

Marsh Posté le 03-03-2010 à 15:05:00    

Environ 12.


---------------
Hobby eien /人◕ ‿‿ ◕人\
Reply

Marsh Posté le 03-03-2010 à 15:05:19    

alphaville a écrit :

multiplier par le nombre de pages (visuel) potentiellement generables par chaque domain/sous-domain, si on veut rester dans le sujet :o

Vu que tu as des serveurs php qui vont te générer une page pour toute requête avec une chaine en parametre, le nombre en est infini dénombrable.
 
Donc, pour répondre a la question initiale:
Q - Grosso modo, il y a combien de pages sur Internet ?
R - http://upload.wikimedia.org/math/b/e/4/be4c703ed73456618ed283b892c6715a.png
 
 :D  
A+,


Message édité par gilou le 03-03-2010 à 15:08:12

---------------
There's more than what can be linked! --    Iyashikei Anime Forever!    --  AngularJS c'est un framework d'engulé!  --
Reply

Marsh Posté le 03-03-2010 à 15:36:53    

Y doit bien y avoir une limite à la con dans le protocole HTTP sur la taille maximale d'une page...
 
PS : Ah ben non, dans le RFC 2616 y en a pas. Mais bon, les navigateurs et les serveurs ont forcément une limitation...

Message cité 1 fois
Message édité par Koko90 le 03-03-2010 à 15:41:33

---------------
Découvrez l'anthologie des posts de Mikhail. Je suis le cinéphile déviant.
Reply

Marsh Posté le 03-03-2010 à 15:45:58    

C'est bon t'es le premier te la pete pas

Reply

Marsh Posté le 03-03-2010 à 16:46:23    

il l'a bien merite quand meme :o

Reply

Marsh Posté le 03-03-2010 à 17:10:52    

Koko90 a écrit :

Y doit bien y avoir une limite à la con dans le protocole HTTP sur la taille maximale d'une page...

Si c'était le cas, un serveur web "a la bibliothèque de Babel de Borgès" contiendrait tout internet :D
Mais comme le dit la RFC 2616:"Any Content-Length greater than or equal to zero is a valid value."  
 
A+,
 


---------------
There's more than what can be linked! --    Iyashikei Anime Forever!    --  AngularJS c'est un framework d'engulé!  --
Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed