Question de taille …

mar 5th, 2007 | Category: Informatique, Moteur de recherche, Techno

Voilà bien longtemps que l’on n’avait plus reparlé de la taille du web. S’étant probablement apreçu qu’en ce domaine comme en d’autres ce n’est pas (que ?) la taille qui compte. Surtout qu’en ce domaine, elle – la taille – confine à l’incommensurable. Pourtant, d’acharnés chercheurs cherchent encore. De son côté le magazine Pandia nous rappelle quelques chiffres issus de différentes études (dont on retrouvera les références sous le lien) :

  • 2000 : 7 millions de sites (soit 50 % de plus qu’en 1999)
  • 2005 : 11,5 milliards de pages.
  • 2005 : Yahoo! annonce 19,2 milliards de documents dans son index.
  • Janvier 2007 : 433 millions (433 193 199 exactement …) de noms de domaine contredisant une autre étude indiquant de son côté 100 millions de noms de domaine dont moins de la moitié seraient « actifs ».
  • Février 2007 : 30 milliards de pages web.
  • 2007 encore : 1 milliard d’internautes.
  • … « et moi, et moi et moi … »

Pour mémoire, en 2003 et selon les chercheurs qui cherchent cités plus haut :

  • le web « de surface » (= indexé ou susceptible de l’être par les moteurs) représente 167 TéraBits d’information
  • les données des bibliothèques : 2,000 TB
  • le web profond (« invisible » ou « deep web ») : 91,850 TB

(Pour mémoire 1 TB = 1000 GigaBits)

De l’information, des données, des bits, des internautes, des pages web, profondes ou de surface, des sites, des documents, des noms de domaine … L’objet d’étude se noie dans la masse de ses descripteurs dont pourtant seul le croisement peut permettre d’en cerner les contours. L’immensité rhizomatique du monde et face à elle … nous. Etres humains singuliers bien que de plus en plus participatifs, dotés certes de moultes prothèses mémorielles externes (dont celle du disque sous l’écran qui nous donne accès à cette immensité) mais au final, nous, avec notre mémoire. Rapport de force ?

Notre mémoire … L’envie de la « mesurer » ne date pas d’aujourd’hui. Cet article « How many Bytes in human memory » date de 1988.

  • si on compte les impulsions neuronales durant une vie entière, on arrive (environ) à 1020 bits
  • si on mesure le nombre total de synapses et que l’on considère que chacune contient quelques bits, on arrive alors à 1013 à 1015 bits
  • Voilà. Vous ferez vous-mêmes la conversion en térabits et aurez la gentillesse de la déposer en commentaires :-)

Enfin, ce billet récent d’Accelerating Future, nous indique qu’en 1984, on avait estimé qu’un être humain pouvait « retenir » l’équivalent de 2 bits mémoriels par seconde. Vous multiplierez vous-même par le nombre de secondes d’une vie (et là, inutile de laisser le résultat en commentaire). D’où l’idée (qui a dit « saugrenue » ?) de compter le nombre de bits mémoire par individu et de multiplier par le nombre d’individus ayant peuplé cette planète depuis l’arrivée de l’homo sapiens (50 000 ans avant JC). Ce qui donne : 107 terabytes, soit près de 20 fois l’information générée par Internet en 2002 selon les chercheurs qui cherchent.
Moralité 1 : d’après de savants et légèrement capilo-tractés calculs, l’humanité a mis 521 siècles pour emmagasiner ou produire l’équivalent de l’information produite en moins de 10 ans par Internet et la numérisation. Ce qui donne quand même un ordre d’idée intéressant et terme d’archivistique numérique :-) )
Moralité 2 : quand on veut compter, on peut toujours :-)
Moralité 3 : celle de Tim Berners Lee : « People have, since it started, complained about the fact that there is junk on the web. And as a universal medium, of course, it is important that the web itself doesn’t try to decide what is publishable. The way quality works on the web is through links. »

Originellement chez affordance.info, le 4 Mars, 2007

Popularity: 1% [?]

Partager et découvrir :
  • Digg
  • del.icio.us
  • Facebook
  • Google Bookmarks
  • BlogMemes Fr
  • NewsVine
  • Pownce
  • Scoopeo
  • StumbleUpon
  • Wikio FR
  • Technorati
  • Wikio
  • BlogMemes
  • Blogsvine
  • LinkedIn
  • Ma.gnolia
  • Ping.fm
  • Reddit
  • Slashdot

Articles en relation

Tags: ,

Leave Comment

Get Adobe Flash playerPlugin by wpburn.com wordpress themes