Secondo gli ultimi dati di NetCraft, un Internet Services Provider inglese che offre servizi per la sicurezza sulla rete e effettua ricerche e analisi su diversi aspetti di tutto quello che costituisce il mondo di Internet, nel mondo oggi ci sono circa 234 milioni di siti, di cui poco più di 72 milioni attivi. Guardando alla curva di crescita dei siti internet dal 1995 ad oggi, impressiona l’impennata che si è registrata negli ultimi 2 anni, forse dovuta anche alla sempre più veloce diffusione dell’uso del web nei paesi più popolosi della terra, India e Cina. Solo un anno fa i siti internet erano meno di 200 milioni. Ora si sta veleggiando verso i 250 milioni. Questo per quanto riguarda i siti.
Ma quante sono le pagine, o meglio, i documenti web nel mondo? Questo è un calcolo molto più difficile da fare, anche perché una grandissima parte del web noi non solo non la conosciamo, ma non è a noi neanche accessibile. Infatti, se a oggi i motori di ricerca, con i loro spiders, hanno recensito, e quindi reso accessibile, poco più di 3 miliardi di pagine e documenti web, è anche vero che la stragrande maggioranza dei documenti presenti sul web ancora oggi è inaccessibile, e va a costituire quello che viene chiamato il deep web (web profondo), in contrapposizione al surface web (web di superficie), quello indicizzato dai motori di ricerca. E non si sta parlando di un numero esiguo di elementi che rimangono fuori dal processo di indicizzazione quasi per sbaglio, ma della stragrande maggioranza degli elementi che costituiscono il web.
Secondo la società BrightPlanet, specializzata nello studio del deep web, quest’ultimo ha una quantità di documenti che è 1.000 volte superiore a quello del surface web.
In sintesi: oggi noi abbiamo accesso a 3 miliardi di documenti web, ma in tutto essi sono circa 3.000 miliardi.
Quindi noi abbiamo accesso a solo 1 millesimo di quello che c’è nel web. Interi database, cataloghi prodotti, informazioni fiinanziarie, documenti medici, e atanto altro ancora: tutte informazioni che rimangono nascoste agli spiders dei motori di ricerca, e quindi anche a noi.
Se a questo si aggiunge che solitamente gli utenti, quando devono cercare qualcosa, quasi mai vanno più in là della terza pagina di un motore di ricerca, e quindi sorvolano con lo sguardo solo una trentina di documenti web restituiti dal motore di ricerca in seguito a una ricerca per keywords, ecco che allora il numero di documenti web cui noi abbiamo effettivamente accesso risulta veramente infinitesimale rispetto alla mole di documenti che in realtà il web contiene. Certo, i motori di ricerca non sono l’unica porta d’accesso al web, ma rimangono la principale.
Numeri che fanno riflettere sull’immensità del web, sulle potenzialità non ancora sfruttate e sulla capacità dell’uomo di gestire e di fruire di una mole cosi elevata di informazioni.
Matteo Giovanelli
Milano, 23 novembre 2009
Se hai domande, commenti o richieste di approfondimenti sul contenuto di questo articolo, puoi scrivermi a:
Questo indirizzo e-mail è protetto dallo spam bot. Abilita Javascript per vederlo.
.





