Home Page Riflessioni.it
Riflessioni sulle scienze

Riflessioni sulle Scienze

di Alberto Viotto    indice articoli

 

Il felice disordine del web

Maggio 2008

  • La biblioteca di Babele

  • I motori di ricerca

  • Come usare i motori di ricerca

  • Il successo di Google

  • L’importanza della posizione

 

Il felice disordine del web

La biblioteca di Babele

Nel suo celebre racconto “La biblioteca di Babele” lo scrittore argentino Jorge Louis Borges immagina una immensa biblioteca i cui libri comprendono tutte le possibili combinazioni di lettere. Nella Biblioteca si trovano tutti i libri che possono esistere, ma i testi utili sono nascosti tra moltitudini di volumi insensati:

“Uno di questi libri, che mio padre vide nell’esagono del circuito quindici novantaquattro, constava delle lettere MCV, perversamente ripetute dalla prima all’ultima riga. Un altro (molto consultato in questa zona) è un mero labirinto di lettere, ma l’ultima pagina dice Oh tempo le tue piramidi. E’ ormai risaputo: per una riga ragionevole,  per una notizia corretta, vi sono leghe di insensate cacofonie, di farragini verbali e di incoerenze.”

Spesso chi si accosta al web prova uno sconcerto simile a quello dei bibliotecari di Borges. Nel web si trova una enorme quantità di informazioni, certamente non tutte (come nella Biblioteca), ma più che in qualunque altro strumento. Per trovare le informazioni che ci servono, però, è necessario cercare tra una moltitudine di pagine insensate o irrilevanti. Il numero delle pagine web disponibili in rete è superiore ai dieci miliardi, ma la stragrande maggioranza di queste pagine non ci può minimamente interessare: pubblicità, vecchie notizie di cronaca, siti personali autocelebrativi di sconosciuti, discussioni insulse e veri e propri relitti, pagine che da anni nessuno consulta o modifica.

Un altro motivo di sconcerto per chi cerca di capire la natura del web è la sua sostanziale assenza di struttura. L’indirizzo di una pagina di solito non contiene informazioni sufficienti a catalogarla. Al loro interno alcune organizzazioni che si affacciano sul web cercano di mantenere una struttura coerente delle pagine, ma il numero delle organizzazioni è talmente alto e i criteri di catalogazione talmente eterogenei che non si può pensare ad una struttura globale.

 

I motori di ricerca

A differenza dei bibliotecari di Borges i navigatori del web possono effettivamente usare il loro strumento, grazie ai cosiddetti “motori di ricerca”, con cui è possibile districarsi nell’oceano delle informazioni. Questi programmi leggono le pagine web di cui sono a conoscenza, seguendo tutti gli hyperlink che trovano. In questo modo si creano degli indici in costante aggiornamento, non esaustivi ma sufficientemente ricchi per la maggior parte delle esigenze.

Gli indici dei motori di ricerca non sono organici, ma si limitano ad indicare in quali pagine sono presenti determinate parole o combinazioni di parole. Nonostante ciò la loro efficienza è elevatissima, e sembra dimostrare che in fondo l’ordine non è una qualità indispensabile. La ricchezza delle informazioni disponibili sul Web è tale che si può fare a meno di una struttura globale.

 

Come usare i motori di ricerca

L’utilizzo dei motori di ricerca è molto semplice: si va su un portale come www.yahoo.it o www.lycos.it, o su un sito specializzato come www.google.it (che ha il catalogo più vasto al mondo, più di dieci miliardi di pagine), e si digita qualche parola che ha pertinenza con l’oggetto della ricerca. Il motore ritorna un elenco di puntatori a pagine che possono interessare, corredate da un breve riassunto.

Qualsiasi argomento si voglia approfondire, le opere del regista di un film visto anni fa, la discografia di un gruppo musicale, il parere della critica su un autore, il web è la fonte più ricca di informazioni che si abbia a disposizione. Se si ha un problema medico e si vuole essere al corrente degli ultimi sviluppi delle ricerche, sul web quasi sicuramente si possono trovare le informazioni che ci servono. È molto probabile che qualcuno nel mondo abbia inserito delle pagine sull’argomento e che in qualche maniera riusciamo a raggiungerle.

Nell’utilizzo dei motori di ricerca è necessaria qualche accortezza; è molto importante utilizzare parole chiave significative, che è probabile che si trovino nei documenti che cerchiamo. Se si vogliono ottenere informazioni sulla vita di una persona, ad esempio, si possono utilizzare come parole chiave il nome e cognome e l’anno di nascita, che quasi sicuramente sono presenti in un profilo biografico.

Per evitare di perdere tempo accedendo a pagine che non ci interessano si devono scorrere i riassunti riportati dal motore di ricerca. In questa fase la propria abilità è fondamentale; non vi sono al momento strumenti che possano evitare fraintendimenti. Se si superano le prime difficoltà, però, ci si trova a disposizione lo strumento di conoscenza di gran lunga più efficace che sia mai esistito.

 

Il successo di Google

Google non è stato il primo motore di ricerca Internet (è nato nel 1998, mentre Altavista ha iniziato nel 1995), ma si è decisamente affermato e conta molte centinaia di milioni di utilizzatori ogni giorno, nonostante vi siano altri concorrenti con eccellenti caratteristiche. Ormai “cercare su Google” è diventato sinonimo di “cercare su Internet” e si dice “googlare qualcuno” se si vuole scoprire tutto di una persona tramite una ricerca sul web (una pratica che sembra particolarmente in voga tra i single che vogliono essere preparati per un appuntamento).

Quali i motivi del successo? Una ragione è sicuramente la completezza del suo database di pagine Internet, che ne contiene più di 10 miliardi. La crescita di questo elenco è stata aiutata dalle semplici modalità per inserirvi il proprio sito (è sufficiente andare alla pagina www.google.com/addurl.html), ma in questo Google non è molto diverso dai suoi concorrenti. La tecnica utilizzata per popolare il database è sempre la stessa: si parte dalle pagine note, segnalate dagli utenti o presenti in un elenco di partenza. Se le pagine note contengono dei puntatori ad altre pagine, si vanno ad esaminare anche queste ultime e così via, seguendo tutti i vari hyperlink.

 

L’importanza della posizione

Quando si cerca una informazione tramite un motore di ricerca è molto probabile che la si trovi, grazie alla dimensione del database, ma questo non è sufficiente. Se si inseriscono delle chiavi di ricerca poco specializzate, è probabile che venga proposto un numero molto elevato di risposte, che non possono essere prese tutte in considerazione. Se la risposta ad una ricerca propone 1000 pagine di risultati, di solito si esaminano solo le prime 2-3. Per questo motivo è importante il posizionamento delle risposte. Alcuni motori di ricerca “vendono” il posizionamento, facendo apparire per primi i siti di chi paga per questo. Altri, però, ritengono questa pratica contraria all’interesse degli utenti e si rifiutano di adottarla, anche se ovviamente accettano di vendere spazi pubblicitari chiaramente identificabili nelle loro pagine (è da questo, ad esempio, che Google trae la maggior parte dei suoi utili).

L’algoritmo in base al quale Google decide il posizionamento è stato sviluppato dai suoi fondatori, Sergey Brin e Larry Page, quando erano ancora studenti universitari e privilegia la “qualità” delle pagine, decisa in base al numero di link alla pagina (e cioè quante altre pagine web la referenziano). In questo modo si presentano per prime le pagine più popolari del web. Vi sono però molti altri criteri, come quante volte le parole chiave compaiono in una pagina, la sequenza e la distanza tra di loro, le parti del documento in cui appaiono.

L’algoritmo di Google è stato molto apprezzato dagli utenti, che ne hanno decretato il successo, ma ha delle debolezze. Alcuni gruppi di attivisti antirepubblicani, ad esempio, hanno riempito il Web di pagine con link in cui il sito della Casa Bianca è associato alle parole “miserabile fallimento”, per cui chi usa in Google la chiave di ricerca “miserable failure” viene rimandato alla biografia di George W. Bush. Questa pratica, detta “google bombing”, è però per fortuna rimasta un fenomeno marginale.

 

    Alberto Viotto

 

Se qualche lettore trovasse questo articolo interessante o ne volesse discutere, all'autore farebbe piacere ricevere delle e-mail all'indirizzo: alberto_viotto@hotmail.com

 

Altri articoli di Alberto Viotto

 

Alberto Viotto offre gratuitamente due suoi Ebook:

 

Come ti fregano
Analisi dei meccanismi del marketing ed altri trucchi

 

"Da mattina a sera, sui giornali, sulle televisioni, sul web,  siamo sommersi da messaggi pubblicitari che sembrano pensati per un pubblico di semideficienti. Naturalmente il circo del marketing ha un costo, che ricade sull’ambiente ma anche su di noi, costretti a pagare di più i prodotti che ci servono (circa 400€ in più in media su ogni auto nuova).
Di chi la colpa? Ahimè, è nostra, perché compriamo i prodotti pubblicizzati; se la pubblicità non facesse aumentare le vendite i produttori smetterebbero di  tormentarci. Un rapido esame dei meccanismi del marketing ci può aiutare ad immunizzarci."

Achille e la tartaruga e altri paradossi

 

"Una nuova e più elegante soluzione al paradosso più famoso. Altri celebri enigmi (il sorite, il cretese mentitore, il gatto quantistico, la stanza cinese) affrontati da un punto di vista non convenzionale".


I contenuti pubblicati su www.riflessioni.it sono soggetti a "Riproduzione Riservata", per maggiori informazioni NOTE LEGALI

Riflessioni.it - ideato, realizzato e gestito da Ivo Nardi - copyright©2000-2024

Privacy e Cookies - Informazioni sito e Contatti - Feed - Rss
RIFLESSIONI.IT - Dove il Web Riflette! - Per Comprendere quell'Universo che avvolge ogni Essere che contiene un Universo