Ultima edizione | Archivio giornali | Archivio tematico | Archivio video

CNR: Alamanacco della Scienza

Archivio

N. 7 - 7 apr 2021
ISSN 2037-4801

Focus - Mappe  

Informatica

Siamo tutti nomadi digitali

Con la disponibilità di reti ad alta velocità e dispositivi mobili più performanti e miniaturizzati il viaggio digitale sul web si fa sempre più familiare e se si hanno intraprendenza e una buona dose di coraggio, anche il lavoro può beneficiarne, passando da lavoro fisico a digitalizzato. “Oggi, lavorando da casa, siamo diventati tutti nomadi digitali. Per essere connessi basta un collegamento Internet, che dà risposte a ogni domanda se sappiamo dove e come cercare”, commenta  Marco Pellegrini, ricercatore dell'Istituto di informatica e telematica (Iit) del Cnr di Pisa, ed esperto in algoritmi e tecnologie del web.  

Nel web, ci sono però vere e proprie trappole. Non a caso, una delle metafore più utilizzate per descriverlo è l'immagine del labirinto: un sistema virtuale dov'è facile smarrirsi cercando l'“uscita” verso ciò che vogliamo sapere e la strada per passare da un sito all'altro; possono passare decine di minuti, a volte ore, prima di centrare l'obiettivo.

Non tutti però amano vagare e, in particolare, non ama farlo Google, il primo motore di ricerca al mondo che viaggia a un ritmo diverso: prende scorciatoie, ottimizza percorsi, classifica e arriva velocissimo al risultato, muovendosi in una vera e propria mappatura digitale del web. Quali algoritmi segue e qual è il meccanismo su cui basa velocità e accuratezza dei risultati?

“I motori di ricerca, e tra questi Google, hanno effettivamente un grande lavoro da  fare, che inizia con un'attività preliminare chiamata in gergo 'crawling', durante la quale fanno una mappatura di ciò che ritengono importante nel web”, spiega il ricercatore del Cnr-Iit. “Il concetto di importanza è centrale per il loro funzionamento e si basa su codici e algoritmi noti agli sviluppatori, che individuano le pagine web più importanti e le mettono in un ordine basato sulla loro autorevolezza, legato a sua volta al concetto di circolarità, per cui se una pagina importante è linkata a un'altra, quest'ultima, per Google, acquista valore. Una volta selezionate le pagine, Google procede con un secondo passaggio legato a un algoritmo prestato dall'algebra lineare, il PageRank, con il quale dà un voto ai siti e alle pagine web e inizia una vera e propria analisi linguistica dei contenuti, trovando parole o gruppi di parole che esprimono concetti, mettendoli poi in un grande indice, processo di indicizzazione delle parole chiave”.

In sostanza, Google classifica le parole chiave o gruppi di parole chiave e le mette in una sorta di grande dizionario che, per dimensione, occupa centri di calcolo distribuiti geograficamente su tutta la superficie terrestre.  A questo punto è pronto per dare le risposte ed entra in scena l'utente, che digita la sua richiesta con una o al massimo tre parole chiave e su questa base Google fornisce l'elenco di tutti i siti che rispondono alla domanda, elencandoli in ordine di importanza.

I motori di ricerca nel web avanzano dunque attraverso parole chiave, che sono il fulcro attorno al quale ruota il loro meccanismo, ma al tempo stesso sono un indice straordinario di cosa cercano gli utenti a livello globale, offrendo una finestra privilegiata da cui osservare l'andamento della società in tempo reale.

Tra tutte le parole chiave più cercate al mondo, nel 2020 non poteva ovviamente mancare “Coronavirus” che, con 60 milioni di ricerche al mese, ha caratterizzato il web con tutto il suo pacchetto di preoccupazioni, paure e fame di sapere della società piegata dalla pandemia. All'ossessione per le diete che ha caratterizzato il 2019, nel mondo  si è sostituita quella per la salute e la sicurezza. “Che cos'è il Coronavirus?” è la domanda più cercata nel 2020 dagli italiani, con oltre 300.000 ricerche al mese, seguita da “elezioni Usa”, “classroom”, weschool” e, naturalmente, dalla ricerca sull'ampia modulistica per dichiarazioni e autocertificazioni a seguito dei numerosi Dpcm.

E rimanendo in tema di lockdown, di grande tendenza sono state, le domande “how to”, in italiano “come si fa”, che ci ha visto esperti panificatori, amanti del bricolage, della pittura, sarti improvvisati alle prese con le mascherine. Immancabile anche la ricerca sulla “serie A”, che compare 16.6 milioni di volte al mese, sulla spinta del grande amore per il calcio che anima gli italiani, da mesi a digiuno dell'emozione da stadio e in cerca nel web  di un surrogato fatto in casa.

I dati potrebbero proseguire analizzando le ricerche più strampalate, ad esempio “perché sono stati inventati i cornflakes” o il meme che ha spopolato nel 2020 del “perché la scopa sta in piedi”, ma rovesciando la prospettiva, l'analisi potrebbe ripartire questa volta dalle parole meno cercate dagli utenti, offrendo lo spunto per un'analisi qualitativa oltre che quantitativa del divenire della nostra società.

Per saperne di più: https://trends.google.it/trends/yis/2020/GLOBAL/

Maria Teresa Orlando

Fonte: Marco Pellegrini, Istituto di informatica e telematica, Pisa , email marco.pellegrini@iit.cnr.it -