Ultima edizione | Archivio giornali | Archivio tematico | Archivio video

CNR: Alamanacco della Scienza

Archivio

N. 0 - 14 gen 2009
ISSN 2037-4801

Focus  

Informatica

Metti la semantica nel motore (di ricerca)

Un motore di ricerca capace di rispondere alle domande e interpretare le parole chiave a seconda del contesto, senza vincoli linguistici di sorta. Si chiama 'motore di ricerca semantico' e promette di essere la bussola più evoluta per navigare nel mare magnum di internet. Abituati a setacciare la rete tramite Google (da cui il neologismo "I google" che per gli anglosassoni è sinonimo di "sto facendo ricerche sul web"), gli utenti ben conoscono le difficoltà di raggiungere il bersaglio: cercare informazione sul web è un'impresa titanica che richiede molta pazienza e, sempre più spesso, anche l'utilizzo di qualche espediente tecnico non proprio alla portata di tutti.
"Google si basa sulle parole digitate dall'utente, escludendo quei termini che hanno poca rilevanza come articoli o preposizioni", osserva Andrea Marchetti dell'Istituto di informatica e telematica (Iit) del Cnr di Pisa. "La sua fortuna sta nel modo con cui vengono riordinati i risultati: Google, infatti, assegna delle priorità alle singole pagine in base al numero di collegamenti che da altre pagine puntano alla pagina in questione. Un esempio: se nella pagina A c'è un link alla pagina B, questo viene assunto da Google come un voto per B. Motori di ricerca come Google soffrono però del fatto che si limitano a cercare le parole chiave inserite dall'utente, ignorando ogni possibile significato riposto nella domanda. Se scrivessi 'qual è la montagna più alta d'Europa', ad esempio, Google considererebbe le singole parole (qual, è, montagna, più, alta, Europa), ma ne ignorerebbe completamente il significato".
Per superare i limiti linguistici e il modo di rispondere degli attuali motori di ricerca semantici viene in aiuto il "Progetto Kyoto" (Knowledge yielding ontologies for transition-based organization), promosso dall'Unione europea. Circoscrivendo la ricerca a particolari domini di interesse, il nuovo algoritmo consentirà di effettuare ricerche componendo domande nella propria lingua, ricevendo vere e proprie risposte. Attualmente Kyoto parla italiano, inglese, spagnolo, basco, olandese, cinese e giapponese, ma la sua struttura modulare consentirà di accettare qualsiasi nuovo linguaggio.
"Grazie ai motori semantici", aggiunge Maurizio Tesconi dell'Iit-Cnr, "le ricerche restituiranno risposte nella lingua madre dell'utente, estraendole dai documenti presenti in rete anche se appartengono ad altre lingue. Un esempio: si potrà chiedere 'se esiste un servizio pubblico che collega Pechino con la muraglia cinese' e ricevere la risposta: 'Pechino è collegata con... tramite...' anche se la fonte di informazioni è un documento scritto in ideogrammi cinesi".
Attualmente il progetto limita le sue ricerche a un particolare dominio di conoscenza: le problematiche ambientali; di qui il nome Kyoto, ispirato all'omonimo Protocollo. "Il problema", concludono i due ricercatori dell'Iit-Cnr, "è che l'estensione di un dizionario e dell'ontologia per diversi settori della conoscenza è un lavoro oneroso, che richiede la partecipazione di molte persone, le quali devono trovare un consenso generale sui concetti da legare ai singoli termini. L'Istituto di informatica e telematica è impegnato proprio nella creazione di strumenti che consentano in modo facilitato di estendere tali dizionari: il modello di riferimento è quello 'collaborativo', già sfruttato con successo per l'enciclopedia online Wikipedia".

Luca Trombella

Fonte: Maurizio Tesconi, Istituto di informatica e telematica, Pisa, email maurizio.tesconi@iit.cnr.it

Fonte: Andrea Marchetti, Istituto di informatica e telematica, Pisa, tel. 050/3152649, email andrea.marchetti@iit.cnr.it