Ultima edizione | Archivio giornali | Archivio tematico | Archivio video

CNR: Alamanacco della Scienza

Archivio

N. 5 - 4 mag 2016
ISSN 2037-4801

Focus - Festa dell'Europa  

Informatica

SoBigData: big data e social mining

Il progetto 'SoBigData' ha l'obiettivo di fornire un ecosistema integrato di dati, strumenti e competenze che renda possibile grandi esperimenti di social mining sulle varie dimensioni della vita sociale e sulle attività umane memorizzate nei Big Data (dati da social media, da smartphone, da open data, da linked data, etc.), fondati su principi etici di trasparenza, fiducia e rispetto della privacy. È finanziato con 6 milioni di euro dalla Comunità Europea attraverso il programma Horizon 2020-Infraia 2014-2015 e ha una durata di 4 anni.

SoBigData servirà comunità interdisciplinari di data scientist, creerà nuove opportunità di ricerca e innovazione nelle scienze umane, sociali, economiche e Ict, facilitando il confronto, il riuso e l'integrazione di big data, open data, linked data, metodi analitici e servizi, e promuovendo una scienza 'aperta' e 'riusabile'.

Tre i principali componenti in cui è articolato: un ecosistema per la procura, la cura e l'accesso ai Big Data all'interno di una cornice etica e rispettosa della privacy; una piattaforma aperta di metodi analitici di social mining e di competenze per il loro uso, incluso le strategie per condividere e preservare i risultati degli esperimenti; una rete di opportunità di alta formazione in social mining, finalizzata a creare la nuova generazione di data scientist.

L'infrastruttura offre un catalogo in continuo aggiornamento di dataset, processi analitici e algoritmi sui temi: Human Mobility Analytics, Social Data, Social Network Analysis, Text and Social Media Mining, Web Analytics. Agisce su tre pilastri fondamentali: accesso, ricerca e disseminazione/formazione.

Due i tipi di accesso per permettere di usufruire dei servizi esposti: Transnational access, dove l'utilizzatore accede ai servizi, dati e metodi direttamente in loco, venendo ospitato fisicamente in una delle infrastrutture di ricerca nazionali e dove l'esperimento è realizzato spalla a spalla con i ricercatori della infrastruttura; Virtual access, nel quale l'interazione avviene in modo virtuale, sfruttando strumenti web, e attraverso la creazione di appositi Virtual Research Environment, che personalizzano i servizi rispetto allo scienziato che ne richiede accesso.

Per quanto riguarda la ricerca, SoBigData ha identificato i primi quattro Virtual Research Environment chiamati Exploratories, ciascuno dei quali consiste in una raccolta dati, processi e narrazioni in contesti di specifico interesse: Societal Debates, che studia come si sviluppano temi controversi e come si polarizzano le opinioni nelle conversazioni on-line; Societal Well-being & Economic Performance, che studia come costruire, monitorare e prevedere nuovi indicatori di benessere; City of Citizens (Human Mobility) per la modellazione di mobilità individuale e collettiva per città intelligenti e partecipative; Human Migration (Migration Studies), per analisi e previsione di flussi migratori e livello globale.

Terza componente è la formazione di figure professionali di Data Scientist, una priorità per SoBigData. I ricercatori del laboratorio italiano (SoBigData.it) sono promotori e attuatori del master di Big Data Analytics dell'Università di Pisa. Sono inoltre pianificati diversi eventi formativi rivolti a studenti e insegnanti scuole superiori, scuole di dottorato e Boot camps e Dathatons, ossia eventi formativi non convenzionali rivolti a professionisti che vogliono riqualificarsi.

Il progetto è coordinato dal Cnr attraverso il laboratorio toscano SoBigData.it, un'iniziativa che aggrega universita ed Enti di ricerca del sistema toscano tra cui gli Istituti di scienza e tecnologie dell'informazione 'A. Faedo' (Isti) e di informatica e telematica (Iit) del Consiglio nazionale delle ricerche; Universita e Scuola normale superiore di Pisa; Scuola Istituzioni, mercati, tecnologie (Imt) di Lucca. I partner europei sono le università di Sheffield (Uk), Hannover (De), Tartu (Estonia), Aalto (Finlandia), Zurich (Svizzera), Delft (Olanda) e il tedesco Fraunhofer. Il coordinatore è Fosca Giannotti dell'Isti-Cnr di Pisa.

Le infrastrutture nazionali esistenti su cui SoBigData si basa includono varie strutture tra le quali SoBigData.it, laboratorio che offre dati, servizi e competenze su Text e Social Media Mining, Social Network, Human Mobility Data, Visual e Web Analytics; Gate Cloud, che si occupa di elaborazione su grande scala di linguaggio naturale e text mining all'Università di Sheffield.

Fosca Giannotti

Fonte: Fosca Giannotti, Istituto di scienza e tecnologie dell'informazione "Alessandro Faedo", Pisa, tel. 050/6212999 , email fosca.giannotti@isti.cnr.it -