I Big data vengono solitamente caratterizzati dalla presenza delle cosiddette “cinque” V: volume (straordinaria quantità di dati a disposizione), velocità (tempi di raccolta estremamente rapidi), varietà (eterogeneità di dati strutturati e non), valore (possibilità di analisi predittive) e veridicità (dati affidabili).
Aggiungerei una sesta V: vita. Dati di vita umana espressa attraverso parole, immagini, suoni, movimenti del corpo, onde cerebrali, sinapsi.
Il nostro essere sempre connessi alla rete, always on, dà una dimensione di continuità alla rilevazione dei dati forniti dal nostro vivere. I Big Data sono prodotti da noi e parlano di noi. Delle nostre identità, delle nostre relazioni sociali, del nostro rapporto con gli oggetti e con le macchine (di cui vogliamo sempre più misurare e prevedere il funzionamento per evitarne l’errore). Nei centri di ricerca internazionali, come ad esempio al MIT, gli studi si stanno sempre più concentrando su dispositivi tecnologici inseriti nel corpo umano (tatuaggi sulla pelle, chip nel cervello…). Non si studia più la relazione uomo-tecnologia; la tecnologia entra a far parte dell’uomo.
E allora lo scienziato del dato deve avere una competenza in più, quella delle scienze umane (riunendo sotto questo nome tutte le scienze che riguardano l’uomo e la società). È necessario affiancare alla competenza informatica (del raccogliere e interrogare i dati), a quella statistico-matematica (dell’analizzare ed estrarre modelli), a quella narrativa (del rappresentare e raccontare i risultati delle analisi), quella psicosociale, del comprendere il comportamento umano in relazione ai contesti emozionali e sociali.
Facciamo un esempio. Come estrarre senso dal fiume ininterrotto di conversazioni presenti in rete? Nell’analisi dei social network viene sovente usata la cosiddetta “sentiment analysis” che classifica la polarità delle parole, o delle co-occorrenze di parole, in “positiva”, “neutra” o “negativa”. Si rileva così il sentiment, l’”umore”, rispetto a un prodotto, a un programma televisivo, a un politico… Bene. E quando ci troviamo confrontati con fenomeni complessi come la fiducia dei giovani nel futuro, o i criteri di scelta del corso universitario da intraprendere?
Le parole esprimono emozioni, e dunque manifestano il modo di funzionare della mente. Un funzionamento fondato, come teorizzato da Matte Blanco, su una doppia logica: il pensiero asimmetrico, cosciente, che ci fa entrare in rapporto con un contesto o un evento; e il pensiero simmetrico, emozionale, che quel contesto o evento immediatamente suscita in noi. Sono emozioni immediate e primitive che rimandano a schemi come: “amico-nemico”, “dentro-fuori”, “alto-basso”, etc. Le persone percepiscono e danno significato agli eventi e alla realtà in cui operano, in primo luogo sulla base di un processo di simbolizzazione emozionale e, solo in secondo luogo (e non necessariamente), attraverso categorie di pensiero che articolano differenze ed elaborano dati di realtà. L’analisi del contenuto delle conversazioni in rete deve saper cogliere la “densità” emozionale contenuta nelle parole con specifici modelli di conoscenza e appropriate tecniche statistiche, come ad esempio l’analisi multivariata che consente di trovare le relazioni tra i nodi, raggruppando le parole in cluster di significato.
Allora, va bene lo sviluppo delle STEM (tanto richieste dal mercato), ma non dimentichiamo l’importanza delle competenze umanistiche e psicosociali per leggere, comprendere e interpretare i dati. La cultura del dato: quel partire da indizi per estrarre “senso” e conoscenza sull’uomo, per l’uomo.
Le premesse epistemologiche orientano la comprensione dei fenomeni.