numeri
N.38 Febbraio 2023
Dal punto di vista della statistica…
Andrea Nasuto è uno studioso di statistica all'Università di Liverpool e attraverso le proiezioni del suo lavoro osserva la realtà. Ma avverte: dietro numeri e percentuali ci sono sfumature, dubbi e persino fragilità
Non sappiamo che rapporto avesse Charles Bukowski con la matematica, ma possiamo ipotizzare fosse ben peggiore di quello che aveva con la letteratura. Infatti affermava di non fidarsi delle statistiche «perché un uomo con la testa nel forno acceso e i piedi nel congelatore, statisticamente ha una temperatura media».
Andrea Nasuto, invece, fin dai tempi del Liceo, ricorda distintamente di aver nutrito un’autentica passione per i numeri. Per vedere un’applicazione pratica di quella che, nell’adolescenza, era solo una predilezione confortata da ottimi voti, ha dovuto attendere gli studi universitari. «Ero affascinato dalla possibilità di utilizzare i numeri per comprendere le relazioni umane, in particolare inserendole in un determinato contesto geografico». Apprezziamo lo sforzo di Andrea di farci capire, in parole semplici, di cosa si occupi uno statistico, ma non possiamo dissimulare la nostra difficoltà.
Gli chiediamo di farci un esempio, forse ci sarà d’aiuto. «Ad esempio mi sono occupato del tema dell’odio online» riprende lo statistico, con un sorriso affabile. La ricerca in cui è stato coinvolto puntava ad indagare «come si sviluppa, che forma e che estensione ha l’hate speech. Insieme al team abbiamo iniziato a lavorare sui dati testuali e numerici fornitici da Twitter. Con diverse metodologie li abbiamo trattati, soprattutto grazie all’Artificial Intelligence».
Ecco, quando pensavamo di vedere la luce ci ritroviamo persi di nuovo. La AI, spiega Andrea, è istruita dal team di ricerca stesso: «Un uomo comprende se un testo è razzista, ma non possiamo metterci a leggere milioni di tweet, ci impiegheremmo degli anni. Parte del nostro compito, quindi, è stato insegnare alla “macchina” a capire quando un messaggio è aggressivo o violento».
Il lavoro naturalmente, era solo all’inizio, perché poi sono stati inseriti altri parametri e variabili, per esempio lo spazio geografico. «A seconda delle metodologie o dei dati che si incrociano, aggiungi o togli delle sfumature alla ricerca che stai svolgendo; lo stesso numero di partenza, a seconda di come lo interpreti, può portare a conclusioni diverse».
Comprendiamo sempre meglio di cosa si occupi Andrea, che alla nostra domanda su quale sia il nome esatto della sua professione, ci risponde: «Attualmente sono PhD Candidate e Data Scientist al Geographic Data Science Lab dell’Università di Liverpool».
Nuove domande affiorano quando Andrea ci svela che «il numero ha un valore ma va interpretato: è sbagliato ritenerlo il rifugio della verità».
Il ragazzo che al Liceo era convinto che la matematica fosse l’esatta descrizione della realtà, alla luce del proprio percorso formativo e lavorativo, oggi sottolinea che «è una delle possibili descrizioni della realtà».
Non vuole arrivare alla conclusione, forse troppo estrema, che le statistiche non contano nulla perché, afferma senza tentennamenti: «Il mondo è fatto di statistica, tutto ciò che facciamo si basa sul metodo scientifico. La statistica è la lente con cui analizzo il mondo, è la base su cui tutte le scienze si sono sviluppate. Questo però non esclude che i modelli che utilizziamo siano, dal punto di vista matematico, pieni di problemi».
La recente pandemia e il suo contorno di roventi polemiche è un esempio che abbiamo ancora ben impresso nella mente. Spiega Andrea che «nonostante ci fosse una base scientifica nelle decisioni prese, nessuna di esse si è rivelata esente da criticità. Infatti la scienza non è deterministica, anzi è ricca di sfumature. Il numero non risolve completamente il dubbio. Piuttosto che affermare che abbiamo raggiunto la verità, dovremmo dire che stiamo tentando di minimizzare il dubbio».
Pensiamo ai valori dei nostri esami del sangue e al medico che, durante la visita, li sta leggendo. Ci corre un brivido lungo la schiena. «Siamo vittime dell’imprinting avuto sui banchi di scuola quando, se il vicino di banco prendeva 8, eravamo sicuri che fosse stato più bravo di noi che avevamo raggiunto a fatica un 7», prosegue Andrea. «Su alcuni aspetti della vita comune, il numero è una bussola indispensabile ma – puntualizza lo studioso – su tematiche più complicate, come per esempio le relazioni umane, la questione diventa molto complessa».
Quindi possiamo dare ragione a Bukowski?
Andrea ride e poi, con pazienza, riprende il concetto: «Dobbiamo guardare alle statistiche con molta prudenza, sapendo che nessuna ha la descrizione fedele della realtà. Bisogna essere consapevoli che dietro di esse c’è uno statistico, una persona con i propri limiti; inoltre, alla base di molte ricerche, c’è un contratto… La medesima statistica sarà presentata diversamente se a commissionarla è, per esempio, “Il Giornale” o “Il Manifesto”, perché spesso la soggettività prevarica il dato».
SCHEDA
La statistica, i fenomeni sociali e due documentari
Andrea Nasuto è un PhD candidate e data scientist al Geographic Data Science Lab dell’University of Liverpool. Si occupa di studiare le science sociali in maniera computazionale utilizzando analisi statistica e machine learning. I suoi progetti includono studiare il sentimento anti-migratorio online e le sue relazioni con spazio geografico e urbano, determinare migrazioni interne utilizzando dati di Facebook per le Nazioni Unite, analizzare l’impatto dell’esplosione di Beirut sulle comunità locali attraverso immagini satellitari per la London School of Economics.
Insieme a suo fratello Marco, ha prodotto due documentari su migrazioni e processi identitari ‘Made of Limestone’ e ‘Kosmonauts’ proiettati dal Brasile a Singapore.