Far parlare i numeri

Le mappe sugli scenari del voto Usa di FiveThirtyEight

Non conosci ancora Good Morning Italia?
C’è una prova gratuita per te

“Confidiamo in Dio. Tutti gli altri, invece, devono fornire dati”, diceva l’ingegnere e statistico americano William Edwards Deming. 

I numeri hanno la capacità di fotografare, misurare e metterci in condizione di comparare un fenomeno. Al tempo stesso, in campo giornalistico, la lettura e la comprensione dei dati sono un argomento delicato, come la pandemia e i sondaggi elettorali ci ricordano.

Per noi che lavoriamo su contenuti giornalistici e su una sintesi che cerca di dare ai lettori un’essenziale “spremuta” delle notizie del giorno, raccontare numeri e dati è una parte non da poco della sfida che interessa sia i contenuti selezionati sia il modo di raccontarli.

A questo proposito, una guida interessante è il saggio di Tim Harford, giornalista ed economista inglese, intitolato “How to Make the World Add Up” – che è stato anche lo spunto per uno dei nostri approfondimenti domenicali – che, in materia di Covid-19 e non solo, fornisce una serie di suggerimenti sul come rendere più comprensibili i numeri e il modo più efficace per leggerli.

Harford, che conduce anche un programma radiofonico su Bbc4 dedicato alla statistica, “More or less”, sostiene che i piani su cui si può lavorare per rendere i numeri comprensibili sono vari. Il primo è il linguaggio usato perché più è ambigua la definizione che usiamo per indicare un fenomeno o un parametro più è difficile capire che cosa vuol dire davvero il dato associato: per esempio, sapevate che le statistiche americane sui morti per armi da fuoco includono anche i suicidi e, quindi, è necessario conoscere e rendere chiaro questo aspetto se si parla invece di stragi? Ancora, è utile inserire il dato in un contesto o trovare una misura di confronto che sia immediatamente tangibile: per esempio, un conto è parlare del debito pubblico di un Paese su scala nazionale – in Italia corrisponde al momento a circa 2.600 miliardi di euro -, un altro è suddividerlo per il numero di abitanti – che, nel nostro caso, significa un debito pro-capite di poco più di 43 mila euro. Così una cifra praticamente iperbolica assume una consistenza nettamente più concreta.

Pensando all’attualità, ormai da mesi ci stiamo confrontando con il fatto che i dati relativi al contagio sono in modo pressoché sistematico affetti dall’irregolarità e dall’incoerenza e molto dipende, innanzi tutto, dalla difficoltà stessa di raccoglierli, prima ancora che di elaborarli e spiegarli. Da questi dati, però, dipendono anche tutte le scelte per contrastare il contagio e le sue conseguenze, economiche e non.

Vediamo alcuni esempi utili per spiegare e capire ciò che i dati a disposizione ci dicono:

  1. Attenzione ai numeri assoluti. Premesso che oggi è indubitabile che la curva del contagio abbia ripreso a salire, questo pezzo di Riccardo Saporiti, uscito a inizio ottobre sulla rubrica “Infodata” del Sole 24 Ore, ci spiega bene perché per capire cosa accade e avere un quadro completo osservare solo i numeri assoluti dei contagi ha poco senso. Il numero dei nuovi positivi, spiega l’articolo, è più significativo se lo rapportiamo al numero di tamponi. Un conto, infatti, è dire che “il 3 ottobre ci sono stati 2.844 positivi, mai così tanti da aprile” e un altro è dire che “il 3 ottobre ci sono stati 2.844 positivi, pari a uno ogni 41,8 dei 118 mila tamponi effettuati”. Ad aprile, quando il 21 si registrò un numero simile, 2.729 contagiati, il rapporto era di un positivo ogni 19 test effettuati (in tutto i tamponi di quel giorno erano 52 mila). 
  2. Indicatori. Come stiamo vedendo in questi giorni, per capire qual è il livello di emergenza servono più parametri: oltre ai positivi, la differenza in termini di misure di contenimento la fanno anche i dati relativi alle condizioni degli ammalati e, in particolare, di coloro devono essere ricoverati in reparti destinati ai malati di coronavirus e in terapia intensiva.
  3. Comparare il comparabile. Un altro rischio su cui allerta l’articolo del Sole 24 Ore è quello dei confronti da un giorno all’altro: ci sono una serie di fattori che “disturbano” l’affidabilità dei dati, come ad esempio il fatto che possono esserci dei ritardi nella comunicazione dei dati o che nei fine settimana si fanno meno tamponi. Per questo è fondamentale rispettare la regola di osservare una tendenza su un arco di tempo più lungo e usare tecniche come la media mobile che, calcola il valore medio considerando i dati di un uguale numero di giorni precedenti e successivi a quello considerato.
  4. I dati, alla fonte. Un altro aspetto utile per capire meglio di cosa parliamo lo racconta questo articolo Lorenzo Ruffino su Pagella Politica, pubblicato a fine estate e che spiega quali sono i dati messi a disposizione dalla Protezione Civile: uno è il numero effettivo dei tamponi effettuati e l’altro è il numero dei casi testati. La differenza sta nel fatto che il primo dato ci dice quanti test sono stati fatti materialmente, mentre i casi testati sono i soggetti che sono stati esaminati. Quindi, a una persona che ha fatto un doppio tampone in 24 ore per accertare la negatività corrisponde a un singolo caso testato, ma a due test nel conteggio di questi ultimi.

Tra poche ore rispetto al momento in cui scriviamo, riguardo a tema dell’incertezza e delle probabilità contenute nei dati, le elezioni presidenziali negli Usa – ne abbiamo parlato la scorsa settimana – saranno un altro interessante banco di prova in fatto di chiarezza e contestualizzazione del dato. Micah Coehn, managing editor, di FiveThirtyEight, in un’intervista per il podcast prodotto dal sito DataJournalism.com, spiega come il sito americano, specializzato in dati politici e visualizzazioni, abbia scelto di raccontare le diverse ipotesi probabili attraverso una serie di mappe, basate sui dati, che illustrano gli scenari possibili. Tutti realistici, ovviamente, ma nessuno, fino alla fine dello spoglio, totalmente certo.

Per concludere, far parlare i dati senza distorcerne il messaggio sta all’incrocio fra competenza matematica e linguistica, tra capacità di sintesi e rispetto della complessità.