Coronavirus: dati e grafici for dummies /3

26 Maggio 2020
Posted in Articoli
26 Maggio 2020 alessandro

Dal 19 aprile la Protezione Civile, oltre al numero dei tamponi effettuati, fornisce quotidianamente anche il numero dei soggetti testati regione per regione: la differenza tra i due dati è che i soggetti testati rappresentano un sottoinsieme dei tamponi effettuati, perché nel corso della malattia le persone devono essere sottoposte al tampone più di una volta, e dunque il numero totale dei tamponi comprende anche i tamponi “doppi” e “tripli”, cioè quelli fatti e rifatti alle stesse persone due, tre o più volte.

Dopo qualche giorno di assestamento, probabilmente necessario ad alcune regioni per mettere insieme il dato in modo accettabile (cosa che a volte ancora non riesce del tutto, perché di quando in quando, in qualche regione, schizza ancora su e giù in modo difficilmente comprensibile), quel numero ha iniziato a diventare significativo: e dunque è interessante provare a utilizzarlo, mettendolo in relazione ai nuovi casi che vengono scoperti giorno dopo giorno, per capire (meglio: per tentare di intuire) come sta procedendo l’epidemia nelle diverse regioni del paese.

Prima, però, occupiamoci di una questione preliminare: che rapporto c’è, nelle diverse regioni, tra tamponi fatti e soggetti testati? Cioè, quale percentuale dei tamponi fatti ha riguardato singoli individui, e quale invece si riferisce a tamponi ripetuti su soggetti che erano stati già testati in precedenza?

Istintivamente verrebbe da pensare: sarà una percentuale più o meno uguale in tutte le regioni. Invece, dati (e conseguente grafico) alla mano, non è così:

Come vedete, le differenze tra regione e regione non sono affatto trascurabili: si direbbe che alcune regioni abbiano effettuato i tamponi in modo più efficiente di altre, riuscendo a usare una parte maggiore dei tamponi effettuati per testare nuovi soggetti, e perciò indagando in modo (percentualmente) più ampio la diffusione del contagio nel proprio territorio. In Lombardia, ad esempio, più del 40% dei tamponi sono stati fatti a persone che ne avevano già ricevuto almeno uno; percentuale che scende a meno del 20% nel Lazio e addirittura al 5% in Calabria e in Basilicata.

Questa discrasia deriva almeno in parte dalla diversa diffusione del contagio: si può presumere, infatti, che nelle regioni in cui l’epidemia si è più diffusa, e in cui dunque ci sono stati più contagiati, sia stato necessario fare il tampone tre o quattro volte a un numero molto maggiore di soggetti, cosa che ha sottratto il tempo e le risorse (i tamponi e i reagenti) che si sarebbero potuti dedicare ad altri. A prescindere da questo, tuttavia, una bassa percentuale di soggetti testati sui tamponi effettuati indica oggettivamente una minore profondità di indagine territoriale sulla situazione del contagio.

Ciò premesso, torniamo a bomba: e andiamo ad analizzare, regione per regione, il rapporto tra i nuovi positivi che vengono scoperti giorno per giorno e i tamponi che, giorno per giorno, vengono effettuati. Si tratta di un numero molto indicativo, perché (a spanne) più quel numero è piccolo, meno tamponi tra quelli fatti risultano positivi: e si può supporre che meno tamponi tra quelli fatti risultano positivi, meno diffuso sia il contagio.

E’ una valutazione a spanne, naturalmente, che non tiene conto di eventuali differenze nella strategia scelta dalle diverse regioni per decidere a chi fare il tampone (né potrebbe tenerne conto, visto che su questo aspetto ci è stato detto poco e niente): ma si tratta comunque di un primo elemento attraverso cui farci un’idea, sia pure generale, di quello che è successo nelle diverse zone del paese.

Attenzione: non è chiaro, perché non è mai stato chiarito, se i nuovi positivi riferibili a un certo giorno siano stati scoperti coi tamponi comunicati dalla Protezione Civile il giorno stesso, con quelli comunicati il giorno prima, con quelli comunicati due giorni prima oppure (come presumo) attraverso un numero indistinto di tamponi comunicati, in ordine sparso, in un altrettanto indistinto numero di giorni precedenti. Per ovviare a questo inconveniente, e “ammortizzare” (per quanto possibile) gli sbalzi giornalieri dovuti a questi disallineamenti, conviene ragionare utilizzando una media mobile a 7 giorni, che ha il pregio, per l’appunto, di soffrire meno l’effetto di quei ritardi e quegli accumuli, e di restituirci quindi valori leggermente più attendibili.

Infine: poiché, come dicevamo all’inizio, dal 19 aprile oltre al numero dei tamponi effettuati è disponibile quello dei singoli soggetti testati, e visto che i dati dell’ultimo mese sono quelli che oggi ci interessano di più, per calcolare il rapporto utilizzeremo proprio il numero dei soggetti testati: cosa che “depurerà” l’analisi dai “doppioni” contenuti nel numero complessivo dei tamponi.

Fatte queste (numerose) premesse, proviamo a verificare qual è stato l’andamento del rapporto tra nuovi positivi scoperti e soggetti testati nelle diverse regioni (o meglio: qual è stata la media mobile a 7 giorni di quel rapporto), nel mese che è appena trascorso: cioè, per capirci, dallo scorso 26 aprile al 25 maggio.

Cominciamo col dato finale, cioè proprio quello relativo al 25 maggio, data in cui la percentuale dei positivi scoperti sui soggetti testati (come detto, in media mobile a 7 giorni) è quella che vedete nel grafico che segue:

Come vedete, le differenze tra regione e regione sono importanti e dicono molto. Dicono, ad esempio, che in Liguria la percentuale di persone trovate positive al tampone è ancora superiore al 5%, che in Lombardia è più del 4%, che in Piemonte è quasi il 3%, che in Emilia Romagna è il 2%, mentre nel Lazio, in Toscana e in Puglia è sotto l’1%, in Campania e in Sicilia è sotto lo 0,5%, in Calabria e in Sardegna è sostanzialmente vicina allo zero.

Questo succede oggi, quando il contagio è in fase calante un po’ ovunque (sia pure con ritmi e valori diversi, come vedremo tra poco): ma nei tre mesi che ci siamo messi alla spalle alcune di quelle percentuali hanno raggiunto quote spaventose. Non possiamo calcolare il rapporto tra nuovi positivi e soggetti testati nel momento peggiore dell’epidemia, perché allora l’unico dato disponibile che avevamo era quello dei tamponi: quindi, tanto per farci un’idea, useremo quello, tenendo conto che otterremo un risultato sottostimato rispetto a quello dell’analisi precedente, perché (come detto) i tamponi effettuati sono di più dei soggetti testati, e dunque il denominatore del nostro rapporto sarà più grande.

Ebbene, a marzo di quest’anno la percentuale di positivi trovati sui tamponi effettuati ha raggiunto grosso modo il 35% in Emilia  Romagna, il 40% in Veneto, il 50% in Liguria, in Piemonte e in Lombardia, volendo escludere alcuni picchi massimi ancora più alti presumibilmente riconducibili a disallineamenti e ritardi di notifica di straordinaria entità, che è ragionevole escludere perché neppure la media mobile a 7 giorni riesce a normalizzarli. Per darvi un’idea, il massimo raggiunto in Toscana e in Campania è stato intorno al 20%, nel Lazio, in Puglia, in Sicilia e in Sardegna circa il 15%, in Calabria poco più del 10%.

Certo, si potrebbe eccepire che questi numeri non dicano tutto: perché ci sono regioni che hanno fatto più tamponi e dunque hanno trovato più positivi, mentre ci sono regioni che ne hanno fatti di meno e quindi hanno ottenuto un risultato più contenuto. Beh, diciamo, sì e no. Anzi, probabilmente più no che sì, perché questi numeri rappresentano comunque delle percentuali: le percentuali dei positivi trovati sui tamponi effettuati. E dunque, al di là dell’approssimazione del calcolo e a meno di non voler ritenere che alcune regioni abbiano adottato una strategia che, per motivi insondabili, mirava a cercare i contagiati dove si presumeva che non ci fossero, essi fotografano una situazione piuttosto vicina alla realtà, perlomeno in relazione alle differenze tra regione e regione: una situazione che tra l’altro viene confermata dalla distribuzione dei decessi, di cui abbiamo parlato la volta scorsa, che riflette quelle differenze in modo impietoso.

Il fatto (moderatamente) positivo, tornando all’ultimo mese, è che la percentuale dei soggetti testati che risultano contagiati è in calo un po’ ovunque, anche se in alcune regioni, come abbiamo visto prima, i numeri attuali sono ancora piuttosto alti, mentre in altre sono ormai piccolissimi; e anche se in certi casi il calo è molto meno deciso che in altri. Potete farvi un’idea dando un’occhiata ai tre grafici che seguono, che si riferiscono alle ultime due settimane e nei quali i nuovi casi positivi sono stati rapportati ai tamponi, perché nei giorni scorsi i dati sui soggetti testati hanno qualche magagna (leggasi: recuperi, ritardi e accumuli) di troppo:

Per il momento fermiamoci qua. Nei prossimi giorni, oltre a seguire l’andamento dell’epidemia nel pieno della temutissima “fase 2”, cercando di capire (speriamo di no) se qualcosa stia cambiando, proveremo a parlare di un altro tema molto interessante e spesso altrettanto controverso: quello delle ospedalizzazioni, dei ricoveri in terapia intensiva e degli isolamenti domiciliari.

Se hai perso le prime due puntate, puoi leggerle qua:

Coronavirus: dati e grafici for dummies /1

Coronavirus: dati e grafici for dummies /1

RESTA IN CONTATTO

, , , , ,

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *