Lavoce.info

Decessi da Covid-19, cosa ci dice il campione Istat

Le analisi basate sui dati forniti dall’istituto di statistica vanno considerate con grande cautela ma possono offrire importanti indicazioni, in alcuni casi addirittura prudenziali, sul numero totale di morti in eccesso. Soprattutto nelle aree più colpite.

Per fornire tempestivamente informazioni aggiornate sull’andamento della mortalità in Italia, l’Istat ha pubblicato i dati sul numero di decessi giornalieri per i primi quattro mesi dell’anno per il periodo 2015-2020. Fino al 2019 le informazioni sono disponibili per tutti i comuni italiani; per il 2020 attualmente i dati, riferiti al periodo dall’1 gennaio al 4 aprile, sono relativi a 1.689 tra i circa 6.000 comuni che partecipano nell’Anagrafe nazionale della popolazione residente (Anpr); questi comuni sono inclusi nel campione diffuso dall’Istat per il 2020 se hanno registrato (a) almeno 10 decessi tra il 1° gennaio e il aprile 2020 e (b) un aumento della mortalità totale tra il 1° marzo e il 4 aprile di almeno il 20 per cento rispetto alla media osservata per lo stesso periodo nel quinquennio 2015-2019. Nelle scorse tre settimane l’Istat ha aggiornato il dataset con cadenza settimanale includendo via via dati più recenti con un ritardo di circa 10 giorni.

Leggere nei dati lo shock del Covid-19

Come sottolineato da Enrico Rettore e Sara Tonini in due recenti articoli pubblicati su lavoce (disponibili qui e qui), l’applicazione di criteri di selezione del campione direttamente collegati alla variabile di studio può creare delle distorsioni nelle stime di interesse. Per questa ragione, come sottolineato anche nella documentazione fornita dall’Istat, i risultati delle analisi basate su questi dati vanno considerati con grande cautela. Ciononostante, questi dati possono offrire importanti indicazioni, in alcuni casi addirittura prudenziali, sul numero totale di decessi in eccesso, in particolare nelle aree geografiche più colpite dall’epidemia.

Nel loro articolo, Rettore e Tonini mostrano come applicando la regola di selezione dell’Istat a un anno del periodo 2015-19 non interessato dal Covid-19 si giungerebbe per costruzione a selezionare un campione caratterizzato da una mortalità superiore alla media, a fronte della minore mortalità nei rimanenti comuni. L’esercizio è molto interessante e dimostra perché, in condizioni normali, le stime basate su questo campione possano essere distorte per eccesso. Tuttavia, il 2020 non è un anno normale. In alcune aree del paese lo shock indotto dal Covid-19 ha comportato un drammatico aumento nei tassi di mortalità che, tra le altre cose, modifica sostanzialmente la natura della selezione non casuale del campione e le distorsioni che ne derivano. Questo avviene essenzialmente per due ragioni.

1) Rispetto a un anno normale, se lo shock alla mortalità fosse così ampio da spostare tutti comuni oltre la soglia, il criterio di selezione non sarebbe stringente e il campione selezionato corrisponderebbe all’universo di interesse. In questo caso, le stime basate su questi dati non sarebbero soggette ad alcuna distorsione.

2) Coerentemente con la natura spaziale del contagio, è probabile che nelle aree più colpite anche i comuni non selezionati dal criterio adottato abbiano registrato una maggiore mortalità, ma non tale da rientrare nel campione; questa mortalità in eccesso pertanto sfuggirebbe alla misurazione.

La figura 1 illustra questi due canali. Il riquadro di sinistra riporta un’ipotetica distribuzione degli scostamenti annuali della mortalità comunale da una media storica di riferimento, per convenienza centrata sullo zero e la cui dispersione riflette fattori e shock idiosincratici. Il riquadro di destra rappresenta la distribuzione degli scostamenti tra gli stessi comuni in un anno in cui tutti sono colpiti da uno shock comune che aumenta il tasso di mortalità. La barra verticale indica uno scostamento del 20 per cento, coerente con la regola adottata dall’Istat. È evidente che la massa al di sopra della soglia dopo lo shock (area azzurra) è molto superiore a quella colta in un anno normale, e lo è tanto più quanto più forte è lo shock. Allo stesso modo, dopo lo shock la regola di selezione trascura un ampio insieme di comuni in cui l’aumento di mortalità, pur evidente, non è abbastanza forte da indurne l’inclusione nel campione (area verde). Questa analisi implica che la variazione percentuale del numero di decessi calcolata solo per i comuni selezionati che cadono nell’area azzurra della figura sarà sempre una sovrastima della variazione registrata nel complesso della popolazione. Per contro, la stima del numero dei decessi in eccesso rispetto a una situazione normale in una certa provincia (o regione) calcolata solo sui comuni selezionati dalla soglia – e quindi assumendo implicitamente un eccesso di mortalità pari a zero per i comuni non osservati – implicherà una distorsione di segno ambiguo, a seconda della dimensione e della variabilità dello shock.

Figura 1 – Esempio di una traslazione verso destra della distribuzione della mortalità in eccesso.

Una simulazione sui comuni della Lombardia

Leggi anche:  Vaccinare si può, ma anche senza autonomia differenziata

Per provare a quantificare la rilevanza di questi meccanismi abbiamo considerato i dati disponibili per i comuni della Lombardia per il 2019, e abbiamo simulato una serie di variazioni generalizzate della mortalità di diversa entità. Gli shock sono stati definiti in termini di aumento percentuale rispetto al 2018, da 0 a 150 per cento. Si tratta di un approccio prudenziale, in quanto lo shock non viene applicato ai comuni più piccoli che presentavano mortalità pari a zero nel marzo dell’anno precedente. I risultati delle simulazioni su numero di decessi in eccesso e sulla porzione di popolazione selezionata in corrispondenza dei diversi shock sono riportati nella Figura 2.

In linea con quanto mostrato da Rettore e Tonini, si può notare che, in assenza di shock, il criterio Istat seleziona circa un quinto della popolazione lombarda e determina una sovrastima di circa 400 decessi per il mese di marzo 2019. La distorsione si riduce al rafforzarsi dello shock e coerentemente cresce la quota di popolazione residente nei comuni selezionati. La sovrastima si annulla in corrispondenza di uno shock generalizzato a tutti comuni della Lombardia pari al 12 per cento della mortalità, che induce una selezione di circa il 40 per cento della popolazione nel campione. Shock più forti comportano addirittura una sottostima della mortalità in eccesso, dovuta all’esclusione dei comuni che pur registrando una mortalità maggiore non rientrano nella soglia (aree verde e rossa della figura 1). Shock di intensità ancora maggiore sono associati a una progressiva riduzione della sottostima, riconducibile al fatto che con ampi shock la maggior parte dei comuni rientra nel campione fino a che questo coincide con l’universo di riferimento.

Figura 2: Simulazione dell’effetto di uno shock alla mortalità ai comuni della Lombardia nel 2019.

L’esercizio precedente suggerisce quindi che la quota di popolazione che rientra nel campione selezionato dall’Istat sia un buon indicatore dell’affidabilità delle stime e del segno dell’eventuale distorsione riguardo al numero complessivo di decessi in eccesso in una certa area. La figura 3 riporta tali quote per le regioni italiane nel quinquennio 2015-2019 e nel 2020 per il campione di comuni Anpr. A fronte della sostanziale omogeneità tra le regioni tra il 2015 e il 2019, con quote di popolazione incluse nel campione selezionato tra lo 0 e il 25 per cento, nel 2020 si osserva una notevole eterogeneità. In Calabria, Campania, Lazio e Sicilia la quota di popolazione selezionata è inferiore al 10 per cento, mentre in Lombardia e Liguria supera il 70 per cento.

Figura 3 – Quota di popolazione di ciascuna regione rappresentata dai comuni selezionati dal criterio Istat.

Come sostenuto da Rettore e Tonini, queste evidenze suggeriscono che utilizzare il campione Istat per le regioni in cui la diffusione del contagio è stata relativamente contenuta (Sud, isole e Lazio), cioè in situazioni pressoché normali, induca una sostanziale sovrastima della mortalità effettiva. Per contro, per molti regioni del Nord il campione fornirebbe una stima affidabile e addirittura plausibilmente cautelativa dell’effettivo eccesso di mortalità, dal momento che sarebbero ragionevolmente esclusi comuni con mortalità comunque maggiore della media storica. Quest’ultimo punto è più efficacemente analizzato sfruttando l’eterogeneità territoriale del contagio, che ci permette di fornire qualche valutazione in più anche per le regioni in cui la quota di popolazione selezionata nel 2020 risulta di poco superiore alla media storica. Ad esempio, per la maggior parte delle province della Toscana la quota inclusa nel campione non differisce significativamente da quella degli anni precedenti, ma per tre province (Massa-Carrara, Pisa e Pistoia) l’incremento è rilevante e quindi le stime di eccesso di mortalità su queste aree potrebbero essere affidabili (Figura 4). Al contrario, nel caso dell’Emilia-Romagna molte province risultano ampiamente rappresentate nel campione Istat del 2020, tuttavia per quelle di Bologna e Ferrara la quota selezionata non è sostanzialmente diversa dal passato, per cui non è opportuno effettuare valutazioni sulla variazione della mortalità legata al Covid-19.

Elaborare una strategia sanitaria

Leggi anche:  I rischi della salute brevettata

Queste considerazioni indicano che il campione di comuni selezionato dall’Istat può fornire elementi utili e importanti per misurare in modo affidabile la mortalità in eccesso riconducibile, direttamente o indirettamente, al Covid-19 soprattutto nelle aree maggiormente interessate dal contagio e per cui è più urgente elaborare una strategia sanitaria di risposta che tenga pienamente conto degli effetti complessivi dello shock.

Figura 4 – Quota di popolazione di ciascuna provincia della Toscana e dell’Emilia-Romagna rappresentata dai comuni selezionati dal criterio Istat.

Prima di concludere, è opportuno aggiungere alcune considerazioni generali riguardo alla possibilità di confrontare le stime sull’eccesso di mortalità con i dati sui decessi per Covid-19 certificati sulla base di test di laboratorio. Innanzitutto, sebbene l’eccesso di mortalità sia con ogni probabilità collegabile all’epidemia, non è possibile tramite questo esercizio quantificare in che misura questo sia imputabile direttamente all’epidemia e in che misura sia attribuibile ad altre cause connesse (es. allo stress del sistema sanitario in alcune regioni). Vi potrebbero essere anche fattori di segno opposto, come il livello di mortalità stagionale più basso della norma associato all’inverno particolarmente mite, la riduzione delle morti bianche e di quelle per incidenti stradali a causa del lockdown. Infine, un’ultima considerazione riguarda il periodo di osservazione: questo non coglie né i decessi della diffusione del virus a marzo, né la sua natura endemica, né la possibile anticipazione di decessi che sarebbero comunque avvenuti nel giro di poco tempo, considerata la maggiore letalità del virus per i soggetti più fragili. Pertanto, una valutazione precisa dell’effetto del Covid-19 sulla mortalità dovrà attendere la diffusione dei dati sul numero e sulle caratteristiche dei decessi per tutti i comuni italiani su un orizzonte temporale più ampio.

Nel frattempo, le informazioni che l’Istat diffonde con eccezionale tempestività rappresentano una solida base da cui partire per valutare l’ampiezza e la diffusione dello shock e su cui impostare analisi e risposte di policy.

Lavoce è di tutti: sostienila!

Lavoce.info non ospita pubblicità e, a differenza di molti altri siti di informazione, l’accesso ai nostri articoli è completamente gratuito. L’impegno dei redattori è volontario, ma le donazioni sono fondamentali per sostenere i costi del nostro sito. Il tuo contributo rafforzerebbe la nostra indipendenza e ci aiuterebbe a migliorare la nostra offerta di informazione libera, professionale e gratuita. Grazie del tuo aiuto!

Leggi anche:  Accise più alte per non mandare in fumo la salute*

Precedente

Lockdown dell’economia, un primo bilancio

Successivo

Mortalità da coronavirus: quanto vale l’effetto Lombardia

  1. Enrico

    Adattando un vecchio proverbio inglese, si potrebbe dire che ci sono tre modi di fare ogni cosa: quello giusto, quello sbagliato e quello dell’ISTAT. Fare stime su un campione che si autoseleziona, come questo, può servire a studiare le caratteristiche dei morti di covid, ma non la diffusione della malattia. È come fare una indagine andando nelle osterie e dedurne che ci sono pochi astemi. Purtroppo questa è solo la punta di un iceberg statistico (non solo italiano) perchè forme (meno brutali) di autoselezione si praticano in molti campi. Ad esempio, nonostante molti accorgimenti metodologici, la dinamica della produzione industriale è sistematicamente sovrastimata durante una crisi (perché le imprese morte e moribonde difficilmente rispondono ai questionari) e sottostimata durante una ripresa (perché le “gazzelle” e i nuovi prodotti, che sono tra i driver della ripresa, difficilmente entrano subito nei campioni). È la statistica ufficiale, bellezza!

  2. Carlo Lucibello

    Ma perché l’ISTAT non rilascia i dati di tutti i comuni e basta, invece di complicare la vita di chi fa analisi dati?

  3. Sarabanda 82

    Mi sembra che Istat voglia complicare le cose semplici, lei può fare tutte le statistiche che vuole, ma i numeri li deve dare reali e certi. Se chiedi i numeri di decessi del mese di marzo mi deve dare tutti i deceduti. Se poi voglio la suddivisione per maschi o femmine o per sesso o per fascia di età, sarà compito mio andare a cercare quello che voglio per la mia ricerca. I dati devono essere chiari e semplici, solo così non possono essere manipolati a piaciumento delle parti.

Lascia un commento

Non vengono pubblicati i commenti che contengono volgarità, termini offensivi, espressioni diffamatorie, espressioni razziste, sessiste, omofobiche o violente. Non vengono pubblicati gli indirizzi web inseriti a scopo promozionale. Invitiamo inoltre i lettori a firmare i propri commenti con nome e cognome.

Powered by WordPress & Theme by Anders Norén