I dati resi disponibili dall’istituto di statistica riguardano solo i comuni in cui l’aumento della mortalità è stato più significativo. Cambiando approccio si ottengono numeri non così distanti da quelli forniti dal ministero della Salute.
Una questione di campioni
L’Istat ieri ha reso disponibili i dati sui decessi al dettaglio comunale tratti dall’Anagrafe nazionale della popolazione residente (Anpr) che include a oggi 5.866 comuni. Nella sua nota esplicativa, l’Istat spiega che i dati si riferiscono a 1.084 comuni: sono quelli “con un numero di decessi che, nel periodo dal 1° gennaio al 21 marzo 2020, è risultato superiore o uguale a 10 unità e che nel mese di marzo del 2020 hanno presentato, rispetto alla corrispondente media del quinquennio 2015-2019, un incremento della mortalità pari ad almeno il 20 per cento”.
La tabella 1 riporta il numero di decessi negli anni dal 2015 al 2020 separatamente per le settimane dal 1° gennaio al 22 febbraio (riga 1) e per le settimane dal 23 febbraio al 21 marzo (riga 2). Tenendo conto dell’andamento osservato nelle settimane dal 1° gennaio al 22 febbraio, risulta in modo macroscopico un aumento dei decessi nelle quattro settimane dell’epidemia di Covid-19, nell’ordine di almeno 10 mila decessi in più rispetto a quanto osservato negli anni precedenti.
Un numero di decessi nettamente superiore ai 4.825 attribuiti a Covid-19, comunicati a quella data dal ministero della Salute.
Ci sono però almeno un paio di ragioni per interpretare con molta cautela lo scostamento tra il dato ufficiale del ministero e la stima che proviene dai dati Istat.
Innanzitutto, in linea di principio la selezione del campione operata dall’Istat dà luogo a una sovrastima sistematica della variazione dei decessi osservata nelle quattro settimane “calde” del 2020 rispetto alle corrispondenti settimane degli anni precedenti. Infatti, anche se – in ipotesi – l’effetto dell’epidemia sui decessi fosse nullo, questa regola di selezione includerebbe nel campione solo i comuni che per effetto delle oscillazioni casuali del fenomeno in quelle quattro settimane hanno registrato una variazione positiva pari ad almeno il 20 per cento sulla media degli anni precedenti. Ed escluderebbe invece dal campione tutti i comuni con variazioni dovute al caso inferiori a quella soglia.
Che questa distorsione sia effettivamente rilevante è un problema empirico, non teorico. Per avere un’idea, almeno approssimativa, dell’entità di questa distorsione abbiamo applicato la stessa regola di selezione usata dall’Istat al dato relativo al numero di decessi nelle prime sette settimane del 2020. Abbiamo cioè escluso dal campione i comuni che in quelle settimane hanno registrato un aumento nel numero di decessi inferiore al 20 per cento rispetto alla media degli anni precedenti. Nel sottoinsieme di comuni così ottenuto l’andamento dei decessi nei sei anni considerati è riportato nella terza riga della Tabella 1. Si nota che solo per effetto del modo in cui è stato selezionato questo sottoinsieme di comuni, nelle prime sette settimane del 2020 il numero dei decessi risulta superiore circa del 40 per cento a quello delle corrispondenti settimane degli anni precedenti.
Conclusioni
Montando i vari pezzi assieme, si ricava che dei circa 10 mila decessi in più rispetto agli anni precedenti osservati nelle settimane dal 23 febbraio al 21 marzo del 2020, 4 mila circa potrebbero essere dovuti al modo in cui l’Istat ha selezionato il campione. Secondo questi calcoli, i rimanenti 6 mila decessi sarebbero effettivamente da attribuire a Covid-19: in tal caso lo scostamento tra il dato ufficiale del Ministero e la stima basata sui dati Istat si ridurrebbe a circa mille unità.
A complicare – anche se forse in modo non rilevante – il confronto tra le due stime, c’è da tenere anche in considerazione che il dato ufficiale del ministero include anche i decessi avvenuti nei comuni esclusi dal campione Istat. In questo senso la stima basata su quest’ultimo è potenzialmente distorta al ribasso. Anche se, stante la regola di selezione adottata dall’Istat, è plausibile che si tratti di una sottostima dall’entità contenuta.
Come si evince dai due grafici qui sotto, poi, anche se il dato comunicato dal ministero fosse inferiore a quello corretto, la tendenza verrebbe comunque colta in modo soddisfacente. La figura 1 propone l’andamento dei decessi nelle prime 11 settimane del 2020 (linea blu; il primo dato si riferisce ai primi 11 giorni dell’anno) e per confronto il corrispondente andamento medio nei cinque anni precedenti (linea arancione). Evidente la progressiva forte divaricazione delle due linee nelle ultime quattro settimane. La figura 2 riporta invece la differenza tra le due linee in figura 1: leggermente negativa nelle prime sette settimane dell’anno, poi positiva e progressivamente crescente. La linea arancione rappresenta i decessi nelle prime quattro settimane dell’epidemia secondo i dati forniti dal Ministero e, pur rimanendo sistematicamente sotto la linea blu, ne segue in modo accettabile l’andamento.
Figura 1. Numero di decessi nelle prime undici settimane dell’anno nel 2020 (linea blu); numero medio di decessi nelle corrispondenti settimane dei cinque anni precedenti (linea arancione).
Figura 2. Differenza tra decessi 2020 e media decessi 2015-2019 nelle prime undici settimane dell’anno (linea blu); decessi secondo le comunicazioni ufficiali del ministero della Salute nelle prime quattro settimane dell’epidemia (linea arancione).
Lavoce è di tutti: sostienila!
Lavoce.info non ospita pubblicità e, a differenza di molti altri siti di informazione, l’accesso ai nostri articoli è completamente gratuito. L’impegno dei redattori è volontario, ma le donazioni sono fondamentali per sostenere i costi del nostro sito. Il tuo contributo rafforzerebbe la nostra indipendenza e ci aiuterebbe a migliorare la nostra offerta di informazione libera, professionale e gratuita. Grazie del tuo aiuto!
Andrea Baldassarri
Il confronto non mi sembra corretto. Nella sua analisi lei considera un campione selezionato rispetto ad un valore (il valore medio degli anni precedenti) molto vicino al valore medio dell’insieme dei valori da cui seleziona (i valori delle settimane precedenti l’epidemia). Dunque lei sta eliminando più della metà dei comuni. Questo non è necessariamente vero (anzi dubito lo sia) per le settimane dell’epidemia. Durante quelle settimane la media degli anni precedenti è sicuramente inferiore al valore medio su tutti i comuni nelle stesse settimane. Dunque il campionamento tralascia un numero meno consistente di comuni. Giusto?
Marisa Calvaggio
Stessa cosa fatta dall’ISTAT, come indicato in vari commenti precedente, si è preso un valore di 20% di aumento rispetto alla media, non considerando l’intero database di dati di tutti i comuni..mentre ne ha forniti circa 5000, per l’analisi l’ISTAT ne ha considerati solamente 1000.
Andrea Baldassarri
P. S. Le propongo un test : prenda i valori di un anno precedente, sottragga il valore medio per ogni settimana e aggiunga il valore della protezione civile delle settimane corrispondente. Dovrebbe avere così un insieme “sintetico” compatibile con i dati della protezione civile e con le fluttuazioni tipiche dei decessi degli anni precedenti. Ora ripeta il campionamento selettivo simile a quello offerto dall’INPS e veda se riesce ad ottenere un valore doppio rispetto ai valori della protezione civile.
Henri Schmit
Ottima messa a punto. Grazie!
Francesco Rossi
Buon Pomeriggio, la sua analisi è molto interessante. Nel “campione ristretto” (tabella 1, riga 3) la mortalità totale rilevata ( (2-3 migliaia vs decine di migliaia) e la sua variazione rispetto all’anno precedente sono molto basse. Potrebbe essere dovuto al fatto che si è considerato un intervallo di 7 settimane, retstringendo così il numero di comuni che hanno registrato una variazione del 20% della mortalità per così tanto tempo? cosa accadrebbe se ci limitassimo a considerare 4 settimane per il campione ristretto? avremmo una mortalità “base” dell’ordine di grandezza delle altre righe?
cordiali saluti,
Francesco Rossi
Giampiero Lupatelli
Le argomentazioni proposte non mi pare tengano in nessun conto il fatto che il fenomeno di cui stiamo parlando ha una distribuzione rispetto all’universo dei comuni italiani (e del loro sottoinsieme trattato dalla Anagrafe) tutt’altro che casuale. L’impatto della pandemia nel nostro Paese è stata molto caratterizzata geograficamente e quei territori sono naturalmente molto rappresentati in quel campione mentre non ravviso la ragione di correggere il risultato di quel campione con riferimenti ad un insieme di comuni molto diversamente aggredito dalla pandemia.
Fabrizio Fabi
La pensata ISTATdi diffondere dati per i comuni con mortalità solo superiore al 20% è un po’ cervellotica, ma dovrebbe essere facilmente migliorabile, divulgandoli tutti. Immagino che quelli siano i comuni che l’ISTAT ha segnalato al Min.Salute, nelle settimane passte, per evidenziare i sospetti “focolai” Comunque, la sottostima nei dati del Min.Salute resta evidente. Invece, la stima ministerile delle variazioni giornaliere (cosiddetta “tendenza”), essendo effettuata su dati omogenei, dovrebbe essere suppergiù corretta, come confermato dalla figura 2
Domenica Beltrammi
L’istat nella sua Nota (https://www.istat.it/it/files//2020/03/Decessi_2020_Nota.pdf) non parla né di campione né di stime. I dati sono decessi effettivi risultanti dalle cancellazioni anagrafiche per morte.
Purtroppo, sono decessi realmente avvenuti e non è specificata la causa…
Enrico Rettore
‘In questa prima diffusione dei dati tempestivi di mortalità di fonte ANPR l’Istat ha scelto di concentrare l’attenzione sui comuni con *almeno dieci decessi da gennaio al 21 marzo 2020* che hanno fatto registrare un *aumento dei morti superiore al 20 percento nei primi 21 giorni di marzo 2020*, rispetto al dato medio dello stesso periodo degli anni 2015-2019’ (p. 2 della Nota Esplicativa, asterischi miei). Sono 1084 comuni dei 5866 dell’ANPR.
Federico Ricci Tersenghi
Vorrei farvi notare che i dati messi a disposizione dall’Istat includono anche comuni con variazioni negative o inferiori al 20%. Quindi il contenuto di questo articolo non è del tutto corretto. Urge comunque una migliore nota esplicativa dei dati da parte dell’Istat.
Marco D'Egidio
Grazie per l’ottima analisi. Mi permetto solo una osservazione: i comuni del campione Istat sono 1.084 per una popolazione totale di 12 milioni di persone (soprattutto al Nord e in particolare in Lombardia). E’ vero che i 7.000 comuni italiani esclusi dal campione hanno dati di mortalità bassi o comunque allineati agli anni scorsi, però rappresentano anche l’80% della popolazione italiana. Sono per questo convinto che i dati del campione Istat vadano moltiplicati per 5 (dopo opportuna correzione per eliminare la bias territoriale per quanto possibile), al fine di avere una stima sull’Italia intera. A suggerirlo è anche il dato medio degli anni scorsi: in un mese di fine inverno (non di picco della mortalità), abbiamo sempre registrato 10.500 morti circa, in quei mille comuni Istat. Ma in Italia ogni anno muoiono circa 650 mila persone. Ciò significa che non basta moltiplicare 10.500 per 12 (mesi dell’anno), ma dobbiamo anche moltiplicare per 5 per arrivare al dato nazionale, proprio perché il campione Istat ingloba il 20% della popolazione italiana. Se questo è vero, anche lo scarto di 6.000 decessi in più nel 2020 rispetto agli anni scorsi va moltiplicato per 5 e poi raffrontato con i morti ufficiali Covid. La sottostima dei decessi Covid diverrebbe quindi importante.
toninoc
Da buoni Italiani facciamo sempre riferimento agli uffici UCCS (Ufficio Complicazioni Cose Semplici). Penso che le statistiche nazionali non possano essere fatte attendibilmente oggi, perché ci sono troppe variabili sia territoriali che temporali, molte delle quali non ancora conosciute. Se si analizzano i mesi di febbraio e marzo (che sono l’apice dell’epidemia nel nord Italia) di città singole (per es. Bergamo, Brescia e Piacenza)delle quali sono noti sia i decessi del 2019 sia quelli del 2020 il calcolo è più semplice e con minore margine di errore. Al centro Italia ed al sud, l’epidemia si sta evolvendo con ritaro rispetto al nord ed i dati sono comunque falsati dalla fuga in massa verso sud avvenuta nei giorni precedenti le limitazioni di movimento. Un dato è certamente sconcertante ed è la grandissima differenza fra i decessi ufficiali per coronavirus 19 e i decessi totali registrati agli uffici anagrafici dei comuni. Quei dati sono pubblici e non dovrebbero esserci difficoltà, per gli addetti ai lavori, ad essere verificati. Se nel periodo considerato nel 2019 in un dato luogo ci sono stati 100 decessi e nello stesso periodo del 2020 ce ne sono stati 200, per me significa che il coronavirus ne ha fatto morire 100 più dello scorso anno dei quali una parte è stata registrata “causa covid19” ed una seconda parte per altre cause in quanto i decessi sono avvenuti nelle abitazioni private o nelle Case di riposo per anziani.
Stefano Marchetti
In questo articolo sembra che i dati forniti da Istat e quelli forniti dal MinSal siano in concorrenza. In ogni caso specifico che non è così, entrambi gli Enti, in un contesto completamente nuovo ed emergenziale, stanno cercando di fotografare il fenomeno sulla base delle diverse potenzialità e delle diverse esigenze conoscitive. Il MinSal, nell’ambito della sorveglianza sanitaria, utilizza i dati sui contagiati rilevati e confermati tramite tampone, Istat, nell’ambito della Statistica ufficiale, avendo ottenuto dati parziali e sporchi dovendo scegliere, ha puntato l’attenzione su una delle esigenze conoscitive più impellenti nel Paese, quante persone stanno morendo nelle aree più colpite? Non si tratta quindi di un campione statistico ed ogni inferenza ha tantissimi limiti. Ma questi dati permettono di avere informazioni migliori di quelle ottenibili dalla letture dei necrologi sui giornali locali.
Le due fonti vanno pertanto viste congiuntamente e non in contrapposizione. Anche perché ciascuna di esse copre una parte di popolazione che l’altra non ha ancora potuto intercettare.
Infine, mi permetto un consiglio per misurare l’effetto dovuto al selezionare in quel modo i Comuni: si applichi lo stesso criterio con cui l’Istat ha selezionato i Comuni del 2020 al 2018 e lo si confronti anch’esso con il 2019. La variazione trovata potrebbe essere detratta da quel quasi 100% di aumento riscontrato nella selezione effettuata dall’Istat, meglio di un sottocampione su 1084 Comuni
onofrio mondelli
Considerando la particolare situazione attuale, l’Istat farebbe cosa buona ad elaborare i dati di tutto il territorio nazionale, elaborando i dati degli uffici anagrafici di tutti gli 8mila comuni italiani e riportandoli per province e regione. Così si farebbe veramente cosa utile!
bruno busi
buonasera, leggo i dati provenienti dall’ista che avete ben rappresentato, ma faccio un piccolo appunto, dato che per 40 anni mi sono occupato di contabilità aziendale, ho sempre detto “che i conti si fanno alla fine” perciò mi chiedo:
visto quello che ci dice la protezione civile ove la mortalità dovuta a covid 19 avviene principalmente in persone in età molto avanzata magari già ricoverati o in RSA secondo me, per tirare le somme e capire quanto effettivamente ha pesato questo virus, bisogna aspettare il dato complessivo del 2020 e raffrontarlo con gli anni precedenti.
Questo perché i decessi avvenuti in questi primi mesi del 2020 forse hanno solo anticipato di qualche mese una già imminente dipartita. So che questo discorso è brutale, ma statisticamente parlando questo è
Matteo
Mi scusi, ma lei ha mai sentito parlare di calcoli intermedi e soprattutto di statistica inferenziale? Qui i calcoli sono infatti parziali rispetto a quelli annuali e prendendo in considerazione soprattutto le regioni più colpite da questo virus, calcolando cioè i morti dei primi 3 mesi del 2020, proprio perché per ora questi sono i dati a nostra disposizione. Così come lei stesso può vedere, soprattutto nell’ultimo mese preso in considerazione, in quelle stesse zone c’è stato un aumento quasi del doppio rispetto allo stesso lasso di tempo degli ultimi 6 anni (sia confrontandolo con la stessa fascia temporale dei singoli anni, sia con la media aritmetica degli stessi). Con un dato così importante (+93%!!), mi pare pressoché evidente che ci sia qualcosa che abbia inciso pesantemente in tal senso, visto che negli scorsi 5 anni l’andamento della mortalità in quelle stesse zone ha sempre oscillato stabilmente introno a 10 mila vittime. Certo, a fine anno si tireranno le somme in maniera più precisa, ma rimane il fatto che a parte gli “anziani con un piede già nella fossa”, il numero di decessi finora provocato direttamente o indirettamente dal coronavirus, nelle aree più colpite, è davvero drammatico.