Ancora sul Codice deontologico

il 25/05/2004

Continua sul nostro sito la discussione sul Codice deontologico per il trattamento dei dati personali utilizzati per scopi statistici e scientifici. Andrea Ichino replica allintervento di Ugo Trivellato, sottolineando come il Codice non elimini i troppi ostacoli allaccesso ampio ai dati, con conseguenti danni per lattività di ricerca in Italia. Nella sua controreplica, Trivellato ricorda che i ritardi italiani sono soprattutto nella produzione di microdati.

Un Codice non fa primavera

È possibile che il Codice di deontologia e di buona condotta per i trattamenti di dati personali per scopi statistici e scientifici rappresenti un passo avanti, ma lo si potrà dire solo alla prova dei fatti. Sarò il primo a riconoscerne i meriti se, ad esempio, vedrò finalmente aprirsi qualche spiraglio per l’utilizzo dei dati personali raccolti dall’Istat, oppure se alla Banca d’Italia verrà di nuovo consentito di rendere accessibile la provincia di nascita e residenza dei soggetti intervistati nella Indagine sui bilanci delle famiglie italiane. O, più in generale, se vedremo fiorire anche in Italia una ricerca basata su micro-dati paragonabile a quella da tempo fiorente in altri paesi europei e negli Stati Uniti.

I motivi per dubitare

Certo non per colpa di persone come Ugo Trivellato, che con pazienza ammirevole hanno fatto di tutto per migliorare le cose, temo però che così non sarà per numerosi motivi. Mi soffermo solo sui principali.
In primo luogo, la logica ispiratrice. Come scrivevamo con Nicola Rossi a commento del progetto di legge da questi presentato al Parlamento nello scorso autunno, il codice deontologico conferma il presupposto, tipicamente italiano, secondo cui i ricercatori sono naturalmente portati a usare i dati individuali in un modo che contrasta con la tutela della riservatezza delle persone.
Al contrario, nei più avanzati paesi europei e negli Usa, l’atteggiamento è radicalmente diverso: consentire un accesso ampio e facile ai dati per la ricerca scientifica, anche in forma integrata tra archivi diversi, punendo però duramente un loro eventuale uso che danneggi i diritti della persona. Questa è la logica che ispira il progetto di legge di Nicola Rossi, e credo che solo questa logica renderà possibile nel nostro paese una ricerca statistica di livello pari a quello osservato all’estero.
In secondo luogo, la vaghezza dei “termini” usati dal codice. Dalla loro interpretazione, infatti, dipenderanno gli effetti concreti. Il codice fa uso frequente di termini come “mezzi ragionevoli” o “mezzi manifestamente sproporzionati” per l’identificazione dei soggetti tutelati.
Cosa si vuol dire in concreto? E chi deciderà? Se sarà il nostro attuale Garante, temo che ben poco cambierà. Questo modo di procedere ricorda molto la scelta del legislatore in tema di protezione del lavoratore contro il licenziamento, un atto che l’impresa può compiere in presenza di un “giustificato motivo”. Chi poi decide nel concreto sulla giustificabilità del motivo è il giudice, cosicché, se improvvisamente i giudici del lavoro in Italia cambiassero idea sui motivi ammissibili, i lavoratori non godrebbero più della stessa protezione oggi offerta dal nostro ordinamento.

In tema di privacy e ricerca, accadrà qualcosa di analogo grazie a questo codice: i risultati dipenderanno dagli orientamenti del Garante, senza contare il costo sociale delle pratiche burocratiche necessarie per convincere quest’ultimo della “ragionevolezza” o “sproporzionatezza” dei mezzi utilizzati. E così anche in questo contesto, non sarà avvantaggiato chi ha buone idee, ma chi saprà fare buona attività di “lobbying”.
In molti punti, poi, il codice sembra essere scritto da persone che non hanno mai fatto ricerca.

Per fortuna, grazie (immagino) a Ugo Trivellato, è stata tolta la richiesta di distruggere i dati a fine ricerca, una imposizione la cui assurdità è talmente palese da risultare sorprendente.
Ma rimangono prescrizioni veramente singolari. Ad esempio, si richiede che i dati vengano utilizzati solo per gli scopi indicati nel “progetto di ricerca” da presentare preventivamente presso la propria università o associazione scientifica. Cioè, i dati possono essere utilizzati una volta sola.
E se il ricercatore scopre solo in un secondo momento possibili nuovi utilizzi, il che è la norma, secondo il codice dovrebbe, immagino, raccogliere i dati di nuovo.
La filosofia prevalente all’estero è ancora una volta molto diversa. I nostri colleghi americani generalmente non devono nemmeno raccogliere i dati quando disegnano un progetto di ricerca: li trovano già pronti nelle innumerevoli banche dati messe a loro disposizione da enti pubblici e privati senza troppe restrizioni, ma con punizioni pesantissime in caso di uso illecito. I dati esistono prima dei progetti perché sono considerati un bene pubblico che stimola la ricerca: spesso è proprio la consultazione libera dei dati offerti dai “provider” che suggerisce nuovi obiettivi o il modo per conseguirli.
Alla luce di questo codice mi chiedo invece, se potrò raccogliere dei dati e poi passarli a un collega che, dopo aver visto i miei risultati, desideri usarli per un altro scopo o per verificare la correttezza delle mie conclusioni. Mi chiedo se potrò metterli a disposizione dei miei studenti affinché possano consultarli per decidere su cosa scrivere la loro tesi di dottorato, senza disporre ancora di un progetto preciso. E come farà adesso la Banca d’Italia a raccogliere l’Indagine sui bilanci delle famiglie italiane (una delle pochissime fonti di micro-dati su cui gli economisti italiani possano contare) se dovrà prima presentare un progetto indicante per cosa i dati verranno utilizzati?

Il Garante e la statistica

Infine, ancora una volta, troppa burocrazia. Si sapeva già che il Garante non ha a cuore le foreste dell’Amazzonia: grazie alla tutela della privacy, l’Italia è stata sommersa da valanghe di carta. E qui si continua nello stesso modo con progetti da conservare per cinque anni, documenti da custodire per tre, e così via. Ma il codice raggiunge l’apice quando richiede che i ricercatori, i quali notoriamente nuotano nei fondi di ricerca, utilizzino le loro ampie risorse per comprare pagine di quotidiani mediante le quali informare “i soggetti tutelati”.

Recentemente sono stato al convegno annuale della American Society of Labor Economics.
Vorrei invitare a mie spese il Garante al convegno dell’anno prossimo affinché veda con i suoi occhi cosa la ricerca statistica all’estero può fare grazie a un accesso più facile ai dati anche personali e sensibili e senza violazioni della privacy. Nell’attesa il Garante può anche consultare il programma di questo convegno sul sito e dirci se, con i dati disponibili in Italia, sarebbe possibile organizzarne uno simile. Oppure può consultare il sito ipums , che contiene i dati individuali dei censimenti Usa effettuati tra il 1850 e il 2000. In sostituzione delle restrizioni e dei formulari previsti dal codice deontologico, il sito americano invita semplicemente l’utente a usare le informazioni “for good, never for evil”.

E se il Garante trova gli americani troppo permissivi, dia un occhiata al paper “Intergenerational effects in Sweden: What can we learn from adoption data?” di Anders Biorklund (Svezia), Mikael Lindhal (Svezia) e Eric Plug (Olanda), che utilizza dati sull’universo dei bambini adottati in Svezia, abbinando informazioni sulle famiglie di origine e adottive.
Non credo che agli svedesi la privacy non interessi. Credo invece che la tutelino meglio del nostro Garante, ma senza rendere impossibile ricerche statistiche di valore.

Fare dogni erba un fascio non aiuta (la controreplica di Ugo Trivellato)

Ugo Trivellato

Il “commento a caldo” di Andrea Ichino sul codice deontologico per i trattamenti di dati personali per scopi scientifici testimonia il disagio che ricercatori avvertiti (e un po’ impulsivi) provano per lo stato fortemente insoddisfacente della disponibilità di microdati per la ricerca scientifica in Italia. Ma fa d’ogni erba un fascio. Il che non aiuta: né a capire; né, quindi, a individuare la strada per migliorare le cose. Provo a diradare la confusione con alcune precisazioni.

La direttiva europea

1) Innanzitutto, non siamo di fronte a orientamenti e norme unicamente e tipicamente italiane. Alle spalle c’è la direttiva n. 95/46 dell’Unione europea. Vale la pena di non dimenticare, poi, che alla radice della direttiva vi è l’emergere di sensibilità e preoccupazioni sociali diffuse: nell’opinione pubblica dei paesi sviluppati, investiti dalla rivoluzione informatica, il tema del diritto alla privacy assume rilievo e portata crescenti, compreso l’uso di dati personali per finalità scientifiche. Restiamo comunque al quadro normativo. Le disposizioni della direttiva, va da sé, non sono oro colato. Tuttavia, di una direttiva comunitaria, si tratta, alla quale gli Stati membri sono tenuti ad adeguare le legislazioni nazionali. Certo, i diversi paesi l’hanno applicata con varianti più o meno liberali, in particolare per i trattamenti per scopi di ricerca. E l’applicazione che ne ha dato l’Italia non brilla per snellezza. Ma l’impianto di fondo è comune, e non permette un accesso sostanzialmente libero (“ampio e facile”, per dirla con Ichino) ai dati personali a scopi di ricerca.

2) Per valutare se il codice deontologico rappresenti un passo avanti, Ichino invoca la prova dei fatti: staremo a vedere – dice – se fiorirà “anche in Italia una ricerca basata su microdati paragonabile a quella da tempo fiorente in altri paesi europei e negli Stati Uniti”. Con argomentazioni del tipo “post hoc, ideo propter hoc” è bene andare perlomeno cauti. Quanto l’auspicata fioritura dipenderà dal codice deontologico? E quanto, invece, dall’effettiva produzione e distribuzione di basi di microdati? Il quadro normativo definisce le condizioni permissive, che mi paiono decorose. Ma ad esse è indispensabile si affianchino condizioni positive di un’adeguata disponibilità di basi di microdati. È su questo fronte che i ritardi italiani rispetto agli standard di paesi avanzati sono preoccupanti. L’ho sottolineato a conclusione della nota sul codice deontologico, e avrò modo di riaffermarlo nel seguito: accanto alle norme, servono i fatti.

Dati anonimi e personali

3) Entrando nel merito delle questioni, a Ichino sembra sfuggire una distinzione essenziale: quella fra dati personali e dati anonimi. Non mi spiego altrimenti l’accostamento che egli fa di esempi disparati.

Come è detto a chiare lettere nel preambolo al codice deontologico, la normativa sulla privacy e il codice stesso non si applicano ai dati anonimi. Tali sono i dati individuali che non consentono di risalire all’interessato con mezzi ragionevoli.
Larga parte delle basi i microdati utilizzate nella ricerca economica e sociale sono appunto anonime. Per restare agli esempi di Ichino, è questo il caso dei dati individuali dai censimenti Usa. Numerosi altri esempi riguardano indagini campionarie sulle famiglie: dall'”Europanel” dell’Unione europea, al “German Socio-Economic Panel”, alla “British Household Panel Survey” all’Indagine sui bilanci delle famiglie italiane della Banca d’Italia, ai cosiddetti file standard’ relativi ad alcune indagini dell’Istat. Dunque, riguardo a queste (e altre analoghe) basi di dati, le discussioni sui vincoli imposti dalla legislazione sulla privacy sono semplicemente fuori luogo.

Ichino appare preoccupato della vaghezza del termine “mezzi ragionevoli” per decidere dell’identificazione. Ma qual è l’alternativa? Invece che fornire il criterio dei mezzi ragionevoli, dettare rigidi standard tecnici? Diventerebbero rapidamente obsoleti a fronte degli sviluppi nella tecnologia del trattamento delle informazioni (compresa quella sui sistemi di sicurezza e di prevenzione/controllo dei tentativi illeciti di identificazione). D’altra parte, la responsabilità di definire i mezzi ragionevoli è affidata innanzitutto alla comunità scientifica. La letteratura statistica sull’argomento e le esperienze di molti paesi – a cominciare da quelle che ho ricordato – ci consegnano un quadro sufficientemente consolidato sui modi per creare basi di dati anonimi.

Non c’è dunque motivo di preoccuparsi. Né c’è molto da inventare. Piuttosto, ci sono buone pratiche da mettere in atto. La prima risposta, lo ribadisco, sta nell’investire nella produzione e distribuzione flessibile di basi di microdati anonimi per la ricerca.
L’aggettivo flessibile’ è importante, perché i dati individuali si qualificano come anonimi sulla base della loro configurazione complessiva. Per restare all’esempio di apertura di Ichino, si può disporre di dati anonimi con un maggior dettaglio territoriale – la provincia di residenza dell’intervistato -, compensandolo con un minore dettaglio per qualche altra variabile (l’età in classi anziché in anni, il reddito in classi anziché arrotondato, eccetera).

4) Quando si trattano dati personali, riferiti cioè a persone (o imprese) identificate o identificabili, allora entra in gioco la normativa su privacy e ricerca scientifica – codice deontologico incluso -, con gli adempimenti che prescrive, primo fra tutti la presentazione di un progetto di ricerca che documenti gli scopi scientifici dei trattamenti.
Su alcune bardature burocratiche si possono ben avere delle riserve. I cinque anni di conservazione dei progetti di ricerca non hanno suscitato gli entusiasmi del gruppo di lavoro della Crui e delle società scientifiche che ha definito il codice. (Ci è stato spiegato, tuttavia, che questo è il termine perché l’interessato possa far valere i propri diritti. E spiegazione e appesantimento ci sono parse accettabili.)
Ma davvero presentare un progetto di ricerca è un carico insopportabile? Un ricercatore che tratti basi di microdati – spesso cospicue – è ben lontano dalla romantica, ingannevole immagine dello scapigliato che improvvisa e inventa’. Un progetto di ricerca lo fa, e cerca di farlo bene: spesso per ottenere finanziamenti; sempre per buona regola professionale. D’altra parte, come documentare altrimenti che i dati personali sono trattati per finalità scientifiche?
E, per favore, risparmiamoci la stantia battuta sulle foreste dell’Amazzonia depauperate dalle copie cartacee dei progetti. Con la firma elettronica alle porte, che cosa impedirà a università, enti di ricerca e società scientifiche di conservare i progetti in archivi informatici?

Alcune risposte

5) Andrea Ichino si pone alcune domande, retoricamente preoccupate. Una lettura più attenta del codice non guasterebbe. Vi troverebbe risposte chiare, e passabilmente liberali.
No, non è vero che i dati personali possono essere utilizzati una volta sola. È esplicitamente detto, invece, che “possono essere conservati e trattati per altri scopi statistici o scientifici”, oltre a quello originario.
E possono essere tranquillamente passati a un collega: “i dati personali trattati per un determinato scopo statistico (o scientifico) possono essere comunicati () a () un ricercatore per altri scopi statistici (o scientifici) chiaramente determinati per iscritto nella richiesta dei dati”. Certo, con degli obblighi per il ricercatore richiedente: predisporre il progetto di ricerca; impegnarsi a non effettuare trattamenti per fini diversi da quelli indicati; non comunicare ulteriormente i dati a terzi. Se si riflette sul fatto che stiamo parlando di basi di dati personali, la logica che motiva questi obblighi dovrebbe essere comprensibile: evitare l’incontrollato proliferare di ricercatori che li detengono indefinitamente.
Meno ovvia è la risposta all’interrogativo sulla possibilità di mettere i dati a disposizione degli studenti. Qui, tuttavia, è bene porsi una domanda preliminare: per le necessità correnti degli studenti servono davvero dati personali? Oppure bastano basi di dati anonimi? La risposta è chiaramente la seconda. Il successo della “Data Liberation Initiative” canadese, con public use files di microdati distribuiti alle biblioteche universitarie, via Internet, ne è la riprova. (1)

6) Un ultimo aspetto riguarda l’accesso a basi di dati personali prodotti dalle agenzie statistiche nazionali, in particolare quando contengano dati sensibili. In questi casi vi è un accesso ristretto: regolato da procedure di autorizzazione; talvolta realizzato in “siti sicuri“, aree di lavoro dove i dati sono elaborati, ma dalle quali non possono essere esportati. Ciò vale anche negli Stati Uniti e nei paesi scandinavi. Per gli Stati Uniti basti un esempio: le analisi su basi di microdati di imprese o stabilimenti avvengono soltanto in Research Data Centers (così sono chiamati i siti sicuri) del Center for Economic Studies. (2) Per i paesi scandinavi, si guardi a un recente quadro della normativa e delle pratiche per l’accesso a microdati a fini di ricerca. (3) Disposizioni di analogo tenore valgono per l’Italia. Il codice deontologico per i trattamenti effettuati dall’Istat, e più in generale nell’ambito del Sistema statistico nazionale (Sistan), prevede che i ricercatori possano accedere a basi di dati personali ed elaborarle “nell’ambito di specifici laboratori” – il nome nostrano dei siti sicuri. Inoltre, basi di dati personali possono essere trasmesse a ricercatori “nell’ambito di progetti congiunti e () sulla base di appositi protocolli di ricerca”.

Gli obiettivi prioritari

Andrea Ichino ha dunque preso un grossolano abbaglio? No. Quando afferma che agli svedesi la privacy interessa, che la tutelano bene, senza con ciò rendere impossibili ricerche di valore, dice il vero. Quando lamenta i ritardi della situazione italiana, dice il vero. Ma manca il bersaglio quando imputa le distanze fra la situazione svedese e quella italiana principalmente a perduranti differenze nella normativa sulla privacy.
Più che la grammatica (le regole su privacy e ricerca scientifica, ormai non vistosamente diverse nei paesi dell’Unione europea), conta la pratica. È sul terreno dei fatti che l’Italia ha accumulato pericolosi ritardi: la produzione di basi di microdati per la ricerca è insufficiente; manca una cornice organizzativa appropriata – del tipo “UK Data Archive” (4) – per produrli, mantenerli e distribuirli.
È bene che critiche, stimoli, impegni siano indirizzati nella direzione giusta.

Gli obiettivi-chiave sono due:

§ ampliare la produzione e migliorare la manutenzione e distribuzione di basi di microdati anonimi;

§ realizzare un sito sicuro virtuale, accessibile tramite la rete web, per elaborazioni su basi di dati personali prodotti dall’Istat e dal Sistan.

(1) Vedi E. Boyko e W. Watkins, “Safe data, safe settings: Not either/or solution”, in Ceies, Proceedings of the nineteenth Seminar: Innovative solutions in providing access to micro-data, Lisbon-Portugal, 26-27 September 2002, Eurostat, Theme 0 – Miscellaneous, Luxembourg, Office for Official Publications of the European Communities, 2003.

(2) R.H. McGuckin e G. Pascoe, “The Longitudinal Research Database (LRD): status and usefulness”, Survey of Current Business, November 1998, pp. 30-37.

(3) B. Pettersson, “Access to micro-data. Legislation in Nordic countries”, in Ceies, Proceedings of the nineteenth Seminar: Innovative solutions in providing access to micro-data, Lisbon-Portugal, 26-27 September 2002, Eurostat, Theme 0 – Miscellaneous, Luxembourg, Office for Official Publications of the European Communities, 2003.

(4) K. Schürer, “Solutions to provide access to microdata: the experience of the UK Data Archive”, in Ceies, Proceedings of the nineteenth Seminar: Innovative solutions in providing access to micro-data, Lisbon-Portugal, 26-27 September 2002, Eurostat, Theme 0 – Miscellaneous, Luxembourg, Office for Official Publications of the European Communities, 2003.

Un Codice per tutelare privacy e ricerca ( di Ugo Trivellato)

Ugo Trivellato
20 Maggio 2004

È stato definito il Codice di deontologia e buona condotta per il trattamento dei dati personali utilizzati per scopi statistici e scientifici. Lo hanno sottoscritto, presso il Garante della privacy, i rappresentanti della Conferenza dei rettori delle università italiane (Crui) e di dieci società scientifiche. (1)
Per il completamento formale dell’iter sono richiesti alcuni ulteriori passi, che porteranno alla pubblicazione del codice deontologico nella “Gazzetta ufficiale”. (2)
Ma nella sostanza il percorso è concluso.

Un cammino lungo e accidentato

Alla definizione del codice deontologico si è giunti attraverso un percorso lungo (troppo lungo, oltre sette anni) e accidentato. La legge n. 675 del 31 dicembre 1996 sulla “Tutela delle persone e di altri soggetti rispetto al trattamento di dati personali” dava una interpretazione restrittiva della direttiva dell’ Unione europea del 1995, (3) con disposizioni rigide e minuziose. Era, del resto, lo stesso legislatore a mostrarsi consapevole di possibili manchevolezze. La affiancava, infatti, con una legge di delega al Governo a integrarla e correggerla. Tra l’altro, con una normativa specifica per il trattamento di dati personali a fini di ricerca, alla cui definizione la comunità scientifica ha attivamente contribuito con un gruppo di lavoro, promosso e coordinato dal Consiglio italiano per le scienze sociali, che riunisce i rappresentanti delle maggiori società scientifiche e della Crui.

Le tappe salienti sono state l’emanazione del decreto legislativo in tema di “trattamento dei dati personali per finalità storiche, statistiche e di ricerca scientifica” (luglio 1999), la presentazione della proposta del codice deontologico da parte delle società scientifiche (marzo 2000), l’emanazione del Testo unico ha rimosso residue chiusure e rigidità, che avevano determinato uno stallo nell’esame della proposta delle società scientifiche. Su questa base, è ripreso il confronto tra il gruppo di lavoro e il Garante, fino alla definizione dell’ultimo, ma imprescindibile tassello, il codice deontologico. Perché la disciplina più favorevole diventerà operante soltanto quando questo sarà efficace.
Ho sommariamente ripercorso questo itinerario, perché testimonia le difficoltà che si sono dovute superare. Alla radice, vi era (e per il concreto svolgersi di attività di ricerca, in parte permane) un’insufficiente comprensione delle esigenze proprie della ricerca scientifica e della sua funzione sociale. Recenti, preoccupati interventi in “lavoce.info” (Ichino-Rossi, Trivellato e Cislaghi) sui troppi vincoli nell’accesso ai dati per scopi scientifici, si sono fermati sulla questione.
È sufficiente richiamare qui le due basilari ragioni che motivano un “credito di riservatezza” per trattamenti di dati per scopi scientifici. Da un lato, adeguate basi di dati individuali se necessario personali (riferiti cioè a persone identificate o identificabili) costituiscono l’indispensabile supporto informativo per rispondere a importanti interrogativi conoscitivi e per valutare, e indirettamente per disegnare, politiche. D’altro lato, la ricerca scientifica ha sì bisogno di trattare dati individuali, ma mira a risultati generali, che non hanno ricadute dirette sui singoli e non ne mettono a rischio la privacy.

Le scelte fondamentali

Nel preambolo del codice deontologico se ne mettono in evidenza finalità e logica ispiratrice.
La funzione del codice è individuata nel contemperamento di “valori” e “diritti” diversi. A fronte del diritto alla privacy, sono messe in luce le necessità della ricerca scientifica e le ragioni che ne sono alla base: il principio della libertà della ricerca, costituzionalmente garantito, e le esigenze di sviluppo della ricerca per migliorare le condizioni della società. Vi è un’indicazione in favore dell'”universal access to all bona fide’ analytical users”. Per dati depositati in archivi di proprietà pubblica o che risultino da un’attività sostenuta da finanziamenti pubblici, vale il principio di imparzialità e di non discriminazione nei confronti di ricercatori interessati a trattarli per scopi scientifici.
Del codice deontologico, almeno tre punti meritano di essere messi a fuoco. Innanzitutto, ne è definito l’ambito di applicazione. Debbono valere due presupposti:

▪ In ragione del soggetto: deve trattarsi di un’università o altro ente di ricerca o società scientifica, oppure di un singolo ricercatore che operi in un’università o ente di ricerca o sia socio di una società scientifica.

▪ In ragione della materia, si richiede al ricercatore responsabile di predisporre un progetto di ricerca, redatto secondo gli standard dei protocolli di ricerca del pertinente settore disciplinare.

In secondo luogo, il codice deontologico traccia una chiara distinzione fra dati personali e dati anonimi. La nozione di dato personale è sensatamente circoscritta: sono considerati tali solo i dati che consentono l’identificazione di una persona con l’utilizzo di “mezzi ragionevoli”. Buona parte delle basi di dati utilizzate nella ricerca scientifica sono dunque da considerarsi anonime; quindi, non interessate dalla normativa sulla privacy, che si applica solo ai dati personali.
Infine, il corpo centrale del codice completa il quadro delle regole del Testo unico secondo un ragionevole principio di parsimonia e, nello stesso tempo, con spirito liberale. Quando siano sufficienti per gli scopi di una ricerca, saranno utilizzati dati anonimi. Altrimenti, si utilizzeranno in maniera oculata dati personali: senza eccessive bardature burocratiche e, insieme, assicurando un’adeguata protezione della privacy.

Dopo le norme, servono i fatti

L’entrata in vigore del codice deontologico è una cruciale condizione permissiva perché l’attività dei ricercatori si possa svolgere senza irragionevoli ostacoli.
Ma non è certo sufficiente. Al codice vanno affiancate condizioni positive di effettiva disponibilità di basi di microdati per la ricerca: prodotte in via corrente, mantenute e distribuite entro una cornice organizzativa adeguata, rese accessibili a tutti i ricercatori interessati.
Su questo terreno, la situazione italiana è decisamente insoddisfacente. La disponibilità di basi di microdati è in sostanza limitata ai cosiddetti files standard’ files di dati anonimi di uso pubblico relativi ad alcune rilevazioni, rilasciati dall’Istat. I ritardi rispetto alle pratiche di paesi avanzati sono preoccupanti. La distanza da un’esperienza quale, ad esempio, quella dell’UK Data Archive è vistosa al punto da rischiare di essere scoraggiante.
Assicurare la produzione e distribuzione di adeguate basi di microdati: è questo l’obiettivo che occorre mettere, sollecitamente, nell’agenda della politica della ricerca; è questo, l’impegno che attende le società scientifiche e l’intera comunità scientifica.

Per saperne di più

“Codice di deontologia e buona condotta per il trattamento dei dati personali utilizzati per scopi statistici e scientifici” sottoscritto in via preliminare dalla Crui e dalle società scientifiche.

(1) Associazione italiana di epidemiologia, Associazione italiana di sociologia, Consiglio italiano per le scienze sociali, Società italiana degli economisti, Società italiana di biometria, Società italiana di demografia storica, Società italiana di igiene medicina preventiva e sanità pubblica, Società italiana di statistica, Società italiana di statistica medica ed epidemiologia clinica, Assirm (l’Associazione tra istituti di ricerche di mercato, sondaggi di opinione, ricerca sociale).

(2) Il nome non deve trarre in inganno. È chiamato “codice di deontologia”, ma non è uno strumento di autodisciplina di associazioni scientifiche o professionali. È, invece, un testo di legge, sia pure secondaria’, elaborata col coinvolgimento delle istituzioni e società scientifiche interessate.

(3) Si tratta della “Direttiva 95/46/Ce del “Parlamento europeo e del Consiglio del 24 ottobre 1995 relativa alla tutela delle persone fisiche con riguardo al trattamento dei dati personali, nonché alla libera circolazione di tali dati”, Gazzetta ufficiale delle Comunità europee, 23.11.1995, n. L 281/31-50.

Lavoce è di tutti: sostienila!

Lavoce.info non ospita pubblicità e, a differenza di molti altri siti di informazione, l’accesso ai nostri articoli è completamente gratuito. L’impegno dei redattori è volontario, ma le donazioni sono fondamentali per sostenere i costi del nostro sito. Il tuo contributo rafforzerebbe la nostra indipendenza e ci aiuterebbe a migliorare la nostra offerta di informazione libera, professionale e gratuita. Grazie del tuo aiuto!

SOSTIENI lavoce

Correlati

Andrea Ichino

ichino andrea Si laurea all'Università Commerciale Luigi Bocconi nel 1985, con una tesi sugli effetti dei sussidi di disoccupazione sul mercato del lavoro, sotto la guida di Mario Monti. Nel 1990 ha conseguito un Ph.D. presso il Massachusetts Institute of Technology. Ha iniziato quindi la sua carriera accademica presso la stessa Università Bocconi, sia come docente che come ricercatore presso l'Istituto Innocenzo Gasperini. Dal 1997 al 2006 ha insegnato macro e microeconomia del lavoro e microeconometria presso l'Istituto Universitario Europeo di Firenze. Dall'ottobre 2006 è docente di econometria avanzata e di economia delle risorse umane presso l'Università degli Studi di Bologna.

2 commenti

Aggiungi commento →

Andrea Ichino

E’ vero: a me sfugge la distinzione essenziale tra dati personali e dati anonimi. E mi sfugge perché non è una distinzione chiara, netta, binaria: è una distinzione sfumata che lascia il campo a molteplici interpretazioni. Tanto è vero che nel codice la distinzione si basa sul concetto di “ragionevolezza dei mezzi” per l’identificazione dei soggetti tutelati.

Ugo Trivellato converrà con me sul fatto che, in gran parte dei casi concreti, sono possibili opinioni assai diverse sull’esistenza di condizioni che favoriscono l’identificazione con “mezzi ragionevoli” oppure no. Ad esempio, la presenza dei codici provinciali nei dati dell’Indagine sui Bilanci delle Famiglie Italiane della Banca d’Italia consente l’identificazione o no?

Ma il problema è un altro, e su questo Ugo Trivellato non si esprime. Perché mai un ricercatore dovrebbe essere interessato a identificare un singolo soggetto, indipendentemente dalla ragionevolezza dei mezzi? Francamente non si capisce perché mai dovrebbe farlo: non é certo nel suo interesse. E se qualche ricercatore male intenzionato lo facesse puniamolo severamente, ma non rendiamo la vita impossibile a tutti gli altri.

Stando alla logica del Codice Deontologico, dovremmo eliminare tutti i coltelli da cucina dalle case degli Italiani, perché ogni tanto qualche marito li usa per accoltellare la moglie (o viceversa).

Ecco quindi qual’è l’alternativa al concetto di “mezzi ragionevoli” che Ugo Trivellato mi invita a suggerire. In realtà l’aveva già suggerita il progetto di legge proposto da Nicola Rossi: consentire l’accesso anche ai dati personali punendo però duramente un loro eventuale uso che danneggi i diritti della persona.

Sicuramente la disponibilità di dati in Italia è scarsa soprattutto perché i dati non vengono prodotti, non vengono mantenuti e non vengono distribuiti. Concordo pienamente con Ugo Trivellato sul fatto che questo sia il fronte principale sul quale agire. Ma quel poco che c’è sarebbe diventato maggiormente accessibile e utilizzabile (a costo zero) se il Codice avesse adottato l’alternativa proposta nel Progetto di Nicola Rossi.

PS:
1) I miei studenti avrebbero bisogno dei codici provinciali nell’Indagine Banca d’Italia. Potrebbero scrivere papers molto interessanti disponendo di quella variabile. Stanno chiedendo dati anonimi o personali?
2) Recentemente mi è stato impedito di mettere a disposizione dei miei studenti, senza previo progetto dettagliato di quello che intendono fare, una importante banca dati italiana simile a quella della Banca d’Italia. Quella banca dati contiene dati personali o anonomi?

27/05/2004

Risposta
- La redazione
  
  Dubito che i lettori di la voce.info si appassionino ad un fitto scambio di opinioni tra Andrea Ichino e me sullaccesso ai dati individuali a fini di ricerca scientifica. E non vorrei che queste repliche e controrepliche oscurassero laspetto di fondo: sui termini essenziali della questione normativi e di fatto Andrea Ichino ed io abbiamo la stessa opinione. Serve una normativa ragionevolmente liberale. E serve una produzione e distribuzione di basi di microdati adeguata.
  
  Dove sono, allora, le diversità dopinione? Rispondo molto brevemente, restando allessenziale.
  
  Andrea Ichino argomenta come se il legislatore italiano, nel disciplinare laccesso a dati individuali a fini di ricerca, si fosse trovato di fronte a una tabula rasa, avesse potuto decidere con grande libertà. Così non è. Debbo ripetermi: alle spalle cè la Direttiva n. 95/46 dellUnione Europea, vincolante per gli Stati membri. La proposta di legge di Nicola Rossi è una strada non percorribile, perché è in contrasto con la direttiva (vedi Trivellato [21.10.2003]). Insistere sulle strade senza uscita non è produttivo.
  
  Andrea Ichino si domanda: Perché mai un ricercatore dovrebbe essere interessato a identificare un singolo soggetto, indipendentemente dalla ragionevolezza dei mezzi? Francamente non si capisce perché mai dovrebbe farlo: non é certo nel suo interesse. Come non essere daccordo? Restano tuttavia due questioni: (a) i vincoli posti dalla direttiva europea, che stabilisce un forte diritto alla privacy, col quale il diritto alla libertà di ricerca va contemperato; (b) la debolezza di unargomentazione che riecheggia il manzoniano Omnia munda mundis per regolare diritti e doveri.
  Pongo io, retoricamente, due domande. Chi è ricercatore e chi non lo è? E, posto che un ricercatore, oltre che fare ricerca, nella vita fa molte altre cose, come si appura che sta trattando dei dati personali per scopi scientifici e non invece per un qualche altro scopo? Il codice deontologico risponde a queste domande: individua in maniera sensatamente larga linsieme dei ricercatori; richiede un progetto di ricerca che documenti le finalità scientifiche di un trattamento di dati personali; disciplina il trattamento di dati personali per scopi di ricerca in una maniera che ho definito sensatamente liberale (dati i vincoli della normativa europea e nazionale).
  Su questioni di questo tipo occorre intervenire in maniera articolata, non con sciabolate illusoriamente sbrigative. Eliminare tutti i coltelli da cucina dalle case degli italiani, perché ogni tanto qualche marito li usa per accoltellare la moglie (o viceversa) sarebbe certamente sbagliato. Ma Andrea Ichino converrà con me che la libera vendita di pistole e fucili nei supermercati, punendo severamente i colpevoli di omicidi, non è una politica distributiva particolarmente saggia.
  
  Sulla distinzione tra dati personali e dati anonimi, ci sono indubbiamente margini di incertezza. Ma le agenzie statistiche nazionali dei paesi avanzati hanno trovato criteri operativi ragionevoli per mettere in pratica la distinzione (vedi Trivellato [25.05.04]). E il codice deontologico fornisce indicazioni per applicare il criterio dei mezzi ragionevoli.
  Andrea Ichino si domanda: la presenza dei codici provinciali nei dati dellIndagine sui Bilanci delle Famiglie Italiane della Banca d’Italia consente l’identificazione o no? Anche a questo proposito debbo ripetermi e invitare Andrea Ichino a leggere le repliche prima di scrivere le controrepliche -. Lidentificabilità dipende dalla configurazione complessiva della base di dati, non dalla presenza o meno (o dal gradi di dettaglio) di una singola variabile. Una base di dati può restare anonima pur in presenza di una forte dettaglio territoriale – la provincia di residenza -, compensandolo con un minore dettaglio per qualche altra variabile (ad esempio letà in classi anziché in anni).
  
  In chiusura, vorrei comunque sottolineare il decisivo punto sul quale Andrea Ichino consente con me: la disponibilità di dati in Italia è scarsa soprattutto perché i dati non vengono prodotti, non vengono mantenuti e non vengono distribuiti. È questo il fronte principale sul quale agire.
  
  27/05/2004
  
  Risposta

Ancora sul Codice deontologico

Lavoce è di tutti: sostienila!

Correlati

Correlati

Andrea Ichino

20 maggio 2004

Irpef

2 commenti

Andrea Ichino

La redazione

Lascia un commento Annulla risposta