I dati demografici anonimi possono ancora essere utilizzati per identificarti

[ware_item id=33][/ware_item]

Profilo di un uomo il cui volto ha informazioni identificabili su di lui.


Se sei una delle poche persone a leggere i termini di servizio, potresti trovare sepolto nelle politiche sulla privacy di varie aziende una clausola che afferma che potrebbero raccogliere e vendere i tuoi dati a terzi.

I dati, dicono, sono resi anonimi, ma un nuovo studio pubblicato su Nature Communications dimostra che, a seconda di ciò che condividi, può essere ancora possibile identificarti con una precisione sorprendente. I ricercatori dell'Imperial College di Londra e dell'Università di Lovanio in Belgio hanno creato un modello di apprendimento automatico in grado di reidentificare le persone da set di dati anonimi, anche da "set di dati fortemente incompleti".

Tali rivelazioni arrivano in un momento in cui un maggior numero di persone diffida delle società che vendono i loro dati a terzi e hanno conseguenze dannose sulla privacy per i dati anonimi attualmente memorizzati (e condivisi) che molte aziende e istituzioni accademiche raccolgono e utilizzano.

Come funziona l'anonimizzazione dei dati?

A meno che tu non sia completamente fuori dalla rete, produci regolarmente molti dati personali, dai tuoi acquisti online e dai tuoi percorsi di corsa a più dati personali come i tuoi dati sanitari.

Tali dati sono polvere d'oro per gli inserzionisti che vogliono migliorare il loro targeting (leggi: Cambridge Analytica) e per i ricercatori che cercano tendenze nella salute pubblica e per insegnare il riconoscimento facciale all'intelligenza artificiale.

Per proteggere le identità dietro i dati, le "migliori pratiche" generali sono state quelle di rimuovere ovviamente informazioni identificative come nomi, indirizzi e-mail e numeri di telefono e di previdenza sociale.

[Desideri maggiori notizie su privacy e sicurezza? Iscriviti alla newsletter del blog ExpressVPN.]

Tecniche di anonimizzazione obsolete

Molti dei metodi popolari di anonimizzazione sono rimasti invariati dagli anni '90, non riuscendo ad adottare tecniche di anonimizzazione più complesse in risposta all'esplosione dei dati online da.

Ci sono stati diversi casi, risalenti al 2000, di set di dati apparentemente anonimi che sono stati rilasciati e successivamente identificati.

Nel 2017, i giornalisti "hanno identificato con successo i politici in un set di dati anonimi sulla cronologia di navigazione di 3 milioni di cittadini tedeschi, scoprendo le loro informazioni mediche e le loro preferenze sessuali".

Il nuovo studio evidenzia anche lavori precedenti in cui i ricercatori sono stati in grado di "identificare in modo univoco le persone in traiettorie di taxi anonimizzate a New York, viaggi in bici a Londra, dati della metropolitana a Riga e set di dati di telefoni cellulari e carte di credito".

Pochi punti dati necessari per identificarti di nuovo

I ricercatori dietro lo studio hanno creato un modulo online in cui è possibile verificare le possibilità di essere identificati (solo per residenti negli Stati Uniti e nel Regno Unito) da un'ipotetica compagnia di assicurazione sanitaria con solo tre punti dati: sesso, data di nascita e codice postale.

Ad esempio, se tu fossi un maschio degli Stati Uniti nato il 12 novembre 1990 e attualmente vivesse nel codice di avviamento postale 02139, c'è un 54% possibilità che il tuo datore di lavoro o vicino ti possa identificare.

I dati demografici anonimi possono ancora essere utilizzati per identificartiMa quella percentuale aumenta quando aggiungi altri attributi: l'aggiunta del tuo stato civile da solo potrebbe aumentare la possibilità di identificarti fino a 99%. Altri attributi includono il numero di veicoli, la classe di lavoro (settore scelto) e la proprietà della casa.

I dati demografici anonimi possono ancora essere utilizzati per identificarti

In che modo le aziende dovrebbero anonimizzare i nostri dati?

Da questo studio emerge chiaramente che le attuali pratiche di anonimizzazione non proteggono adeguatamente la privacy delle persone e le rendono vulnerabili al fatto di essere nuovamente identificate da chiunque abbia accesso a tali dati.

Sfortunatamente, non c'è molto che la persona possa fare qui: spetta alle aziende e alle istituzioni che archiviano, vendono e utilizzano questi dati per cambiare il modo in cui anonimizzano i dati. Regolamenti come il GDPR dell'UE e la legge sulla privacy dei consumatori della California richiedono entrambi che le persone in tutti i set di dati siano anonime e impossibili da reidentificare, ma tenere le società responsabili può rivelarsi difficile.

Un modo per impedire la reidentificazione in dati anonimi è adottare la privacy differenziale, un modello matematico che aggiunge con attenzione una quantità controllata di "rumore" casuale ai dati prima che vengano inviati a un server, rendendoli un po 'più approssimativi che precisi, ma protegge adeguatamente la privacy dell'individuo. Aziende come Apple e Google hanno incorporato la privacy differenziale nella loro raccolta di dati.

Vedremo presto la privacy differenziale messa alla prova su grande scala: verrà utilizzata nel prossimo censimento degli Stati Uniti.

I passaggi che puoi prendere per proteggerti

Quindi, quando un'azienda chiede la tua autorizzazione per condividere dati anonimi con terze parti, cosa dovresti fare? Valuta di anonimizzare i tuoi dati da solo. Non tutte le società hanno davvero diritto alla tua vera data di nascita, al tuo vero codice postale, al tuo genere o stato civile, o anche necessariamente al tuo vero nome. Se un dettaglio non è cruciale per l'uso di un particolare servizio, cospargere alcune incoerenze. (E se un nome errato in modo univoco inizia a comparire nella tua casella di posta, saprai esattamente quale azienda ti ha venduto.)

Meglio ancora, fare affari solo con aziende totalmente in anticipo sui dati che raccolgono, che non raccolgono mai i dati di cui non hanno bisogno, che non condividono o vendono mai le tue informazioni personali con terze parti e che anonimizzano persino la diagnostica di base informazioni mortalmente gravi (e persino permetterti di rinunciare, se lo desideri). Ne conosciamo almeno uno.

I dati demografici anonimi possono ancora essere utilizzati per identificarti
admin Author
Sorry! The Author has not filled his profile.