Les données démographiques anonymes peuvent toujours être utilisées pour vous identifier

[ware_item id=33][/ware_item]

Profil d'un homme dont le visage contient des informations identifiables à son sujet.


Si vous êtes l'une des rares personnes à lire les conditions d'utilisation, vous pouvez trouver enfoui dans les politiques de confidentialité de diverses sociétés une clause stipulant qu'elles peuvent collecter et vendre vos données à des tiers.

Les données, disent-ils, sont anonymisées, mais une nouvelle étude publiée dans Communications Nature démontre que, selon ce que vous partagez, il peut toujours être possible de vous ré-identifier avec une précision étonnante. Des chercheurs de l'Imperial College de Londres et de l'Université de Louvain en Belgique ont créé un modèle d'apprentissage automatique qui peut réidentifier des individus à partir d'ensembles de données anonymisés, même à partir «d'ensembles de données très incomplets».

De telles révélations surviennent à un moment où plus de gens se méfient des entreprises qui vendent leurs données à des tiers et ont des implications de confidentialité accablantes pour les données anonymes actuellement stockées (et partagées) que de nombreuses entreprises et institutions universitaires collectent et utilisent.

Comment fonctionne l'anonymisation des données?

À moins que vous ne soyez complètement déconnecté du réseau, vous produisez régulièrement de nombreuses données personnelles, de vos achats en ligne et de vos itinéraires de course à des données plus personnelles comme vos dossiers de santé.

Ces données sont de la poudre d'or pour les annonceurs qui souhaitent améliorer leur ciblage (lire: Cambridge Analytica), et pour les chercheurs à la recherche de tendances en santé publique, et pour enseigner la reconnaissance faciale à l'intelligence artificielle.

Pour protéger les identités derrière les données, les «meilleures pratiques» générales ont consisté à supprimer les informations d'identification évidentes telles que les noms, adresses e-mail et numéros de téléphone et de sécurité sociale.

[Vous voulez plus d'informations sur la confidentialité et la sécurité? Inscrivez-vous à la newsletter du blog ExpressVPN.]

Techniques d'anonymisation obsolètes

De nombreuses méthodes d'anonymisation populaires sont restées inchangées depuis les années 1990, n'ayant pas adopté de techniques d'anonymisation plus complexes en réponse à l'explosion des données en ligne depuis.

Il y a eu plusieurs cas, remontant à 2000, d'ensembles de données soi-disant anonymes qui ont été publiés puis ré-identifiés.

En 2017, les journalistes ont réussi à «réidentifier les politiciens dans un ensemble de données d'historique de navigation anonymisé de 3 millions de citoyens allemands, révélant leurs informations médicales et leurs préférences sexuelles».

La nouvelle étude souligne également des travaux antérieurs dans lesquels les chercheurs étaient en mesure «d'identifier de manière unique des individus dans des trajectoires de taxi anonymisées à New York, des trajets de partage de vélos à Londres, des données de métro à Riga et des jeux de données de téléphones portables et de cartes de crédit».

Peu de points de données nécessaires pour vous ré-identifier

Les chercheurs à l'origine de l'étude ont créé un formulaire en ligne où vous pouvez tester vos chances d'être identifié (pour les résidents des États-Unis et du Royaume-Uni uniquement) auprès d'une société d'assurance maladie hypothétique avec seulement trois points de données: votre sexe, votre date de naissance et votre code postal.

Par exemple, si vous étiez un homme américain né le 12 novembre 1990 et vivant actuellement dans le code postal 02139, il y a un 54% la chance que votre employeur ou voisin puisse vous identifier.

Les données démographiques anonymes peuvent toujours être utilisées pour vous identifierMais ce pourcentage augmente lorsque vous ajoutez plus d'attributs: l'ajout de votre état civil à lui seul pourrait augmenter les chances de vous identifier jusqu'à 99%. D'autres attributs incluent le nombre de véhicules, la classe de travail (industrie choisie) et la propriété de la maison.

Les données démographiques anonymes peuvent toujours être utilisées pour vous identifier

Comment les entreprises devraient-elles anonymiser nos données?

Il ressort clairement de cette étude que les pratiques actuelles d’anonymisation ne protègent pas adéquatement la vie privée des personnes et les rendent vulnérables à une nouvelle identification par quiconque a accès à ces données..

Malheureusement, il n'y a pas grand-chose que l'individu puisse faire ici - c'est aux entreprises et aux institutions qui stockent, vendent et utilisent ces données de changer la façon dont elles anonymisent les données. Des réglementations telles que le RGPD de l'UE et la Loi sur la protection des renseignements personnels des consommateurs de Californie exigent toutes les deux que les individus dans tous les ensembles de données soient anonymes et impossibles à réidentifier, mais tenir les entreprises responsables peut s'avérer difficile.

Une façon d'empêcher la ré-identification dans les données anonymisées est d'adopter la confidentialité différentielle, un modèle mathématique qui ajoute soigneusement une quantité contrôlée de «bruit» aléatoire dans les données avant qu'elles ne soient envoyées à un serveur, ce qui rend les données un peu plus approximatives qu'exactes, mais protège adéquatement la vie privée de l'individu. Des entreprises comme Apple et Google ont intégré la confidentialité différentielle dans leur collecte de données.

Nous verrons bientôt la confidentialité différentielle mise à l'épreuve: elle sera utilisée lors du prochain recensement américain..

Mesures que vous pouvez prendre pour vous protéger

Ainsi, lorsqu'une entreprise vous demande la permission de partager des données anonymisées avec des tiers, que devez-vous faire? Pensez à anonymiser vous-même vos données. Toutes les entreprises n'ont pas vraiment droit à votre vraie date de naissance, à votre code postal réel, à votre sexe ou à votre état civil, ou même nécessairement à votre vrai nom. Si un détail n'est pas crucial pour votre utilisation d'un service particulier, saupoudrez quelques incohérences. (Et si un nom mal orthographié apparaît dans votre boîte aux lettres, vous saurez exactement quelle entreprise vous a vendu.)

Mieux encore, ne faites affaire qu'avec des entreprises qui sont totalement directes sur les données qu'elles collectent, qui ne collectent jamais les données dont elles n'ont pas besoin, qui ne partagent ou ne vendent jamais vos informations personnelles avec des tiers, et qui prennent l'anonymat même des diagnostics de base informations mortellement sérieuses (et même vous permettre de vous retirer si vous le souhaitez). Nous connaissons au moins un.

Les données démographiques anonymes peuvent toujours être utilisées pour vous identifier
admin Author
Sorry! The Author has not filled his profile.