Accueil Coronavirus Des experts mettent en garde contre le risque pour la vie privée...

Des experts mettent en garde contre le risque pour la vie privée alors que les États-Unis utilisent le GPS pour lutter contre la propagation des coronavirus | La technologie

Un fossé transatlantique sur la façon d’utiliser les données de localisation pour lutter contre les risques de coronavirus met en évidence le manque de garanties pour les données personnelles des Américains, ont averti des universitaires et des scientifiques des données.

Les Centers for Disease Control and Prevention (CDC) des États-Unis se sont tournés vers les données fournies par l’industrie de la publicité mobile pour analyser les mouvements de population au milieu de la pandémie.

En raison d’un manque de protection systématique de la vie privée aux États-Unis, les données collectées par les agences de publicité sont souvent extrêmement détaillées: les entreprises ayant accès aux données de localisation GPS, telles que les applications météo ou certains sites de commerce électronique, sont connues pour vendre ces données pour à des fins de ciblage publicitaire. Ces données fournissent des informations beaucoup plus granulaires sur l’emplacement et le mouvement des individus que les données de réseau mobile reçues par le gouvernement britannique de transporteurs, y compris O2 et BT.

Alors que les deux ensembles de données suivent les individus au niveau de la collecte, les données GPS sont précises à moins de cinq mètres, selon Yves-Alexandre de Montjoye, spécialiste des données à l’Imperial College, tandis que les données du réseau mobile sont précises à 0,1 km² dans les centres-villes et beaucoup moins dans zones moins denses – la différence entre localiser un individu dans sa rue et dans une pièce spécifique de sa maison.

En outre, les garanties juridiques sur les données de localisation au Royaume-Uni signifient que le gouvernement ne reçoit que des informations des opérateurs de téléphonie mobile sous forme agrégée, ce qui empêche les individus d’être identifiés. « La plupart du temps, vous n’avez pas besoin de savoir qui se cache derrière le téléphone », a déclaré de Montjoye. « Si vous ne faites pas de traçage de contrats, vous êtes intéressé par les agrégats: qui se déplace entre Londres et Édimbourg, par exemple, ou entre les arrondissements de Londres. »

Selon le sous-commissaire chargé des politiques de l’OIC, Steve Wood, l’agrégation est cruciale pour la base juridique sur laquelle le gouvernement a accès aux données. «L’analyse généralisée des tendances des données de localisation aide à faire face à la crise des coronavirus. Lorsque ces données sont correctement anonymisées et agrégées, elles ne relèvent pas de la loi sur la protection des données car aucun individu n’est identifié.

« Dans ces circonstances, les lois sur la confidentialité ne sont pas violées tant que les garanties appropriées sont en place », a ajouté Wood.

En revanche, les données de localisation acquises par le CDC sont pseudonmyisées, mais non agrégées, selon un rapport du Wall Street Journal. Cela signifie que les données d’identification telles que les noms ont été supprimées de l’ensemble de données, mais les données ont été laissées dans un format qui permet à un individu d’être suivi sur une période de temps.

La puissance d’une telle approche est mise en évidence dans une démonstration de la société de visualisation de données Tectonix GEO, en utilisant les données de localisation collectées par le fournisseur de données de l’industrie publicitaire X-Mode Social. En suivant les mouvements de tous les vacanciers de la semaine de relâche sur une plage de Floride à la mi-mars, Tectonix a montré comment un échec temporaire de la distanciation sociale pouvait théoriquement propager une infection à travers une vaste bande de l’est et du centre des États-Unis.

Tectonix GEO
(@TectonixGEO)

Vous voulez voir le véritable impact potentiel de l’ignorance de la distance sociale? Grâce à un partenariat avec @xmodesocial, nous avons analysé les emplacements secondaires des appareils mobiles anonymisés qui étaient actifs à un seul Ft. Plage de Lauderdale pendant les vacances de printemps. C’est là qu’ils ont traversé les États-Unis: pic.twitter.com/3A3ePn9Vin

25 mars 2020

Mais, prévient de Montjoye, ces données ne sont jamais vraiment anonymes. «Les données d’origine sont pseudonymisées, mais il est assez facile de réidentifier quelqu’un. Savoir où se trouvait quelqu’un suffit à les réidentifier 95% du temps, en utilisant les données du téléphone portable. Il y a donc un problème de confidentialité: vous devez traiter les données pseudonymisées, mais les données pseudonymisées peuvent être réidentifiées. La plupart du temps, si cela est fait correctement, les agrégats sont agrégés et ne peuvent pas être anonymisés. »

Le scientifique des données souligne les tentatives réussies d’utiliser les données de localisation pour suivre les épidémies de paludisme au Kenya ou de dengue au Pakistan comme preuve que les données de localisation ont été utilisées dans ces situations, mais avertit que la confiance sera compromise si les données collectées à des fins de modélisation sont alors «subrepticement utilisé pour sévir contre les individus ne respectant pas les quarantaines ou conservé et utilisé à des fins non liées ».