A l’heure du tout numérique, anonymiser les données personnelles devient crucial, en particulier dans la santé. Pour autant, une anonymisation complète empêcherait de soigner les patients ou de mener des travaux de recherche. Il faut accepter un risque de ré-identification des personnes. C’est ce que pense Pierre-Yves Lastic, Chief Privacy Officer de Sanofi.
Question : où sont les enjeux actuels en matière de données personnelles ?
Pierre-Yves Lastic : nous avons un grand débat autour de l’anonymisation des données. La directive 95 sur la protection des données personnelles, dit qu’une donnée anonyme n’est pas personnelle. Les traitements sont donc libres sur une donnée anonyme.
Sauf que désormais, on peut ré-identifier des personnes qui auraient été anonymes avant en croisant les données, suite à la multiplication des sources de données, Le débat actuel porte sur ce qui est acceptable et ce qui ne l’est pas.
La position du G29 – le regroupement des CNILs européennes – est toujours très protectrice de la vie privée des citoyens. Reste que si des données sont totalement anonymisées, elles ne permettent plus de recherche scientifique ou de traitement des patients.
Question : comment la situation devrait-elle évoluer ?
Pierre-Yves Lastic: à mon avis, on devrait arriver à des compromis qui sont plus ouverts que ce qui est recommandé actuellement par le G29. Il faudra placer le curseur au bon endroit entre protection de la vie privée et possibilité de travailler sur les données.
Par exemple, la médecine moderne est basée sur la génétique. Pour soigner des gens, il faut une connaissance de leurs caractéristiques génétiques. Or, la génétique en elle-même peut permettre d’identifier les gens. On peut même faire des portraits robots à partir des gènes d’une personne et si l’on combinait ce portrait robot à de la reconnaissance faciale par vidéo, on ré-identifierait une personne. Même si ce scénario est encore de la science fiction, la notion d’anonymisation va devenir de plus en plus cruciale.
Question :quelle solution préconisez-vous ?
Pierre-Yves Lastic: la solution devrait plutôt être que l’on accepte un certain niveau de risque de ré-identification. Mais pour l’instant cela n’en prend pas le chemin. La Cnil française ou les autorités allemandes sont plutôt strictes, tandis que les Britanniques sont plus pragmatiques et prêts à accepter un certain niveau de risque. Les recommandations du G29 devraient évoluer car sinon elles ne seront pas réalisables dans la pratique.
Question : comment sait-on si une donnée est anonyme ou pas ?
Pierre-Yves Lastic : nous mesurons un risque de ré-identification des personnes, 1% de risque de ré-identification est déjà élevé. On considère qu’une donnée est anonyme s’il y a un risque de ré-identification de 1 pour 1 million.
Question : comment Sanofi travaille-il les données ?
Pierre-Yves Lastic : pour chaque jeu de données que nous rendons public, nous effectuons une analyse qui permet d’évaluer ce risque de ré-identification. Certaines sociétés délivrent ces services à la fois d’anonymisation et de mesure de risque d’identification.
On peut parler de sociétés telles que Privacy Analytics – spécialisé dans l’anonymisation des données de santé – et de D-Wise – spécialisé dans l’analyse des données de santé et qui fournit également des services d’anonymisation -, mais il en existe d’autres.
Question : en pratique, comment procédez-vous ?
Pierre-Yves Lastic : lorsque nous avons un jeu de données, nous allons analyser le risque en regardant s’il y a des identifiants directs de la personne, alors on les enlève. Si il y a des identifiants indirects, on s’emploie à les rendre tellement flous qu’ils ne permettent plus d’identifier la personne. Des outils permettent de réaliser cela, mais il y a toujours une partie de travail manuel. Conséquence, anonymiser un jeu de données à l’heure actuelle, c’est encore de 1 à 3 semaines de travail selon la complexité.
Question : vous avez passé un accord avec Google, dans quel objectif ?
Pierre-Yves Lastic : on espère pouvoir trouver de l’information pertinente en croisant différentes sources de données, venues de moteurs de recherche tels que Google ou de réseaux sociaux. Nous en sommes encore aux balbutiements. Il y a des problèmes de protection des données personnelles qui sont assez importants. On ne s’engage pas dans cela en prenant des risques vis à vis des autorités de protection des données.
Il y a un autre domaine beaucoup plus proche, qui est celui du dossier médical hospitalier. Il va s’enrichir de plus en plus. On peut imaginrer que dans quelques années, beaucoup de gens auront aussi des informations génétiques dans leur dossier médical. Le dossier médical pourra aider à savoir quelle est la population qui pourrait bénéficier d’une thérapie particulière. Les données de prescription seront importantes également.
Pierre-Yves Lastic, Chief Privacy Officer de Sanofi a répondu aux questions de La Revue du Digital le 17 février à l’occasion de la remise de l’encyclopédie des Big Data de l’EBG (Electronic Business Group).