« Je sais avec qui tu vas passer la soirée ! »

Publié par Echosciences Grenoble, le 27 août 2012   3.5k

C’est le titre de la présentation qu'a fait Mathieu Cunche, post-doctorant dans l’équipe Planete, à la conférence WoWMoM à San Francisco fin juin.

Ses travaux menés avec Mohamed Ali Kaafar de cette même équipe et Roksana Boreli (NICTA), montrent comment, à partir de données concernant les connexions aux réseaux WiFi d’un terminal mobile, il est facile de recueillir des informations personnelles et d’en déduire des liens sociaux. Explications avec Mathieu Cunche.

Comment avez-vous pressenti cette faille de protection de la vie privée ?

J’étais en post doc à Sydney (Australie). L’outil avec lequel je travaillais pour préparer mon cours sur le WiFi me permettait de récupérer les noms de réseaux WiFi auxquels tentaient de se connecter les terminaux autour de moi. Parmi eux est apparu le nom d’un réseau personnel auquel je me connectais en France ! Il provenait en fait de l’ordinateur de ma compagne. J’ai compris que chaque terminal gardait en mémoire la liste des réseaux auxquels il s’était déjà connecté, et la diffusait en clair lorsqu'il n'était pas connecté. Cette « empreinte WiFi » est propre à chaque terminal, autrement dit à chaque individu... Quelques chercheurs avaient pointé du doigt cette faille. Mais n’étaient pas allés plus loin.

Mathieu Cunche

Que peuvent révéler ces adresses WiFi ?

Plus qu’on imagine ! Certaines contiennent le nom des utilisateurs par exemple par défaut lors de la création d’un hotspot personnel avec un terminal Apple. D’autres contiennent des informations sur les adresses postales, sur les noms des entreprises, sur les aéroports fréquentés, les hôtels, les restaurants… J’ai voulu savoir ce qu’on pouvait en déduire. Notamment en termes de liens entre individus comme je l’avais mis en évidence. Mon hypothèse était que l’on devait pouvoir mesurer un indice de relation en tirant parti des noms de réseaux les plus spécifiques comme ceux des box à domicile, exploitées par un nombre limité d’utilisateurs, en général la famille et des amis de passage, ou les noms de réseaux professionnels partagés entre collègues. D’autant plus qu’ils constituent la majorité des noms de réseau en mémoire.

Quels développements avez-vous dû faire ?

Nous avons développé des « métriques de similarité ». Ce type d’outil est couramment utilisé par exemple dans Facebook ou LinkedIn pour suggérer des liens entre des personnes à partir de leurs profils ou sur les sites d’achat pour proposer des produits sur la base de similarité de goûts. Nous avons modifié ces métriques pour mieux prendre en compte les noms de réseau très spécifiques partagés par un petit nombre d’utilisateurs, ceux qui contiennent le plus d’informations. Nous avons testé 4 métriques.

Conclusions ?

A partir d’un calcul de similarité entre paires d’empreintes et de la probabilité de lien social, nous avons pu détecter 80 % des liens avec 7 % d’erreur, autrement dit un lien social erroné. Un résultat concluant. Nous poursuivons pour tenter d’évaluer la nature du lien (personnel, professionnel) et les habitudes de vie des utilisateurs des réseaux.

Y a-t-il des solutions pour supprimer cette faille ?

Il n'existe pas encore de solution satisfaisante. Côté recherche, des systèmes ont été proposés pour rechercher les connexions WiFi sans révéler en clair le nom des réseaux. Mais cela suppose une mise à jour de l’ensemble des terminaux et points d’accès WiFi, ce qui risque d’être difficile à implémenter. Côté industriels, les solutions proposées supposent une déclaration de tous les points d’accès au voisinage d’un terminal. Mais dans les environnements les plus denses, cela risque de surcharger la ressource WiFi. Nous travaillons à des solutions, confidentielles pour l’instant.

*
*  *

Un espion pour la bonne cause

« Je me suis d’abord promené pendant 5 mois à Sydney avec un ordinateur portable allumé dans mon sac à dos. Je l’avais configuré à partir d’outils disponibles sur Internet pour qu’il collecte les empreintes WiFi des gens que je croisais. J’ai ainsi recueilli les empreintes WiFi de 30 000 terminaux, soit 24 000 noms de réseaux. En moyenne, chaque terminal avait 5 noms de réseau, la plus grosse empreinte étant de 80 réseaux. Outre quelques noms communs comme ceux attachés aux restaurants, aéroports, ferries, la majorité des noms était unique. En utilisant des « métriques de similarité », j’ai analysé ces empreintes et mis en évidence des liens sociaux probables entre les personnes sans pour autant pouvoir les vérifier. Pour cela, j’ai travaillé sur les empreintes WiFi et les liens sociaux d’une vingtaine de volontaires. Et le résultat a conforté notre hypothèse… »

>> Source : article initialement publié sur le site d'Inria Grenoble le 31 Mai 2012
>> Illustrations : Inria