Traque sur Internet ?

Ok, enfant j'étais absolument fan de l'idée de départ du film Traque sur Internet où Sandra Bullock, pénétrant les coulisses d'un site qu'elle n'aurait pas du pénétrer se retrouve poursuivie par les Méchants™. Par la suite, toute son identité se désagrège, les méchants voulant la rendre impuissante en supprimant ses comptes bancaires, son identité, etc.

Sans que le film ne soit entièrement prémonitoire, l'idée que notre vie dépend des données qui nous représentent était très juste et se retrouve de plus en plus vérifiée de nos jours.

Mais ici, si je parle de traque sur Internet, c'est pour une raison plus simple, et finalement plus proche du sens exact du titre de notre semi-nanard de 1995.
Nous sommes, sans exagérer, traqué/es sur Internet à chaque instant.[1] Traque sur Internet Image © Columbia Pictures. Appréciez au passage le Mac old school.

Can't keep my hand out of the cookie jar

Peut-être avez-vous déjà entendu parlé des cookies. Ce sont de petits fichiers que les sites que vous visitez peuvent enregistrer dans la mémoire de votre navigateur pour se souvenir de vous.

C'est ce qui vous permet de ne pas avoir à retaper votre mot de passe à chaque fois que vous allez sur eBay, Gmail ou Facebook pour ne citer que ceux-là.

Pour ce faire, les cookies enregistrent un identifiant qui vous est unique. Seulement, tous les sites peuvent écrire un cookie, même les sites tiers dont seulement des éléments sont chargés par le site que vous visitez réellement. Et si un cookie est supposé avoir une date d'expiration, rien n'empêche de régler celle-ci à l'année 2037 par exemple.

Lorsqu'un même site tiers (un régie publicitaire mettons) est chargé par différents sites, en reconnaissant à chaque fois le cookie le site tiers peut vous suivre de site en site. Mais la méthode est limitée, et les cookies ne peuvent pas suivre les utilisateurs d'ordinateur en ordinateur et peuvent être supprimés facilement.

C'est pourquoi on a trouvé mieux.

Mieux on vous dit

Faisons maintenant si vous le voulez bien une petite expérience.

Si vous êtes sous Firefox[2] installez l'extension Ghostery et rendez-vous sur un site comme LeFigaro.fr, LeMonde,fr ou Facebook.

Ghostery vous affichera une petite bulle violette avec différents noms comme Google Analytics, ADTECH ou Xiti.
Ce sont les différents traqueurs qui référencent votre passage sur un site web.

En soit, ces traqueurs sont utiles aux sites qui les utilisent. Ils permettent de savoir combien de visiteurs le site reçoit, à quelle heure de la journée, quel jour de la semaine est le plus populaire, mais aussi le système d'exploitation (Windows, Mac OS X, Linux, BSD, etc.) ou le navigateur (Firefox, Opera, Chrome, Internet Explorer, etc.) utilisé par le visiteur, ce qui donne un début d'information sur l'expertise technique des visiteurs par exemple. Ils permettent aussi de savoir d'où viennent les visiteurs (un lien d'un autre site, une recherche Google, ou bien directement, en tapant l'adresse ou grâce à un favori/marque-page) afin de voir si les campagnes de pub ou d'e-mailing ont du succès, par exemple.

En poussant plus loin et en prêtant attention à d'autres informations fournies par le navigateur en se connectant au site, on peut même identifier de façon unique une bonne partie des visiteurs en observant des choses comme les polices typographiques installées sur l'OS, les extensions installées pour le navigateur, votre fuseau horaire, etc. et en notant le profil (bien souvent) unique qui s'en dégage.[3]

Mais comment ?

Concrètement, pour utiliser un traqueur, un site intègre un petit bout de code à sa page qui s'occupe ensuite de générer les statistiques.

Visuellement, le résultat est imperceptible. À l'origine, les traqueurs utilisaient des pixels espions[4], de minuscules images de 1 pixel par 1 pixel (la plus petite taille possible en fait), transparentes ou bien de la couleur du fond du site. De nos jours les méthodes se sont perfectionnées mais sont toujours aussi discrètes, si ce n'est encore plus.

Un des meilleurs outils d'analyse à disposition des sites est Google Analytics qui fournit des statistiques détaillées de très bonne qualité et qui a l'intérêt, très convaincant pour de nombreux sites, d'être en plus entièrement gratuit.

Sans surprise, Google Analytics est du coup très répandu sur le web. Quand je dis très, je veux dire trèèès répandu. Si vous gardez Ghostery activé, vous vous en rendrez rapidement compte par vous-même. GA est quasiment partout.

À chaque visite sur un site où Google Analytics est activé, celle-ci est notée et partagée avec Google qui s'occupe ensuite de générer les statistiques pour le site en question. La conséquence est que chaque visite, chaque clique sur un site utilisant Google Analytics est enregistrée par Google et, pour peu que vous soyez connecté à votre compte Google, ou même que vous ayez visité un site Google par le passé et ayez donc un cookie, toutes ces pages visitées, tous ces cliques sont rattachés à votre profile.

T'as de belles données, tu sais ?

Vous voyez, il y a des gens qui pensent que le produit principal de Google est la recherche et qu'ils en sont les utilisateurs.
C'est faux.

Le produit principal de Google, c'est vous.[5] Et il vous vend à leurs annonceurs, qui payent des dollars et des euros sonnants et trébuchants[6] pour avoir accès à votre attention.

Ce qui vous est offert par Google est mis à votre disposition gratuitement, mais le deal est clair : en échange, vous leur donnez (une partie ?) de votre vie privée.

The Google Life

En fin de compte, entre Gmail, les recherches que vous faites, les sites que vous visitez sans taper le nom complet[7], les sites que vous visitez utilisant Google Analytics, ou les vidéos YouTube que vous regardez, une majorité de votre vie sur Internet est couverte. J'ajoute le fait que Google a racheté en 2007 une des plus grosse régie publicitaire du web, DoubleClick ou c'est bon ?
Il n'est du coup pas déraisonnable de penser que sur la durée, Google obtient un meilleur profil psychologique de vous que ne pourraient le faire pas mal d'experts qui seraient mandatés pour. Vous avez probablement déjà même raconté vos pires/meilleurs fantasmes à Google (ne vous inquiétez pas, s'il n'y avait que ça… ça a juste le mérite d'être très facilement gênant).

Mieux, votre compte Google peut désormais vous suivre hors de votre ordinateur et sur votre téléphone lorsque vous l'activez sur votre téléphone Android ou dans des applis sur iPhone, chose qu'un vieux cookie n'aurait jamais pu faire.
Du coup, votre carnet d'adresse, votre emploi du temps permettent aussi potentiellement d'affiner votre profil avec des informations toujours plus précises. (D'ailleurs, si vous pensez que vos différents comptes Google ne sont pas liés, ne vous leurrez pas, grâce à quelques analyses bien senties on sait tout de suite quels sont tous les comptes sans rapport rattachés à une même personne.)

N'oublions pas que le but de Google est de maximiser ses revenus publicitaires, et pour ce faire de maximiser l'accès de la population à Internet — y compris via les téléphones portables.

Bon, je sais qu'un des thèmes de ce blog est la paranoïa, mais j'aimerais tout de suite mettre quelque chose au clair.

Je ne pense pas que Google soit maléfique.
Je ne pense pas non plus que Google ne soit qu'un chevalier blanc du progrès universel, même s'il soutient des dizaines de projets de logiciel libre qui me tiennent à cœur et met en œuvre un nombre impressionnant de projets humanitaires.

Je pense que Google est une entité complexe où se mélangent des personnes intéressées par la valeur économique incroyable que représente les profils précis de (peu ou prou) tout le monde, et des personnes cherchant à lancer des projets novateurs et potentiellement fabuleux.

Je veux bien penser que l'accès à toutes nos données se fait de façon anonymisée au sein de Google en général, même si des exceptions dérangeantes existent.
(Je fais référence par exemple à cet employé qui a accédé à des historiques de conversations, d'appels téléphoniques via Google Voice — qui sont archivés en texte après reconnaissance vocale, évidemment[8] — et à des carnets d'adresse pour espionner quatre adolescents/es qu'il connaissait.)

Mais je pense aussi — ce qui devrait être évident arrivé à ce point — que confier toutes nos informations à une seule entité est dangereux, quelles que soient ses intentions ou activités à l'heure actuelle.[9]

D'ailleurs, je ne suis pas le seul à penser ça.[10]

Facebook se dit la même chose.
Mais pas pour la même raison par contre, plutôt pour rejoindre Google au banquet des données personnelles.

The Social Network

En fait, Facebook aimerait bien connaître les sites que vous visitez en plus de votre avis sur tout et qui vous fréquentez. Du coup, Facebook propose depuis un moment maintenant son propre traqueur, Facebook Connect[11], qui est installé sur de nombreux sites partenaires du réseau social gargantuesque, et par tous ceux qui veulent faire dans le Web Social 2.0 avec des vrais morceaux d'interaction avec les utilisateurs dedans. À savoir pas mal de monde.

Mais il y a même mieux. Dans ce contexte, Facebook propose maintenant un bouton « Like » à ajouter sur tous les sites. Et d'ailleurs, pourquoi cacher les traqueurs avec des pixels espions ? On est en 2010, pas 1984, transformons ça en un jeu, les gens cliqueront d'eux-mêmes sur le bouton et se traqueront tous seuls. Parfait. Et les pubs qui apparaîtront sur leur profil Facebook n'en seront que plus adaptées. Génial.

Si j'ai assez longuement parlé de Google, il est évident que Facebook (et potentiellement Microsoft, voire Apple dans son jardin privé) est aussi un danger majeur sur ce qui touche à ces questions de vie privée.
Ici encore, des données précises, de valeur, et parfois exhaustives (messages, description personnelle, goûts, photos, opinions) sont entrées par les utilisateurs dans une vaste base de données, avec comme seule et unique promesse de ne pas faire de bêtises des conditions d'utilisation générales changeantes (et que personne ne lit).
Et avec en face une valeur commerciale monstrueuse.
Ce qui a été dit pour Google s'applique donc à Facebook, dans la mesure où Facebook se dirige droit dans la même direction. (À moins que ce ne soit l'inverse ?)

Je ne suis pas naïf, je sais que faire marcher un service aussi important que Facebook demande de l'argent, plein même.
Ça ne me choque pas qu'on fasse de l'argent, plein même.
Non, ce qui me dérange c'est quand le contrat passé avec les utilisateurs n'est compris que d'une seule des deux parties. Que le grand public ne sache pas clairement qu'on lui offre un service en échange d'un profilage aussi précis que possible de sa vie privée et de sa personnalité.

Big data is big money.

Comme Inception, mais avec de la paranoïa

Il faut en fait distinguer plusieurs niveau de risque.
Plusieurs niveau de paranoïa diraient certains.

Il y a ce qui arrive, ce qui pourrait arriver assez facilement, et ce qui est improbable mais pas impossible.

Dans ce qui arrive déjà, il y a le fait de perdre son travail ou un procès à cause d'informations issues de sa vie numérique.

Dans ce qui arrive peut-être déjà, il y a le fait d'être un faux positif dans une recherche de criminels basée sur les profils. Si ça vous intrigue (et parce que si je développe tout on aura fini cet article en 2015) je vous propose de lire cette BD sur le sujet, plutôt pas mal foutue, éditée par la Ligue des Droits de l'Homme.

Dans la gamme de ce qui pourrait arriver, il n'est pas déraisonnable de penser que si une entreprise en possession de grosses données comme Facebook ou Google se retrouve dans une merde noire financièrement — ou si ça vous paraît impossible avec ces géants là, MySpace ou Friendset —, qu'elle en soit prête à vendre ses trésors de données privées de façon nettement moins éthique qu'elle ne promet de le faire à l'heure actuelle. (Je dis « moins éthique » car on sait déjà par exemple que Facebook vend les conversations de ses membres en temps réel par exemple, ce qui ne rentre pas forcément dans la catégorie des choses auxquelles les gens s'attendent particulièrement en se connectant pour jouer à Farmville.)

Enfin, si on veut être vraiment parano (ou juste envisager toutes les possibilités), on peut imaginer que pour des raisons géo-politiques un site comme Facebook soit nationalisé par le Congrès Américain.
Si ce scénario vous semble stupide, sachez qu'il ne paraît pas si stupide que ça aux services de renseignements de différents pays (comme notre DCRI qui adorerait avoir une base de données comme celle de Facebook).
À ce moment-là, tout est possible, et ça sent pas bon. (Mais c'est pas demain la veille a priori, hein ?)

Mais les gentils, ils gagnent à la fin non ?

Ça serait bien.
Déjà, la première étape c'est d'y réfléchir un peu, de prendre le temps de penser ce que cette traque implique, ce qu'elle indique comme choix de société.
L'analyse totale des internautes ne peut se faire que s'ils refusent d'y prêter la moindre attention.

Le simple fait d'avoir déjà lu ceci vous rend donc déjà plus à même de vous en défendre. Félicitations. ;)[12]

 Traqueurs → Ghostery

Plus concrètement, si ce profilage en continue vous dérange (ouais, j'espère que c'est un peu le cas là honnêtement) vous pouvez commencer par bloquer les traqueurs en demandant à Ghostery de les bloquer. Ghostery

Un simple clique sur l'icône de Ghostery dans la barre du bas de votre Firefox, et Blocking > On.
Vous pouvez également bloquer les traqueurs au cas par cas sur les sites que vous visitez si vous préférez.

D'autres solutions sont également possibles et combinables.

Je cherche autre chose…

Pour éviter que toutes vos recherches puissent être liées à votre personne, vous pouvez abandonnez Google au profit d'un moteur de recherche plus « respectueux de la vie privée ».
C'est du moins ce que clament être Ixquick ou Yauba.
Ixquick par exemple n'enregistre pas les adresses IP de ses visiteurs. Vous pouvez aussi utiliser Bing par exemple. Honnêtement, je ne connais pas les pratiques de Bing en terme de respect de la vie privée, mais s'extraire de Google pour se jeter dans les bras de Microsoft ne me paraît pas comme ça, à brûle pour point, une idée géniale.

Après, sans vouloir leur casser du sucre sur le dos, d'autant plus que j'apprécie — sans surprise — leur démarche, j'ai trouvé à l'expérience que les résultats de Yauba (surtout) et Ixquick (moins) n'étaient (souvent) pas aussi bon que ceux de Google. (mise à jour : je me suis rendu compte qu'Ixquick est un méta-moteur, il renvoit donc les résultats de Google et Bing entre autres. Donc pas vraiment de soucis de résultats en fait.) Peut-être aurez vous une meilleure expérience que moi.
En tout cas, dur de battre le champion de la recherche mondiale à son jeu favori. Peut-être que le petit nouveau Blekko y arrivera ?

Si vous préférez obtenir les résultats de Google de façon anonymisée, c'est exactement ce que propose Scroogle (dont j'avais déjà parlé dans ma liste d'extension Firefox l'année dernière). Le site est tenu par des paranos (des vrais), crache son venin sur Google tout en utilisant leur résultats, mais propose un service assez pratique. Évidemment, les résultats étant proposés dans leur plus simple expression, il faut renoncer aux options avancées comme les images, filtrer les résultats par âge, etc.
En revanche les recherche avancées (en utilisant les guillemets "pour une phrase exacte", sur un en particulier type site:thisisabore.net, etc.) utilisant une syntaxe précise fonctionnent.

Vous pouvez ajouter ces moteurs de recherche directement à Firefox : Scroogle, Ixquick, Yauba et Blekko ici pour une version non officielle ou directement sur le site de Blekko en déroulant le menu du champ de recherche (en haut à droite de Firefox) et en choisissant tout en bas « ajouter ».
Vous trouverez aussi un paquet d'autres recherches intéressantes, dont les résultats français de Google anonymisés par Scroogle, en vous rendant sur le projet Mycroft.

 TrackMeNot, la botte de foin

Autre chose, et peut-être plus intéressant que de juste cesser d'utiliser un moteur de recherche (après tout, votre profile passé existe encore), on peut au contraire opter pour la méthode de l'aiguille dans une botte de foin.

C'est ce que propose l'extension TrackMeNot. En envoyant continuellement des requêtes sans intérêt et particulièrement moyenne (souvent, les termes de recherche les plus populaires à un moment dans le temps), TMN propose de lisser votre profil de recherche en noyant vos recherches réelles au milieu de recherches pipeau, genre « West Coast shipping town », « Hole concert that doubles », « federal agency that does » ou « enter promo code BRFREE ». Bref, un paquet de trucs sans intérêt.

Bruce Schneier voit plusieurs problèmes avec cette approche, et à juste titre, mais son article a plusieurs années donc certains problèmes ont été je l'espère résolus. Si l'idée vous plaît, vous pouvez utiliser TrackMeNot en installant cette extension.

Keep your hand out the damn (super/ever)cookie jar

Par ailleurs, si les cookies ne sont plus forcément la menace numéro 1, ils ont maintenant des grands frères, les bien nommés super cookies[13] (ce n'est pas moi qui trouve les noms, ne me regardez pas comme ça).
Très chiants à supprimer, ils sont créés par Flash (le machin qui fait des vidéos dans YouTube ou des animations parfois très jolies mais souvent lourdes et chiantes sur les sites, de préférence en introduction). Flash, évidemment, ne place pas ses cookies perso au même endroit que les cookies normaux du navigateur.

Pour les avoir ces saletés, l'extension qu'il vous faut c'est BetterPrivacy qui se fera une joie de les annihiler à chaque démarrage, fermeture, ou pour les plus enthousiastes d'entre vous aux démarrage et fermeture de votre Firefox.

Pour les cookies de base, les classiques, vous avez plusieurs choix.
Les réglages des cookies se trouvent dans Préférences > Vie Privée pour Firefox, et quelque chose de similaire pour les autres.

Vous pouvez indiquer à Firefox de refuser les cookies tout court, et là bon courage pour aller sur les sites créés après 1996, énormément de sites insistant sur l'utilisation de cookies.

Vous pouvez demander à Firefox de refuser les cookies des sites tiers : sans grande conséquence sur la navigation au jour le jour, à vrai dire je viens de me rendre compte que j'avais activé cette option il y a probablement des mois, ça ne m'a jamais posé problème

Vous pouvez dire à Firefox de supprimer les cookies à chaque fermeture du navigateur. Radical, mais vous devez vous reconnecter manuellement à tous vos sites demandant un identifiant à chaque redémarrage du navigateur. Ou, version plus intelligente, vous pouvez utiliser CookieCuller qui supprimera les cookies à la fermeture de Firefox, sauf ceux que vous lui indiquez de garder. Malin.

Enfin (oui, on touche au but), il existe une extension intéressante que j'ai découverte récemment, TACO (Targeted Advertising Opt-out Cookie). Je n'ai pas encore eu l'occasion de réellement tester, mais l'idée est de remplacer le cookies de nombreuses régies publicitaires nous traquant par un cookie spécial indiquant clairement qu'on souhaite ne pas être suivi par ces régies. L'idée me plaît, à voir à l'usage.

Félicitations à celles et ceux qui ont survécu jusqu'ici, même en plusieurs fois. :)

La prochaine fois on aborde la transparence de nos activités sur Internet et l'importance des trucs bizarres comme HTTPS. Mais si, vous savez, le petit verrou sur le site de votre banque.

Là aussi, vous verrez que les coulisses du spectacle sont parfois un peu inquiétantes.

PS : À la fin, Sandra Bullock, elle gagne.

Notes

[1] Traqué/es sur le web est peut-être plus correct, et encore.

[2] Vous l'êtes hein ? Opera et Chrome sont des réponses acceptables, mais pitié ne me dites pas que vous êtes sur Internet Explorer, le « e bleu ». Si c'est le cas cliquez sur le lien Firefox pour le télécharger, j'ai tout le temps du monde et je serai ravi de vous attendre.

[3] Voir sur ce point particulier le projet Panopticlick de l'EFF dont le but est justement d'intéresser le grand public sur le fait que nous laissons une empreinte quasi unique, une signature même, sur les sites que nous visitons, ce qui permet de nous profiler précisément.

[4] Ou en anglais le joliment descriptif « web bug », ou mouchard web.

[5] Voir sur ce point l'excellent article Stating the Obvious de Jacques Vallees publié sur BoingBoing. Hmm, faudrait que je le traduise en français en fait.

[6] Ou plus probablement silencieux et électroniques, on est en 2010.

[7] Si vous ne tapez que facebook au lieu de facebook.com, la majorité des navigateurs effectue une recherche expresse sur Google et vous emmène sur le premier résultat trouvé. C'est le cas de Firefox et de Chrome. Opera propose de choisir des extensions (.net, .com, .org, .fr etc.) à tester avant de faire une recherche automatique.

[8] C'est la même technologie qui permet aussi au répondeur d'envoyer des mails avec le contenu des messages vocaux pour pouvoir les lire sans les écouter. Décidément les technologies sont horriblement neutres, c'est énervant.

[9] C'est le procès de Kafka : une fois les données disponibles, on trouvera forcément quelque chose à vous reprocher si on le veut vraiment.

[10] L'excellent Tristan Nitot dit en substance la même chose dans son billet « J'aime Google ! (mais…) » sur son blog.

[11] Son projet précédent, Facebook Beacon, plus profond, mais plus vicieux, s'étant soldé par un scandale et des excuses de la par de M. Zuckerberg, il a été abandoné.

[12] Ouais, je me fais un peu mousser là.

[13] Et encore, un chercheur a créé pire, les EverCookies, qui sont quasiment impossibles à supprimer. Mais bon, lui il a fait ça dans un but d'attirer l'attention sur ce problème grandissant. « Ah bon bah ça va alors. »