Traque sur Internet
Par thisisabore le mercredi 10 novembre 2010, 01:18 - Privacy - or - Leave me alone - Lien permanent
Souvent après des discussions à rallonge avec des ami/es et des ami/es d'ami/es dans des bars ou au restaurant, on me dit ceci : « Mais c'est fou ce que tu nous racontes là, pourquoi on nous informe pas de tout ça ? ».[1]
« Tout ça », c'est l'état de traque permanente de tout un chacun sur Internet.
C'est le recoupement massif d'informations, le suivi de site en site, le
risque de voir des données personnelles se retourner contre nous.
C'est la transparence de nos échanges, la facilité d'accès à nos
communications, le divergence grave entre nos notions de vie privée qui étaient
valables jusqu'à 10 ans de cela et la réalité de la facilité d'accès à nos vie
sur le Net.
C'est le risque du DPI, le Deep Packet Inspection ou Inspection
Profonde des Paquets, le Graal de la surveillance sur Internet à écouter
certains de ses partisans.
À chaque fois, je me dis qu'il faudrait que j'en parle sur ce blog, pour que plus de monde puisse y penser, considérer le(s) problème(s), absorber ça à son rythme.
C'est ce que je vais essayer de faire ici, ou tout du moins de commencer.
Le sujet est technique et pas glamour, mais il est important je pense et mérite un peu d'intérêt de la part des gens qui n'y connaissent justement rien.
Je vais essayer d'être synthétique, mais si jamais vous avez un peu lu ce
blog, vous devez déjà savoir que ce n'est pas exactement un de mes points forts
et que c'est probablement une promesse un peu vide. 
Et pour plus de lisibilité, je vais aborder chaque partie dans un billet
différent.
C'est pas beau ça ?
Notes
[1] Et mes amis qui m'ont déjà entendu déblatérer plusieurs fois sur les mêmes sujets de me moquer gentiment en prévenant mes interlocuteurs/trices que la moindre question va relancer la discussion de 15 min. Au moins.
Traque sur Internet ?
Ok, enfant j'étais absolument fan de l'idée de départ du film Traque sur Internet où Sandra Bullock, pénétrant les coulisses d'un site qu'elle n'aurait pas du pénétrer se retrouve poursuivie par les Méchants™. Par la suite, toute son identité se désagrège, les méchants voulant la rendre impuissante en supprimant ses comptes bancaires, son identité, etc.
Sans que le film ne soit entièrement prémonitoire, l'idée que notre vie dépend des données qui nous représentent était très juste et se retrouve de plus en plus vérifiée de nos jours.
Mais ici, si je parle de traque sur Internet, c'est pour une raison plus
simple, et finalement plus proche du sens exact du titre de notre semi-nanard
de 1995.
Nous sommes, sans exagérer, traqué/es sur Internet à chaque
instant.[1]
Image © Columbia Pictures. Appréciez au passage le Mac old school.
Can't keep my hand out of the cookie jar
Peut-être avez-vous déjà entendu parlé des cookies. Ce sont de petits fichiers que les sites que vous visitez peuvent enregistrer dans la mémoire de votre navigateur pour se souvenir de vous.
C'est ce qui vous permet de ne pas avoir à retaper votre mot de passe à chaque fois que vous allez sur eBay, Gmail ou Facebook pour ne citer que ceux-là.
Pour ce faire, les cookies enregistrent un identifiant qui vous est unique. Seulement, tous les sites peuvent écrire un cookie, même les sites tiers dont seulement des éléments sont chargés par le site que vous visitez réellement. Et si un cookie est supposé avoir une date d'expiration, rien n'empêche de régler celle-ci à l'année 2037 par exemple.
Lorsqu'un même site tiers (un régie publicitaire mettons) est chargé par différents sites, en reconnaissant à chaque fois le cookie le site tiers peut vous suivre de site en site. Mais la méthode est limitée, et les cookies ne peuvent pas suivre les utilisateurs d'ordinateur en ordinateur et peuvent être supprimés facilement.
C'est pourquoi on a trouvé mieux.
Mieux on vous dit
Faisons maintenant si vous le voulez bien une petite expérience.
Si vous êtes sous Firefox[2] installez l'extension Ghostery et rendez-vous sur un site comme LeFigaro.fr, LeMonde,fr ou Facebook.
Ghostery vous affichera une petite bulle violette avec différents noms comme
Google Analytics, ADTECH ou Xiti.
Ce sont les différents traqueurs qui référencent votre passage sur un site
web.
En soit, ces traqueurs sont utiles aux sites qui les utilisent. Ils permettent de savoir combien de visiteurs le site reçoit, à quelle heure de la journée, quel jour de la semaine est le plus populaire, mais aussi le système d'exploitation (Windows, Mac OS X, Linux, BSD, etc.) ou le navigateur (Firefox, Opera, Chrome, Internet Explorer, etc.) utilisé par le visiteur, ce qui donne un début d'information sur l'expertise technique des visiteurs par exemple. Ils permettent aussi de savoir d'où viennent les visiteurs (un lien d'un autre site, une recherche Google, ou bien directement, en tapant l'adresse ou grâce à un favori/marque-page) afin de voir si les campagnes de pub ou d'e-mailing ont du succès, par exemple.
En poussant plus loin et en prêtant attention à d'autres informations fournies par le navigateur en se connectant au site, on peut même identifier de façon unique une bonne partie des visiteurs en observant des choses comme les polices typographiques installées sur l'OS, les extensions installées pour le navigateur, votre fuseau horaire, etc. et en notant le profil (bien souvent) unique qui s'en dégage.[3]
Mais comment ?
Concrètement, pour utiliser un traqueur, un site intègre un petit bout de code à sa page qui s'occupe ensuite de générer les statistiques.
Visuellement, le résultat est imperceptible. À l'origine, les traqueurs utilisaient des pixels espions[4], de minuscules images de 1 pixel par 1 pixel (la plus petite taille possible en fait), transparentes ou bien de la couleur du fond du site. De nos jours les méthodes se sont perfectionnées mais sont toujours aussi discrètes, si ce n'est encore plus.
Un des meilleurs outils d'analyse à disposition des sites est Google Analytics qui fournit des statistiques détaillées de très bonne qualité et qui a l'intérêt, très convaincant pour de nombreux sites, d'être en plus entièrement gratuit.
Sans surprise, Google Analytics est du coup très répandu sur le web. Quand je dis très, je veux dire trèèès répandu. Si vous gardez Ghostery activé, vous vous en rendrez rapidement compte par vous-même. GA est quasiment partout.
À chaque visite sur un site où Google Analytics est activé, celle-ci est notée et partagée avec Google qui s'occupe ensuite de générer les statistiques pour le site en question. La conséquence est que chaque visite, chaque clique sur un site utilisant Google Analytics est enregistrée par Google et, pour peu que vous soyez connecté à votre compte Google, ou même que vous ayez visité un site Google par le passé et ayez donc un cookie, toutes ces pages visitées, tous ces cliques sont rattachés à votre profile.
T'as de belles données, tu sais ?
Vous voyez, il y a des gens qui pensent que le produit principal de Google
est la recherche et qu'ils en sont les utilisateurs.
C'est faux.
Le produit principal de Google, c'est vous.[5] Et il vous vend à leurs annonceurs, qui payent des dollars et des euros sonnants et trébuchants[6] pour avoir accès à votre attention.
Ce qui vous est offert par Google est mis à votre disposition gratuitement, mais le deal est clair : en échange, vous leur donnez (une partie ?) de votre vie privée.
The Google Life
En fin de compte, entre Gmail, les recherches que vous faites, les sites que
vous visitez sans taper le nom complet[7], les sites que vous
visitez utilisant Google Analytics, ou les vidéos YouTube que vous regardez,
une majorité de votre vie sur Internet est couverte. J'ajoute le fait que
Google a racheté en 2007 une des plus grosse régie publicitaire du web,
DoubleClick ou c'est bon ?
Il n'est du coup pas déraisonnable de penser que sur la durée, Google obtient
un meilleur profil psychologique de vous que ne pourraient le faire pas mal
d'experts qui seraient mandatés pour. Vous avez probablement déjà même raconté
vos pires/meilleurs fantasmes à Google (ne vous inquiétez pas, s'il n'y avait
que ça… ça a juste le mérite d'être très facilement gênant).
Mieux, votre compte Google peut désormais vous suivre hors de votre
ordinateur et sur votre téléphone lorsque vous l'activez sur votre téléphone
Android ou dans des applis sur iPhone, chose qu'un vieux cookie n'aurait jamais
pu faire.
Du coup, votre carnet d'adresse, votre emploi du temps permettent aussi
potentiellement d'affiner votre profil avec des informations toujours plus
précises. (D'ailleurs, si vous pensez que vos différents comptes Google ne sont
pas liés, ne vous leurrez pas, grâce à quelques analyses bien senties on sait
tout de suite quels sont tous les comptes sans rapport rattachés à une même
personne.)
N'oublions pas que le but de Google est de maximiser ses revenus publicitaires, et pour ce faire de maximiser l'accès de la population à Internet — y compris via les téléphones portables.
Bon, je sais qu'un des thèmes de ce blog est la paranoïa, mais j'aimerais tout de suite mettre quelque chose au clair.
Je ne pense pas que Google soit maléfique.
Je ne pense pas non plus que Google ne soit qu'un chevalier blanc du progrès
universel, même s'il soutient des dizaines de projets de logiciel libre qui me
tiennent à cœur et met en œuvre un nombre impressionnant de projets
humanitaires.
Je pense que Google est une entité complexe où se mélangent des personnes intéressées par la valeur économique incroyable que représente les profils précis de (peu ou prou) tout le monde, et des personnes cherchant à lancer des projets novateurs et potentiellement fabuleux.
Je veux bien penser que l'accès à toutes nos données se fait de façon
anonymisée au sein de Google en général, même si des exceptions dérangeantes
existent.
(Je fais référence par exemple à cet employé qui a accédé à des historiques de conversations,
d'appels téléphoniques via Google Voice — qui sont archivés en texte après
reconnaissance vocale, évidemment[8] — et à des carnets
d'adresse pour espionner quatre adolescents/es qu'il connaissait.)
Mais je pense aussi — ce qui devrait être évident arrivé à ce point — que confier toutes nos informations à une seule entité est dangereux, quelles que soient ses intentions ou activités à l'heure actuelle.[9]
D'ailleurs, je ne suis pas le seul à penser ça.[10]
Facebook se dit la même chose.
Mais pas pour la même raison par contre, plutôt pour rejoindre Google au
banquet des données personnelles.
The Social Network
En fait, Facebook aimerait bien connaître les sites que vous visitez en plus de votre avis sur tout et qui vous fréquentez. Du coup, Facebook propose depuis un moment maintenant son propre traqueur, Facebook Connect[11], qui est installé sur de nombreux sites partenaires du réseau social gargantuesque, et par tous ceux qui veulent faire dans le Web Social 2.0 avec des vrais morceaux d'interaction avec les utilisateurs dedans. À savoir pas mal de monde.
Mais il y a même mieux. Dans ce contexte, Facebook propose maintenant un bouton « Like » à ajouter sur tous les sites. Et d'ailleurs, pourquoi cacher les traqueurs avec des pixels espions ? On est en 2010, pas 1984, transformons ça en un jeu, les gens cliqueront d'eux-mêmes sur le bouton et se traqueront tous seuls. Parfait. Et les pubs qui apparaîtront sur leur profil Facebook n'en seront que plus adaptées. Génial.
Si j'ai assez longuement parlé de Google, il est évident que Facebook (et
potentiellement Microsoft, voire Apple dans son jardin privé) est aussi un
danger majeur sur ce qui touche à ces questions de vie privée.
Ici encore, des données précises, de valeur, et parfois exhaustives (messages,
description personnelle, goûts, photos, opinions) sont entrées par les
utilisateurs dans une vaste base de données, avec comme seule et unique
promesse de ne pas faire de bêtises des conditions d'utilisation générales
changeantes (et que personne ne lit).
Et avec en face une valeur commerciale monstrueuse.
Ce qui a été dit pour Google s'applique donc à Facebook, dans la mesure où
Facebook se dirige droit dans la même direction. (À moins que ce ne soit
l'inverse ?)
Je ne suis pas naïf, je sais que faire marcher un service aussi important
que Facebook demande de l'argent, plein même.
Ça ne me choque pas qu'on fasse de l'argent, plein même.
Non, ce qui me dérange c'est quand le contrat passé avec les utilisateurs n'est
compris que d'une seule des deux parties. Que le grand public ne sache pas
clairement qu'on lui offre un service en échange d'un profilage aussi précis
que possible de sa vie privée et de sa personnalité.
Big data is big money.
Comme Inception, mais avec de la paranoïa
Il faut en fait distinguer plusieurs niveau de risque.
Plusieurs niveau de paranoïa diraient certains.
Il y a ce qui arrive, ce qui pourrait arriver assez facilement, et ce qui est improbable mais pas impossible.
Dans ce qui arrive déjà, il y a le fait de perdre son travail ou un procès à cause d'informations issues de sa vie numérique.
Dans ce qui arrive peut-être déjà, il y a le fait d'être un faux positif dans une recherche de criminels basée sur les profils. Si ça vous intrigue (et parce que si je développe tout on aura fini cet article en 2015) je vous propose de lire cette BD sur le sujet, plutôt pas mal foutue, éditée par la Ligue des Droits de l'Homme.
Dans la gamme de ce qui pourrait arriver, il n'est pas déraisonnable de penser que si une entreprise en possession de grosses données comme Facebook ou Google se retrouve dans une merde noire financièrement — ou si ça vous paraît impossible avec ces géants là, MySpace ou Friendset —, qu'elle en soit prête à vendre ses trésors de données privées de façon nettement moins éthique qu'elle ne promet de le faire à l'heure actuelle. (Je dis « moins éthique » car on sait déjà par exemple que Facebook vend les conversations de ses membres en temps réel par exemple, ce qui ne rentre pas forcément dans la catégorie des choses auxquelles les gens s'attendent particulièrement en se connectant pour jouer à Farmville.)
Enfin, si on veut être vraiment parano (ou juste envisager toutes les
possibilités), on peut imaginer que pour des raisons géo-politiques un site
comme Facebook soit nationalisé par le Congrès Américain.
Si ce scénario vous semble stupide, sachez qu'il ne paraît pas si stupide que
ça aux services de renseignements de différents pays (comme notre DCRI qui
adorerait avoir une base de données comme celle de Facebook).
À ce moment-là, tout est possible, et ça sent pas bon. (Mais c'est pas demain
la veille a priori, hein ?)
Mais les gentils, ils gagnent à la fin non ?
Ça serait bien.
Déjà, la première étape c'est d'y réfléchir un peu, de prendre le temps de
penser ce que cette traque implique, ce qu'elle indique comme choix de
société.
L'analyse totale des internautes ne peut se faire que s'ils refusent d'y prêter
la moindre attention.
Le simple fait d'avoir déjà lu ceci vous rend donc déjà plus à même de vous
en défendre. Félicitations.
[12]
Traqueurs → Ghostery
Plus concrètement, si ce profilage en continue vous dérange (ouais, j'espère
que c'est un peu le cas là honnêtement) vous pouvez commencer par bloquer les
traqueurs en demandant à Ghostery de les bloquer. 
Un simple clique sur l'icône de Ghostery dans la barre du bas de votre
Firefox, et Blocking > On.
Vous pouvez également bloquer les traqueurs au cas par cas sur les sites que
vous visitez si vous préférez.
D'autres solutions sont également possibles et combinables.
Je cherche autre chose…
Pour éviter que toutes vos recherches puissent être liées à votre personne,
vous pouvez abandonnez Google au profit d'un moteur de recherche plus
« respectueux de la vie privée ».
C'est du moins ce que clament être Ixquick ou Yauba.
Ixquick par exemple n'enregistre pas les adresses IP de ses visiteurs. Vous
pouvez aussi utiliser Bing par
exemple. Honnêtement, je ne connais pas les pratiques de Bing en terme de
respect de la vie privée, mais s'extraire de Google pour se jeter dans les bras
de Microsoft ne me paraît pas comme ça, à brûle pour point, une idée
géniale.
Après, sans vouloir leur casser du sucre sur le dos, d'autant plus que
j'apprécie — sans surprise — leur démarche, j'ai trouvé à
l'expérience que les résultats de Yauba (surtout) et Ixquick (moins) n'étaient
(souvent) pas aussi bon que ceux de Google. (mise à jour : je me
suis rendu compte qu'Ixquick est un méta-moteur, il renvoit donc les résultats
de Google et Bing entre autres. Donc pas vraiment de soucis de résultats en
fait.) Peut-être aurez vous une meilleure expérience que moi.
En tout cas, dur de battre le champion de la recherche mondiale à son jeu
favori. Peut-être que le petit nouveau Blekko y arrivera ?
Si vous préférez obtenir les résultats de Google de façon anonymisée, c'est
exactement ce que propose Scroogle (dont
j'avais déjà parlé dans ma liste d'extension Firefox l'année dernière). Le site
est tenu par des paranos (des vrais), crache son venin sur Google tout en
utilisant leur résultats, mais propose un service assez pratique. Évidemment,
les résultats étant proposés dans leur plus simple expression, il faut renoncer
aux options avancées comme les images, filtrer les résultats par âge,
etc.
En revanche les recherche avancées (en utilisant les guillemets "pour une
phrase exacte", sur un en particulier type site:thisisabore.net, etc.)
utilisant une syntaxe précise fonctionnent.
Vous pouvez ajouter ces moteurs de recherche directement à Firefox :
Scroogle,
Ixquick,
Yauba et
Blekko ici
pour une version non officielle ou directement sur le site de Blekko en
déroulant le menu du champ de recherche (en haut à droite de Firefox) et en
choisissant tout en bas « ajouter ».
Vous trouverez aussi un paquet d'autres recherches intéressantes, dont les
résultats français de Google anonymisés par Scroogle, en vous rendant sur le
projet Mycroft.
TrackMeNot, la botte de foin
Autre chose, et peut-être plus intéressant que de juste cesser d'utiliser un moteur de recherche (après tout, votre profile passé existe encore), on peut au contraire opter pour la méthode de l'aiguille dans une botte de foin.
C'est ce que propose l'extension TrackMeNot. En envoyant continuellement des requêtes sans intérêt et particulièrement moyenne (souvent, les termes de recherche les plus populaires à un moment dans le temps), TMN propose de lisser votre profil de recherche en noyant vos recherches réelles au milieu de recherches pipeau, genre « West Coast shipping town », « Hole concert that doubles », « federal agency that does » ou « enter promo code BRFREE ». Bref, un paquet de trucs sans intérêt.
Bruce Schneier voit plusieurs problèmes avec cette approche, et à juste titre, mais son article a plusieurs années donc certains problèmes ont été je l'espère résolus. Si l'idée vous plaît, vous pouvez utiliser TrackMeNot en installant cette extension.
Keep your hand out the damn (super/ever)cookie jar
Par ailleurs, si les cookies ne sont plus forcément la menace numéro 1, ils
ont maintenant des grands frères, les bien nommés super cookies[13] (ce n'est pas moi qui trouve les noms, ne
me regardez pas comme ça).
Très chiants à supprimer, ils sont créés par Flash (le machin qui fait des
vidéos dans YouTube ou des animations parfois très jolies mais souvent lourdes
et chiantes sur les sites, de préférence en introduction). Flash, évidemment,
ne place pas ses cookies perso au même endroit que les cookies normaux du
navigateur.
Pour les avoir ces saletés, l'extension qu'il vous faut c'est BetterPrivacy qui se fera une joie de les annihiler à chaque démarrage, fermeture, ou pour les plus enthousiastes d'entre vous aux démarrage et fermeture de votre Firefox.
Pour les cookies de base, les classiques, vous avez plusieurs choix.
Les réglages des cookies se trouvent dans Préférences > Vie Privée pour
Firefox, et quelque chose de similaire pour les autres.
Vous pouvez indiquer à Firefox de refuser les cookies tout court, et là bon courage pour aller sur les sites créés après 1996, énormément de sites insistant sur l'utilisation de cookies.
Vous pouvez demander à Firefox de refuser les cookies des sites tiers : sans grande conséquence sur la navigation au jour le jour, à vrai dire je viens de me rendre compte que j'avais activé cette option il y a probablement des mois, ça ne m'a jamais posé problème
Vous pouvez dire à Firefox de supprimer les cookies à chaque fermeture du navigateur. Radical, mais vous devez vous reconnecter manuellement à tous vos sites demandant un identifiant à chaque redémarrage du navigateur. Ou, version plus intelligente, vous pouvez utiliser CookieCuller qui supprimera les cookies à la fermeture de Firefox, sauf ceux que vous lui indiquez de garder. Malin.
Enfin (oui, on touche au but), il existe une extension intéressante que j'ai découverte récemment, TACO (Targeted Advertising Opt-out Cookie). Je n'ai pas encore eu l'occasion de réellement tester, mais l'idée est de remplacer le cookies de nombreuses régies publicitaires nous traquant par un cookie spécial indiquant clairement qu'on souhaite ne pas être suivi par ces régies. L'idée me plaît, à voir à l'usage.
Félicitations à celles et ceux qui ont survécu jusqu'ici, même en plusieurs
fois. 
La prochaine fois on aborde la transparence de nos activités sur Internet et l'importance des trucs bizarres comme HTTPS. Mais si, vous savez, le petit verrou sur le site de votre banque.
Là aussi, vous verrez que les coulisses du spectacle sont parfois un peu inquiétantes.
PS : À la fin, Sandra Bullock, elle gagne.
Notes
[1] Traqué/es sur le web est peut-être plus correct, et encore.
[2] Vous l'êtes hein ? Opera et Chrome sont des réponses acceptables, mais pitié ne me dites pas que vous êtes sur Internet Explorer, le « e bleu ». Si c'est le cas cliquez sur le lien Firefox pour le télécharger, j'ai tout le temps du monde et je serai ravi de vous attendre.
[3] Voir sur ce point particulier le projet Panopticlick de l'EFF dont le but est justement d'intéresser le grand public sur le fait que nous laissons une empreinte quasi unique, une signature même, sur les sites que nous visitons, ce qui permet de nous profiler précisément.
[4] Ou en anglais le joliment descriptif « web bug », ou mouchard web.
[5] Voir sur ce point l'excellent article Stating the Obvious de Jacques Vallees publié sur BoingBoing. Hmm, faudrait que je le traduise en français en fait.
[6] Ou plus probablement silencieux et électroniques, on est en 2010.
[7] Si vous ne tapez que facebook au lieu de facebook.com, la majorité des navigateurs effectue une recherche expresse sur Google et vous emmène sur le premier résultat trouvé. C'est le cas de Firefox et de Chrome. Opera propose de choisir des extensions (.net, .com, .org, .fr etc.) à tester avant de faire une recherche automatique.
[8] C'est la même technologie qui permet aussi au répondeur d'envoyer des mails avec le contenu des messages vocaux pour pouvoir les lire sans les écouter. Décidément les technologies sont horriblement neutres, c'est énervant.
[9] C'est le procès de Kafka : une fois les données disponibles, on trouvera forcément quelque chose à vous reprocher si on le veut vraiment.
[10] L'excellent Tristan Nitot dit en substance la même chose dans son billet « J'aime Google ! (mais…) » sur son blog.
[11] Son projet précédent, Facebook Beacon, plus profond, mais plus vicieux, s'étant soldé par un scandale et des excuses de la par de M. Zuckerberg, il a été abandoné.
[12] Ouais, je me fais un peu mousser là.
[13] Et encore, un chercheur a créé pire, les EverCookies, qui sont quasiment impossibles à supprimer. Mais bon, lui il a fait ça dans un but d'attirer l'attention sur ce problème grandissant. « Ah bon bah ça va alors. »


Commentaires
Bon ok, c'est long ton histoire et ça fait flipper, mais c'est clair et facile à comprendre donc MERCI pour toutes ces explications et tous ces conseils
Euh deux commentaires... y en a si peu qui ont survécu à la lecture de cet article ! Dommage, c'est intéressant et ça ouvre un peu plus les yeux, merci, je vais faire suivre.
Ben non ça va...C'est bien expliqué...même une nouille comme moi arrive a comprendre...et sans transpirer en plus...ni tirer la langue en lisant...nan...bien bien...
@pbdf : Merci :D
@O'Ror et Olivier : Merci aussi, en effet j'ai passé pas mal de temps à écrire la chose et à essayer de garder tout ça simple, et j'étais un peu surpris d'avoir si peu de réactions. Merci à vous si vous pouvez catalyser cet article par ailleurs, je pense qu'il peut en effet intéresser pas mal de monde