Je n'utilise pas Gmail, mais Google a quand même la plupart de mes emails (original) (raw)

Depuis quinze ans, je fais tourner mon propre serveur d'email, que j'utilise pour toutes mes correspondances en dehors du travail. Je le fais pour rester autonome, garder le contrôle et maintenir le caractère privé de mes emails afin qu'aucune grosse compagnie n'ait des copies de mes emails personnels.

Il y a quelques années, j'ai été surpris de découvrir que mon ami Peter Eckersley, une personne très soucieuse de sa vie privée qui est directeur de projets technologiques à l'Electronic Frontier Foundation, utilisait Gmail. Je lui ai demandé pourquoi il était d'accord pour donner des copies de tous ses mails à Google.

Peter a répondu que si tous vos amis utilisent Gmail, Google a vos emails de toute façon. A chaque fois que j'envoie un email à quelqu'un qui utilise Gmail, et à chaque fois qu'il m'en envoie un, Google a cet email.

Depuis notre conversation, je me suis souvent demandé combien de mes emails Google a-t-il vraiment. Ce week-end, j'ai écrit un petit logiciel pour parcourir tous les emails que j'ai gardés dans ma boîte mail personnelle depuis avril 2004 (quand Gmail s'est lancé) pour le découvrir.

Une des difficultés pour répondre à cette question est que beaucoup de gens, comme Peter, utilisent Gmail pour lire, composer et envoyer des emails, mais ils configurent Gmail pour envoyer des emails depuis une adresse non-gmail.com. Pour attraper ceux-là, mon logiciel regarde pour chaque message l'en-tête qui enregistre quel ordinateur s'est occupé du message sur le chemin qui l'a mené à mon serveur, et sélectionne les messages qui ont voyagé en passant par google.com, gmail.com ou googlemail.com.

Même si je les filtre habituellement, ma boîte mail personnelle contient de nombreux emails envoyés à travers différentes listes de distribution. Comme ces listes de distribution «cachent» souvent la vraie provenance d'un message, j'exclus tous les messages identifiés comme provenant de listes qui utilisent l'en-tête «Precedence», habituellement invisible.

Le graphique ci-dessous montre le nombre d'emails de ma boîte de réception personnelle pour chaque semaine en rouge, et le sous-ensemble Google en bleu. Comme le nombre d'emails que je reçois tend à varier considérablement d'une semaine à l'autre, j'ai inclu un lissage LOESS qui montre une moyenne glissante sur plusieurs semaines.

En regardant le graphique, la réponse semble être qu'environ un tiers des emails dans ma boîte de réception viennent de Google (même si cela varie)!

Gardez à l'esprit que cela concerne tous mes emails personnels et donc les emails automatiques et générés par ordinateur des banques, des sites de commerce, etc. Comme Google n'a pas ces messages, cela suggère que la proportion de mes emails vraiment «personnels» qui arrivent via Google est encore plus importante.

J'aimerais aussi savoir combien des emails que j'envoie arrivent chez Google. Je peux le faire en regardant les emails de ma boîte de réception auxquels j'ai répondu. Cela marche si je suis prêt à supposer que quand je réponds à un email envoyé depuis Google, il va se retrouver à nouveau chez Google.

D'une certaine manière, cela règle le problème des emails de commerce et de banques, car il y a très peu de chances pour que je réponde à ces emails. Dans un sens, cela permet de mesurer les emails qui sont vraiment personnels.

J'ai séparé les proportions d'emails que j'ai reçus depuis Google dans le graphique ci-dessous, avec en haut tous les emails et en bas seulement les emails auxquels j'ai répondu. Sur le graphique, la taille des points représente le nombre total d'emails pris en compte pour donner cette proportion. Une fois de plus, j'ai inclu une moyenne glissante LOESS.

La réponse est étonnamment élevée. Malgré le fait que je dépense des centaines de dollars par an et des heures de travail pour héberger mon propre serveur email, Google a environ la moitié de mes emails personnels!

L'année dernière, Google a livré 57% des emails de ma boîte de réception auxquels j'ai répondu. Il a livré plus d'un tiers de tous les mails auxquels j'ai répondu depuis 2006, et plus de la moitié depuis 2010.

Du côté des bonnes nouvelles, on dirait que la proportion baisse. Cette année, seuls 51% des emails auxquels j'ai répondu venaient de Google.

Les chiffres sont plus élevés que ce à quoi je m'attendais et nous apprennent une nouvelle déprimante. Ils montrent la difficulté de penser à la vie privée et à l'autonomie pour les communications entre des individus.

Dans la foulée des révélations de Snowden et de tout le reste, je ne sais pas vraiment quoi faire, à part encourager les autres à réfléchir à la question: voulez-vous vraiment que Google ait tous vos mails? Et la moitié des miens.

Si vous voulez faire l'analyse vous-même, vous êtes le bienvenu sur le code Python et R que j'ai utilisé pour produire les chiffres et les graphiques.

Benjamin Mako Hill

Traduit par Grégoire Fleurot

Ce billet a d'abord été publié sur le blog de Benjamin Mako Hill, Copyrighteous, avant d'être repris par Slate.com et traduit ici.