Pourquoi depuis 2020 Google Analytics ne devrait plus être utilisé ?

Le 10 février 2022, la CNIL a mis en demeure un site qui utilisait Google Analytics de se conformer au RGPD.

En effet, la CNIL considère que comme Google Analytics stocke ses données aux États-Unis, elle estime « que ces transferts sont illégaux et impose à un gestionnaire du site web français de se conformer au RGPD et, si nécessaire, de ne plus utiliser cet outil dans les conditions actuelles. »

Pour rappel, Google Analytics est une solution d’analyse de trafic web gratuite, qui s’est très largement développée depuis des années, mais comme toutes les solutions gratuites qui sont développées et maintenues depuis des années par une société privée, il n’était pas interdit de se demander si c’était dans son intérêt de continuer à l’utiliser.

Comme dit l’adage, « quand c’est gratuit c’est vous le produit ! »

Et en effet, il est évident que Google utilisait le trafic de votre site pour améliorer ses analyses et statistiques afin de mieux cibler ses publicités et son moteur de recherche qui est encore ce qui fait 80% de son CA.

Ceci dit, la CNIL a définitivement mis un coup d’arrêt ce mercredi 10 février 2022 à l’utilisation de Google Analytics en France mettant en demeure la semaine dernière ce gestionnaire de site web.

Mais en fait la CNIL avait déjà signé la mort de Google Analytics en 2020…

En effet, en octobre 2020, la CNIL (https://www.cnil.fr/en/node/120386) avait demandé aux gestionnaires de site web de « Permettre à l’utilisateur de consentir par un acte positif clair : le silence des personnes, qui peut passer par la simple poursuite de leur navigation, doit désormais s’interpréter comme un refus ».

De ce fait, Google Analytics ne devait être utilisé que pour les internautes qui acceptaient les cookies. Par conséquent Google Analytics n’analyse maintenant que le trafic des internautes qui acceptent les cookies. La bonne question à se poser est donc « Quelle est la part de mes internautes qui acceptent les cookies ? »

Ca tombe bien, chez Netanswer on héberge des sites ! Donc sans pouvoir forcément extrapoler à d’autres populations, on peut déjà savoir si, en effet, ce taux d’acceptation de cookies décrédibilise Google Analytics ou pas.

Et pour comparer, on utilise notre solution de tracking interne.

On héberge les sites de près de 200 clients, et en 2021 on a délivré près de 17,5 Millions de pages tous sites confondus. En posant nos cookies (qui sont safes pour le coup) nous avons près de 5 Millions de visites par an (hors bots, crawlers etc…). C’est donc une bonne base d’analyse.

On s’est penché sur les chiffres site par site, et on a comparé le trafic analysé par nos outils avec celui analysé par Google Analytics.

Si on fait cette comparaison en 2020 où on ne limitait pas les cookies de GA, le différentiel est entre 0,8 et 1,1 avec une moyenne à 0,92 (hors chiffres aberrants) entre nos chiffres de visites ou de visiteurs et ceux de GA.

Ce chiffre varie suivant les sites, car nous n’avons pas les mêmes règle de suppression des bots et d’analyse des crawlers. Par définition GA est une boite noire. Mais à 8% près les chiffres sont les mêmes.

Mais si on regarde les chiffres de 2021, ça n’a rien à voir !

On observe un différentiel entre nos chiffres et ceux de GA entre 0,2 et 0,45. Ce qui signifie que quand nous voyons 10 visites, Google Analytics en voit entre 2 et 4,5 suivant les sites !

On en déduit que le taux d’acceptation des cookies varie entre 20 et 45%, avec une moyenne à 35% tous sites confondus après avoir enlevé les valeurs aberrantes.

Donc même si on se dit qu’on a un écart en 2020 de 8%, cela signifie que GA voyait en 2021 au mieux 38% des visiteurs. Et évidemment il est probable que ces 40% sont biaisés par rapport aux internautes qui vont sur votre site (personnes sensibilisées au RGPD, au travail vs à domicile, sur smartphone ou sur ordinateur, digital native ou pas etc…).

La population des sites que nous hébergeons (anciens élèves de grandes écoles, associations professionnelles, fédérations, syndicats, sites B2B…) est structurellement différente de la population générale, mais néanmoins on peut sans risque en tirer les enseignements suivants :

  • Google Analytics sous-estime très largement le trafic de votre site, il ne peut donc plus être utilisé comme un indicateur de trafic quantitatif (visites, visiteurs, taux de rebonds, temps passé par page…)
  • Le biais probable de cet échantillon qui accepte les cookies invalide aussi les analyses qualitatives de GA (répartition H/F, âge, pays, région…)

Il serait étonnant que la CNIL revienne sur sa décision, ou que Google change son outil et se conforme au RGPD. En effet le fait de stocker les analyses de sites européen sur un serveur européen et le séparer des analyses de ses autres clients, l’empêcherait de croiser ses analyses entre sites. Le user centrics à ses limites au temps du RGPD !

Il est donc nécessaire de se tourner vers d’autres solutions d’analytics, et tant qu’a faire de prendre une solution certifiée par la CNIL. Il en existe 15 à date certifiées par la CNIL : https://www.cnil.fr/fr/cookies-solutions-pour-les-outils-de-mesure-daudience

Nous sommes en train de faire notre analyse chez Netanswer, et allons d’ici un mois recommander une ou deux solutions à nos clients et nous interfacer avec.

UNE QUESTION ?