Tech

Not provided : internaute, Google ne nous dit plus pourquoi tu es venu

ActualitéClassé sous :Internet , informatique , Google

Avec la politique de sécurisation de Google, qui se déploie depuis 2011, les sites Web ne peuvent quasiment plus connaître les mots clés qui ont amené l'internaute chez eux. Le cabinet d'étude AT Internet a mesuré cet effet : la part de ces requêtes indéterminées atteint environ 80 %. Bientôt 100 % ?

En une année, la part des requêtes pour lesquelles les mots clés ne sont pas transmis par Google a grimpé jusqu'à environ neuf sur dix pour l’Allemagne, les États-Unis et la France, les trois pays concernés par une étude. © AT Internet

Pour savoir ce qui attire les visiteurs, un site Web récupérait jusque-là les mots clés tapés dans les requêtes sur les moteurs de recherche. Ainsi, Futura-Sciences pouvait savoir que tel article sur les étoiles en fin de vie avait majoritairement été lu par des internautes ayant tapé « trou noir » dans leur requête. C'est — entre autres — en analysant ce genre de statistiques (anonymes bien sûr) que les sites Web peuvent adapter leur contenu. Mais depuis fin 2011, Google, principal vecteur des recherches sur Internet, a mis en place un protocole de connexion sécurisé, HTTPS, pour les utilisateurs nommément connectés à un compte. Ces cinq lettres apparaissent dans la barre d'adresse, à gauche, indiquant que les échanges sont cryptés par le système TLS (Transport Layer Security, anciennement SSLSecure Sockets Layer). C'est ce genre de sécurisation qui est utilisé également sur les sites de paiement. Lorsqu'une recherche est ainsi cryptée, le site Web destinataire reçoit comme information « not provided » sur les mots clés de la requête. Pour l'utilisateur, cette discrétion ne change rien, si ce n'est que ses recherches restent cachées (sauf à Google).

Après cette mise en place, entre 2012 et 2013, le passage systématique par ce site sécurisé a été inclus dans plusieurs versions des navigateurs Chrome, Firefox et Safari pour les utilisateurs connectés avec un compte Google. Finalement, depuis septembre 2013, ce passage par HTTPS concerne tous les utilisateurs, avec ou sans compte.

La part des « requêtes indéterminées » dépend également du navigateur. Mais, Safari mis à part, elle est, en France, d'environ 90 % en janvier 2014. © AT Internet

Confidentialité pour les recherches sans but lucratif

Quel impact pour les sites et les spécialistes de l'optimisation pour les moteurs de recherche, ou SEO (Search Engine Optimization) ? Cette évolution, le cabinet d'étude AT Internet l'a précisément mesurée, et le rapporte dans une publication intitulée Bientôt un 100 % « not provided ». Selon cette analyse réalisée du 1er janvier 2013 au 31 janvier 2014 sur plus de 11.000 sites (10.597 pour la France, 635 pour les États-Unis et 410 pour l'Allemagne), la proportion des requêtes Google indéterminées avoisine les 80 %.

En France, cette part était de 81,2 % en janvier 2014... contre 30,5 % en janvier 2013. L'évolution est semblable, mais moins rapide, pour les sites de l'étude basés aux États-Unis, avec 77,2 % contre 42,2 %, et en Allemagne avec 70,9 % par rapport à 30,3 % un an plus tôt. Ces proportions varient un peu selon le navigateur utilisé, comme en témoignent les chiffres pour les sites français. Pour Chrome, la part de requêtes indéterminées atteint 92,3 %. Pour Firefox, elle est de 91,5 % et de 89,7 % depuis Internet Explorer. En revanche, les requêtes venues du Safari d'Apple sont inconnues dans 72,9 % des cas.

La politique de confidentialité de Google, cependant, s'arrête devant les sites commerciaux. Pour les annonces sponsorisées (dont les réponses apparaissent en haut de la page des résultats), les mots clés de la requête sont en effet transmis en clair. En dehors de ces balades marchandes, Google ne souhaite manifestement plus partager gratuitement les informations sur les requêtes des internautes.

Cela vous intéressera aussi