Comment font les sites tiers pour collecter des informations lors de notre navigation ?

Sommaire

  • RGPD, Cookies et Digital Ad
  • Du respect de la confidentialité des utilisateurs
  • Quelles solutions technologiques alternatives aux cookies tiers ?
  • Pour aller plus loin

1/ RGPD, Cookies et Digital Ad

La publicité en ligne, la collecte de données ou encore la confidentialité des utilisateurs sont au cœur de l’actualité. Cela résulte de l’instauration de la réglementation RGPD. Cela créé une situation nouvelle et conduit les professionnels du digital à adapter et transformer leurs activités. Dès 2011, dans l’article “ The  impact  of  cookie ‘ consent’ on  targeted  adverts », publié sur « Database Marketing & Customer Strategy Management », Phil Lee introduit les conséquences de la loi RGPD. En demandant le consentement des utilisateurs pour exploiter leurs données, la loi a un impact sur les régies publicitaires. Elles mettent en péril un modèle économique basé sur la technologie des cookies.

Cette technologie permet de collecter des informations sur le comportement de navigation et de reconnaitre les utilisateurs sur différents sites. Cette technologie a notamment ouvert la voie à la publicité programmatique. En exploitant les données, elle offre la possibilité aux régies publicitaires de proposer des contenus publicitaires ciblés.

En anticipation des risques juridiques face à la nouvelle législation, Phil Lee suggère un certain nombre de bonnes pratiques. Seules les informations utiles sont collectées et en toute transparence avec les utilisateurs. La politique de confidentialité indiquera clairement toute utilisation de cookies à des fins de publicité ciblée. Les cookies peuvent être facilement refusés. Enfin, les utilisateurs seront par défaut en ‘do not track’.

RGPD : de quoi s’agit il ?

En quoi consiste la RGPD ? Le Règlement Général sur la Protection des Données est mis en œuvre dans l’espace européen le 25 mai 2018. C’est une directive qui renforce le droit des individus par la création d’un droit à la portabilité des données et à la protection des mineurs. Les acteurs sont directement responsables et sont sanctionnés en cas de manquements. Les données récoltées doivent avoir comme stricte finalité la mesure d’audience du site et pour le compte exclusif de l’éditeur. Si les données sont recoupées avec d’autres traitement et transmises à des tiers, l’éditeur du site doit obligatoirement au préalable recueillir le consentement des utilisateurs.

Comment font les sites tiers pour collecter des informations lors de notre navigation ?
Commission Européenne et RGPD

Comment les données sont-elles collectées ?

La technologie est basée sur le cookie. Sa vocation ? Nous accompagner lors de notre navigation afin d’en collecter des données et les transmettre au serveur du site visité. Selon la CNIL, “un cookie est un fichier stocké par un serveur dans le browser et associé à un domaine web”. Ce fichier est automatiquement renvoyé lors de contacts ultérieurs avec le même domaine ». On comprend que l’enregistrement des cookies et leur transmission au serveur sont au coeur du fonctionnement des sites Internet. Inventé dès 1994 et implanté progressivement sur tous les navigateurs Internet, le cookie permet essentiellement 3 choses :

  • Gérer les sessions (identifiants, paniers d’achats …)
  • Personnaliser l’affichage d’un site et retenir pour la prochaine session les paramètres
  • Pister les utilisateurs pour enregistrer les habitudes de navigation des utilisateurs

Les cookies first-party

Les cookies ont tous la même mission : stocker et transmettre de l’information. Mais les données qu’ils collectent peuvent toutefois varier selon les besoins et les objectifs du propriétaire du cookie. Lorsque les cookies sont créés, émis et traités directement par le site web consulté, il s’agit de cookies first-party. Ce type de cookie collecte des données liées à la navigation exclusive sur le site en question. Il peut s’agir de données comportementales (durée de visite sur le site, actions de navigation telles que les clics, etc..). Ou encore de données statistiques (nombre de vues sur une page, nombre d’articles sur le panier d’achat, etc…). Ou enfin de personnalisation (type d’affichage, informations de connexion, produits dans un panier d’achat etc).

Les données issues des cookies first party ne sont pas visées par la règlementation. Ils deviennent stratégique pour les annonceurs dans une ère où la “user-centricity” est placée au cœur de l’attention. Dès 2017, The Economist anticipait la tendance dans un article célèbre. La ressource la plus précieuse au monde n’est plus le pétrole, mais les données.

Comment font les sites tiers pour collecter des informations lors de notre navigation ?

Les cookies tiers

En revanche, d’autres cookies sont tierces parties. Les cookies sont dits tiers ou third-party cookies lorsqu’ils sont créés et générés par acteurs d’autres sites. Ces derniers collectent des données au-delà de la navigation sur le site visité. Elles permettent d’affiner la connaissance du comportement de l’utilisateur à partir de sa navigation sur d’autres sites. Les cookies tiers renseignent davantage sur les préférences et les activités des internautes que les cookies propriétaires. Leur usage est courant dans le domaine de la publicité digitale.

Retenons que les cookies mis en place et collectés par un tiers de l’éditeur sont visés par la RGPD. Une publicité affichée sur une page par une régie publicitaire nécessite l’utilisation du cookie tiers pour afficher un contenu personnalisé. La régie publicitaire est un tiers, elle est donc ciblée par la réglementation. Le cookie en tant que technologie n’est pas problématique car il contribue à l’amélioration de l’expérience de l’utilisateur sur Internet.

2/ Du respect de la confidentialité des utilisateurs

Collecte des données utilisateurs

La collecte des données, le respect de la vie privée et les problématiques associées ne sont pas nouveaux. Dans l’article « Les chartes de respect de la vie privée face au défi de la confiance » paru dans la revue « Management & Avenir » du 2013/4 (N° 62), pages 112 à 130, Pauline de Pechpeyrou et Patrick Nicholson nous rappellent ce qu’est le respect informationnel . Il s’agit de « la revendication des individus à déterminer eux-mêmes quand, comment et dans quelle mesure des informations les concernant seront communiquées à d’autres » (Westin, 1967).

Depuis les années 1990, la sophistication des méthodes de collecte des données entraine l’évolution de la préoccupation des consommateurs. Cette situation n’est pas spécifique au digital. La profusion des données émises par le big data offre toutefois de nouvelles possibilités. Le marketing relationnel et la publicité programmatique peuvent atteindre des cibles et des performances inconcevables auparavant.

Pour quel usage Les données sont-elles collectées ?

Sur Internet, l’anonymat n’est pas de mise. Toutes les interactions sont directement véhiculées et codées sous forme de données transmises sur le réseau. Les données relatives au comportement des internautes sont une source précieuse d’informations pour les acteurs du digital. Ces données sont utiles pour les entreprises, les organisations, les sites d’information etc. Les données collectées permettent d’identifier, mesurer, et comprendre quelles sont les interactions que font les utilisateurs avec les sites web de manière contextualisée. Pour les marketeurs, ces données sont une mine d’or ! Elles permettent de segmenter leur audience et de leur proposer des contenus personnalisés. Mais elles permettent aussi aux développeurs UX de mesurer la performance des sites Internet et d’identifier des pistes d’optimisation de l’expérience en ligne.

Le consentement est devenu incontournable

Les faits et gestes des utilisateurs sont systématiquement épiés. La problématique de la confidentialité des utilisateurs se pose d’emblée. La pratique n’est pas interdite mais encadrée. La RGPD impose en contrepartie de recueillir le consentement à la collecte des informations, dorénavant obligatoire. Il n’est plus question de cibler et collecter de l’information sur les utilisateurs sans leur consentement préalable !

3/ Quelles solutions technologiques alternatives aux cookies tiers ?

Pour résoudre le problème lié aux cookies tiers, les acteurs de la publicité digitale recherchent des solutions alternatives. L’efficacité et la pertinence de ces alternatives leur permettront de poursuivre leur activité tout en respectant la législation. C’est le cas de Google, dont le chiffre d’affaires repose à 86% sur les revenus publicitaires. Google a lancé en 2021 un projet nommé Privacy Sandbox. Il s’agit de développer et de tester une solution alternative aux cookies tiers visant à protéger la vie privée des internautes tout en permettant aux annonceurs de faire de la publicité ciblée basée sur des segments d’audience (cohortes).

Comment font les sites tiers pour collecter des informations lors de notre navigation ?
Privacy Sandbox

La Privacy Sandbox basée sur les cohortes

Les internautes sont placés dans un groupe selon leurs intérêts similaires. Les annonceurs n’auront alors plus besoin de traquer la navigation de chaque internaute. Ils ont seulement accès au numéro de groupe et l’anonymat des internautes est assuré. Toutefois, des associations de défense de la vie privée ainsi que des publicitaires ont relevé des failles de ce système. Cette technique ne semble pas protéger réellement la vie privée des utilisateurs. Les annonceurs pourraient facilement récupérer des données sensibles (âge, sexe, lieu d’habitation etc) grâce à l’utilisation de l’empreinte de navigateur. Cette pratique illégale permet d’identifier secrètement un internaute par l’intermédiaire de requête JavaScript.

La privacy Sandbox basée sur les Topics

Google annonce l’abandon de la solution basée sur les cohortes d’utilisateurs. L’entreprise de Mountain View avance l’idée d’un ciblage groupé via des segments d’audience. Google lance dorénavant la Privacy Sandbox : Topics ! Son objectif ? Permettre aux annonceurs de diffuser des publicités ciblées selon l’historique de recherches des utilisateurs. Ces données ne sont pas pour autant communiquées à Google ou d’autres tiers.  Concrètement, le navigateur va identifier des thèmes liés aux centres d’intérêts des internautes basés sur leur historique de recherches. Ces thèmes seront conservés durant 3 semaines sur le navigateur avant d’être supprimés. L’internaute aura un contrôle total de ses données puisqu’il pourra, depuis son navigateur chrome, sélectionner ou supprimer les thèmes qu’il souhaite ou même désactiver la fonctionnalité Topics.

L’identifiant unique ou SSO (Single Sign on)…

Une autre alternative est l’identifiant unique. Il s’agit d’un système d’authentification unique qui permet à un internaute d’accéder à plusieurs sites internet et applications avec uniquement un identifiant et un mot de passe pour accéder à l’ensemble de ses comptes. Le SSO est déjà bien connu des internautes car Facebook et Google l’utilisent pour de nombreux services. En effet, dans de nombreux sites il est possible de se connecter ou de s’inscrire via son compte Gmail ou son compte Facebook.

L’utilisation du SSO n’est pas une nouveauté et permet de mieux connaître l’internaute et ses habitudes de consommation. Contrairement aux cookies qui sont liés à un navigateur, le SSO est lié à une personne. Il permet d’avoir un suivi des sites et applications utilisés par l’internaute. L’identifiant unique est en mesure de suivre l’internaute quel que soit le device qu’il utilise. L’identifiant est le même, contrairement au cookie qui est installé à la fois sur desktop mais aussi sur mobile.

… mais un sentiment mitigé pour les internautes

Cette solution reste toutefois encore limitée car les internautes peuvent être réfractaires à l’idée de s’identifier sur tous les sites qu’ils consultent. Les cookies ont pour mérite de ne pas dévoiler l’identité des internautes, contrairement au SSO. Un risque potentiel est de voir les internautes chercher à dissimuler leurs informations personnelles pour éviter d’être harcelés par la publicité email ou téléphone. Toutefois, le SSO peut être une réelle alternative. Un travail d’information, d’engagement et d’adoption massive aux utilisateurs doit être réalisé. Cele permet de les rassurer et de gagner leur confiance.

Le ciblage contextuel

Dans son guide cookieless & consentless 2022, l’IAB France détaille une liste exhaustive des différentes technologies et alternatives, dont le ciblage contextuel. Il semble intéressant et pertinent de s’intéresser à cette technologie qui offre un ciblage ne nécessitant pas l’accord de l’internaute. Il existe 3 types de ciblage contextuel :

  • Ciblage éditorial : « consiste à associer un contenu à un lectorat. Exemple : un titre sportif attire en majorité une audience masculine, une revue consacrée à la mode est plutôt lue par une audience féminine. » selon l’IAB 
  • Ciblage par mot-clé : « Plus précis qu’un ciblage éditorial, un ciblage par mot-clé va s’intéresser au contenu d’une page. Le crawler va identifier les mots clés de l’URL ou de la page, afin de créer des segments spécifiques au sein d’un même site web ou cross domain. » selon l’IAB
  • Ciblage sémantique : « Encore plus précis que le ciblage par mot-clé et pouvant fonctionner en temps réel grâce à une plus grande puissance de calcul, le ciblage sémantique dépasse la simple orthographe d’un mot pour s’intéresser au contexte de la page. Cela permet d’éviter tout contre-sens sur un mot et même de lui associer des attributs socio-démographiques, émotionnels voire liés à une intention d’achat. » selon l’IAB.

L’intérêt du ciblage contextuel réside dans le fait qu’il est purement content-centric. Il ne nécessite pas de collecter de données sensibles ni le consentement des internautes. Ce système est respectueux de la vie privée des utilisateurs. Il offre aussi la possibilité aux annonceurs de communiquer à une cible très affinitaire même si elle a refusé les cookies. Selon l’IAB, « Le ciblage contextuel permet ainsi d’adresser des audiences en affinité́ avec un contenu, de s’associer à des événements (sportifs, fêtes, célébration…), d’améliorer la pertinence de la publicité pour la marque et sa perception par l’utilisateur.»

4/ Pour aller plus loin

Nous vous conseillons de prendre quelques minutes supplémentaires. Consulter ces quelques articles sur le blog MDCE de Skema qui traitent de sujets connexes :

  • POUR OU CONTRE DONNER SES INFORMATIONS SUR LES RÉSEAUX SOCIAUX ?
  • LA DATA AU CŒUR DES RÉGIES PUBLICITAIRES DES RETAILERS

Quels sont les moyens utilisés pour collecter les données de navigation des internautes ?

Ils utilisent à cet effet de petits fichiers texte appelés « cookies » qu'ils placent sur votre système lors de votre première visite. Ces cookies signalent au site le retour d'un visiteur et conservent les préférences utilisateur pour leurs visites ultérieures.

Comment se fait la collecte des données personnelles ?

Elles sont collectées via leur point de vente, leur site e-commerce, récoltées lors d'events, cookies posés sur leur site… 2nd party data : Les données second party correspondent aux données des partenaires business. Elles se transmettent dans le cadre d'une collaboration de partage de données « gagnant – gagnant ».

Qu'est

Le site va également collecter l'adresse IP de votre connexion. Celle-ci va permettre de vous géolocaliser plus ou moins précisément et, éventuellement, d'adapter les contenus à votre lieu géographique. C'est exactement ce que réalisent les moteurs de recherche ou les réseaux sociaux, par exemple.

Comment Google collecte des données ?

La question qui se pose alors est de savoir comment Google collecte ces données. Tout simplement à travers l'ensemble des produits Google regroupé au sein de votre compte : navigateur Chrome et votre historique web, le profil déduit via Adwords (la solution publicitaire) rattachant des centres d'intérêt à votre compte.