Une petite bombe. Lundi 3 septembre, l'agence Associated Press révélait que le candidat républicain à la présidentielle américaine, Mitt Romney, recourait à un logiciel fourni par Buxton Company, spécialisée dans l'analyse de bases de données, pour identifier les riches donateurs potentiels pro-républicains. Cet outil aurait ainsi passé au crible des informations sur plus de deux millions de ménages autour de San Francisco, et permis à l'équipe de campagne de Mitt Romney de récolter cet été plus de 350 000 dollars de donations autour de ce bassin de population traditionnellement démocrate. Quand le marketing politique s'empare du «big data»…
Cette discipline naissante est un des champs de bataille de demain. Le «big data» est un ensemble de technologies et d'algorithmes qui permettent de trier (presque) en temps réel de manière toujours plus fine une masse considérable de données sur le Web, et de cerner plus subtilement les comportements des internautes-consommateurs.
Des «like» sur Facebook au téléchargement d'applications mobiles et aux achats sur des sites d'e-commerce, en passant par la recherche d'un nouveau job via Linked In, l'utilisation de cartes de fidélité en ligne, la géolocalisation dans des boutiques… jamais les particuliers n'ont partagé autant d'informations et laissé autant de traces. Les ordinateurs, smartphones et tablettes génèrent une multitude de fichiers, voire de cookies (témoins de connexion), et d'informations, stockés dans une nouvelle génération de «cloud» (serveur en réseau, comme Gmail par exemple) et des centres de données de plus en plus puissants. Une mine potentielle pour les marques.
D'après l'étude «Extracting value from chaos» («Extraire de la valeur du chaos»), publiée par John Grantz et David Reinstel en 2011, le nombre de «data» collectées dans le monde double tous les deux ans. Entre statuts, liens, «like» et interactions, les «data» enregistrées par Facebook représenteraient quelque 500 teraoctets (soit 500 000 gigaoctets) de données chaque jour, révélait en août Jay Parikh, vice-président en charge de l'infrastructure chez Facebook. Bienvenue dans «l'âge du big data», comme l'écrit Wired, bible des technophiles, qui titre sur «The Exabyte Revolution» dans son édition d'août.
Dénicher du sens
Sans grande surprise, Facebook, Google, Twitter et autres Amazon ont en grande partie initié ce phénomène. Parce que tous permettent aux internautes d'accéder à des services gratuits en cédant, en échange, des informations personnelles. Ils bâtissent donc leur modèle économique autour de ce trésor de guerre de données relatives à des millions d'internautes – près d'un milliard d'utilisateurs pour Facebook. Lequel s'est précisément doté d'une «data team» d'une douzaine de personnes aux Etats-Unis (bientôt le double), qui analysent les statistiques des utilisateurs (cf. Stratégies n°1686 du 5 juillet 2012).
Du marketing à l'énergie en passant par la finance, la santé et même les médias (lire le sous-papier), tous les secteurs économiques ont recours au «big data». Et en premier lieu la grande distribution, habituée à drainer des millions de contacts via ses cartes de fidélité. En 2006, c'est le créateur de la Clubcard de Tesco, Clive Humby, qui proclamait déjà «Data is the new oil» («les données sont le nouveau pétrole [de l'économie]»). Le vrai trésor, bien sûr, ce ne sont pas les données, mais la capacité d'y dénicher du sens. «Les marques ont pris conscience qu'il serait essentiel pour demain d'être très bon dans la “data”, pour avoir des leviers d'acquisition et de performance. Et de savoir donner du sens aux multiples données extraites», estime Matts Carduner, CEO de la start-up Fifty Five, conseil en bases de données. «Avec ces nouveaux outils qui permettent d'agréger des données de sources multiples, il y a un enjeu phénoménal de meilleure connaissance du consommateur», estime Jérôme Toucheboeuf, président de la délégation Customer Marketing de l'Association des agences-conseils en communication (AACC).
Exemple: Delamaison.fr (groupe Adeo), site d'e-commerce en décoration et ameublement en ligne, compte ainsi sur le «big data» pour «identifier un comportement type de l'internaute lié à ses visites sur notre site, et lui présenter un contenu personnalisé, par exemple des suggestions en rapport avec sa navigation», résume Ludovic Moulard, son responsable marketing.
Les agences de marketing services s'emparent aussi du sujet. En ligne de mire: cerner au mieux les comportements des internautes. Et optimiser les campagnes marketing, rigueur oblige. «Le “big data”, les algorithmes et les modèles statistiques nous permettent de traiter en temps réel de gros volumes de données et de mesurer davantage l'efficacité des différents canaux: le CRM, les médias sociaux, l'e-mailing…», décrypte Pierre-Emmanuel Cros, directeur général de Performics (Zenith-Optimedia). «Par exemple, on peut récupérer et classifier les personnes comme ambassadeurs d'une marque chez Facebook, et analyser ce qu'elles disent», souligne Jérôme Saunier, directeur du pôle data marketing de Publicis Dialog. D'ailleurs, l'agence a créé une entité pour son client Nissan, au sein de laquelle elle gère à la fois CRM et Web. De même, Fullsix utilise désormais l'ensemble des données récoltées pour Les Galeries Lafayette.
Des expertises plus pointues
L'avantage des «big data» est qu'elles peuvent être aussi utilisées de façon transverse entre le CRM (la relation client) et l'achat d'espace publicitaire. «La segmentation et les modèles de scoring [score sur la probabilité qu'un individu réponde à une sollicitation ou appartienne à la cible recherchée] sont les mêmes entre la publicité, le CRM et les sites d'e-commerce», souligne Anne Browaeys, directrice générale de Fullsix. Du coup, l'agence de marketing travaille, au sein du même groupe, avec l'agence d'achat médias 6 AM.
De fait, l'enjeu devient aussi crucial pour les agences médias, pour lesquelles ces «data» triées et analysées vont se combiner avec les «ad exchanges», ces plates-formes d'achat d'espace publicitaires en plein développement (lire page 23). «On y achète essentiellement des profils types de consommateur que l'on peut combiner avec les inventaires publicitaires», souligne Jérôme Bourgeais, vice-président de Capgemini Consulting. «Les agences médias disposent désormais de “data” plus précises, qu'elles peuvent conjuguer entre elles: “data” comportementales issues, par exemple, de Weborama, “data” médias, d'annonceurs…», ajoute Thierry Jadot, président d'Aegis Media France.
Encore faut-il créer du sens à partir d'océans de chiffres et transformer des données brutes en infographies ludiques, le métier du futur. A l'ère du «big data», de nouveaux profils émergent ainsi: développeur, statisticien, analyste (voire «quantitative analyst»), mathématicien... Ces métiers comptent parmi les fonctions les plus porteuses relevées par le site américain d'offres d'emplois Career Cast dans son dernier classement annuel. «Avec le “big data”, nous cherchons des expertises plus pointues, issues de Google ou Yahoo, que nous sommes prêts à recruter dans la Silicon Valley», nous expliquait ce printemps Jean-Baptiste Rudelle, patron de la start-up Criteo (cf. Stratégies n°1685 du 28 juin 2012).
Les agences de marketing digital en ont saisi l'enjeu, et développent leurs pôles «data», telle Performics, qui embauche des statisticiens, des développeurs et autres «data miners». «C'est notre poste d'investissement le plus important», précise Pierre-Emmanuel Cros, directeur général de Performics. Publicis Dialog, pour sa part, s'est dotée il y a trois ans d'un pôle data marketing.
Optimisation
Forcément, les start-up et les cabinets de conseil en «big data» ont fleuri. Ainsi, X plus one, qui développe de la publicité digitale en temps réel, ou encore Tiny Clues, qui cherche «des petits indices dans de grandes masses de données» pour des géants de l'e-commerce. En France, Criteo a fait de l'or de son système de «retargeting» publicitaire, qui s'appuie sur les données comportementales des internautes. Fifty Five, quarante salariés, dont la moitié a fait ses armes chez Google, est précisément spécialisée dans l'optimisation de la performance des annonceurs sur Internet, à partir de l'analyse et l'exploitation de data. Elle va jusqu'à conseiller ses clients (Ferrero, McDonald's, L'Oréal, Renault, Pixmania, Darty…) sur la manière d'optimiser leurs campagnes et leurs plan médias. Quitte à recourir aux métiers traditionnels des agences médias.Fifty Fivelançait ainsi le 28 août dernier une offre d'achat médias pilotée par la méthode «analytics» (analyse des données), avec Marin Software, entreprise spécialisée dans les solutions d'optimisation et de gestion publicitaire.
Le mouvement ne cesse de prendre de l'ampleur. Des entreprises publiques et des collectivités locales ont décidé de révéler au grand jour certaines de leurs données, pour permettre par exemple aux développeurs de concevoir des services mobiles. Longtemps rétive, la RATP s'y est mise. Elle va publier ce mois-ci les flux d'entrée et de sortie des voyageurs dans chaque station du métro parisien, annonçait-elle lundi 3 septembre. Fin juillet, elle a ainsi rendu accessible les plans des lignes de métro et du RER.
De nouvelles perspectives, donc. A condition de ne pas franchir la ligne rouge, alors que les pratiques de Facebook et Google sur la question de la vie privée ont déjà fait polémique. «Demain, on pourra valoriser directement le client quand il vient dans un magasin ou sur le site, le reconnaître et le remercier», imagine Jérôme Saunier, de Publicis Dialog. De là à avoir un schéma à la Minority Report, tel le personnage incarné par Tom Cruise auquel un avatar sur un écran demande s'il a apprécié son dernier T-shirt acheté chez Gap… «On se conforme à la loi en matière de vie privée des internautes. Il n'y a pas d'intérêt pour nous à travailler sur des données personnelles, mais sur des données comportementales», temporise Pierre-Emmanuel Cros, de Performics.
Encadré
Lexique
Big data. Volumétrie importante de données (data) issues de sources multiples sur Internet, qui peuvent être triées et analysées grâce à des nouvelles technologies et des algorithmes.
Algorithme. Suite de calculs nécessaires à la résolution d'un problème.
Open data. Données brutes en accès ouvert et gratuit, mises en ligne sur Internet, qui permettent de créer de nouveaux services.