Qu’est-ce qu’une DMP (data management platform) : définition et explications
Quelle définition de la DMP (Data Management Platform) pouvons-nous donner ? Utilisée d’abord par les géants du Web et du e-commerce, la DMP a désormais pris place dans des entreprises de taille moins importante, afin de pouvoir centraliser les données relatives aux clients et prospectsUne activité incontournable car les entreprises B2B perdent entre 5% et 15% de leurs clients chaque année, provenant de sources diverses, online et offline. Mais qu’est-ce exactement qu’une DMP ? Comment sont rangées toutes ces données ? Comment les analyser ? Quels outils sont utilisés pour les exploiter ? C’est à ces questions qu’ont répondu 3 experts du sujet, Emmanuel Jouanne (Business Development Manager chez Data Publica), Thierry Vallaud (Directeur BVA Data Sciences) et Mick Levy (Directeur de l’InnovationL'innovation va de la compréhension (intuitive ou non) du comportement de l’acheteur à la capacité d’adaptation à l'environnement chez B&D), lors d’une conférence organisée par notre partenaire CCM Benchmark le 25 mai dernier et animée par Yann Gourvennec, fondateur de Visionary Marketing.
Définition de la DMP (Data Management Platform) : définition et explications
Qu’entend-on par DMP ?
La DMP est un outil récent qui a évolué pour dépasser son but initial ; nos experts nous donnent leur définition des formes que peut prendre la DMP :
Mick Levy définit la DMP comme « une grande machine à la fois à data, ou l’on recueille, et croise les données en temps réel, et à activation de la data (envoi de mails, placement de bannières, agencement du contenu, etc.) »
Selon Thierry Vallaud, « la DMP était à l’origine une base permettant d’optimiser l’achat de publicité en ligne, et était utilisée dans le marchéLa notion même de marché B2B ou B2C est au cœur de la démarche marketing. Un marché est la rencontre d'une offre et d'une demande des médias et du real time bidding ». Les DMP permettent d’optimiser l’achat de publicité : grâce à cela, on peut suivre le ROI des campagnes publicitaires. Le terme a ensuite dérivé, et la DMP désigne aujourd’hui une base marketing.
Cette plateforme, en permettant le recueil, le croisement et l’intelligence des données va permettre par exemple de reconnaître les clients : en effet, « un client peut avoir plusieurs images différentes – parfois jusqu’à 15 », précise Mick Levy.
Concernant le marché Thierry Vallaud nous prévient : « ce n’est plus un eldorado, on se dirige vers de la concentration et il aura certainement une redistribution des cartes »
Une DMP B2C mais aussi B2B
Une DMP n’est pas utile qu’en B2CEn réalisant ce glossaire Visionary Marketing s'est heurtée de front à un problème de taille : faut-il écrire BtoB ou B2B ? : elle est également utilisée en B2B. Voici ci-dessous un tableau récapitulatif des deux DMP, montrant leurs principales différences.
On peut ainsi retenir côté B2B, que la collecte des données est relativement aisée car les entreprise sont visibles et il n’y a aucun besoin d’anonymisation.
Les données collectées dans cette DMP B2B proviennent de sources différentes:
- Données administratives ;
- Site webLe site web B2B est la vitrine digitale de votre entreprise. C'est le moyen le plus simple et efficace de présenter les produits et services de votre entreprise à vos futurs clients. de l’entreprise (dirigeants, activité, prix etc.) ;
- Réseaux sociaux (principalement Linked In) ;
- Open Data.
Une fois collectées, les données représentent plusieurs dizaines de Teraoctects de fichiers. Le but est donc de trouver des prospects dans cette masse de données : pour ce faire, « on va matcher des critères (environ 300 à 400 variables par entreprises, hors mots clés) par ressemblances entre entreprises, en fonction d’un scoring établi à partir de ces variables », explique Emmanuel Jouanne. Le but de ce calcul est de proposer des prospects à des entreprises comme Amazon propose à ses clients des produits similaires.
Analyse des données : comment fonctionnent les outils de data mining ?
Collecter et classer les données n’est qu’une première étape, qui précède la suivante : celle de l’analyse des données. Dans ce travail il existe un acteur central : le data miner. Il y a quelques années, le data miner était une personne qui faisait des calculs sur Excel pour analyser les données collectées ; aujourd’hui, il y a plus de données, qui sont également plus incertaines. Il existe donc des programmes avec lesquels on extrait des données en fonction de critères de scores, et sur lesquels on utilise des librairies d’outils.
« Ces outils se pluggent sur la base, soit en temps réel soit en asynchrone – on n’a pas besoin de tout faire en temps réel », explique Thierry Vallaud, « on analyse les pubs les plus vues, celles qui ont le plus déclenché le clic, etc. Cela permet d’effectuer un retracage du chemin parcouru par le client en fonction de ce que l’on veut savoir. Chaque champ de la base permet de faire de l’analyse et donc du data mining ».
Machine learning et DMP : « l’algorithme de Pavlov »
Parmi les outils utilisés pour le data mining, on trouve le machine learning. « Au fur et à mesure, on accumule une connaissance qui permet d’utiliser des algorithmes reproductibles et affinables » explique Emmanuel Jouanne.
Il existe ainsi deux approches de machine learning pour faire apprendre à la machine le résultat attendu :
- Le mode supervisé : il s’agit du même fonctionnement que l’application de rencontre Tinder : l’utilisateur participe à l’élaboration des préférences selon les caractéristiques qui correspondent le plus. Il y a donc un accompagnement humain.
- Le mode non supervisé : il n’y a pas d’intervention humaine. Le système s’améliore selon des faits/événements (par exemple la signature de contrats).
Quel que soit le mode utilisé, le machine learning adopte une démarche très pragmatique : « on n’explique pas les règles à la machine », précise Emmanuel Jouanne. « Par exemple, Google Translate a deux solutions : faire une traduction selon un découpage sujet/verbe/complément, ou récupérer des portions de phrase traduite dans le Web selon le contexte. La 2e version statistique offre des résultats plus pertinents que la 1ère. C’est la même chose dans la DMP : on n’essaie pas d’expliquer à la machine, on lui montre simplement un profil de client type ».
Définition de la DMP : les algorithmes fonctionnent par ressemblance
« Ces algorithmes fonctionnent par ressemblance », ajoute Mick Levy, « on affiche une pub, puis on enregistre une réaction (bonne ou non) ». Cela permet ensuite de dresser un profil de client positif ou négatif, et de coup en coup, affiner le profil. « C’est le principe du chien de Pavlov (avec l’algorithme dans le rôle du chien) : quand l’algorithme (le chien) a un comportement attendu, on le « récompense », sinon, non ».
Coupler la DMP au Data Lake : quel intérêt ?
Quand on parle de data, il est impossible de ne pas mentionner le Data Lake. Mais qu’est-ce exactement qu’un Data Lake et que peut-il apporter à la DMP ?
« Le terme de Data Lake est très flou », explique Emmanuel Jouanne, « il s’agit simplement d’un entrepôt de données moins structurées :
- Avant, on collectait les données suivant une intention (données structurées)
- Aujourd’hui, on est dans la logique Big data : on met toutes les données dans un lac et après coup, on trouvera des choses intéressantes.»
D’après Emmanuel Jouanne, le principal intérêt du Data Lake est la segmentationStricto sensu, segmenter signifie diviser son marché en sous-ensembles (segments) qui constituent des groupes homogènes et distincts : on peut désormais segmenter avec des données que l’on n’exploitait pas auparavant. On arrive ainsi, avec l’utilisation d’algorithmes, à trouver des tendances et phénomènes.
Le couplage entre une DMP et un data Lake est toutefois recommandé pour les entreprises ayant un niveau de maturité suffisamment haut. En effet, pour une entreprise encore novice dans le domaine du Big Data, le risque de créer une usine à gaz est important. « Il vaut mieux commencer par une petite DMP, puis une grosse DMP, puis un Data Lake », conseille Thierry Vallaud, « sinon, on risque de se perdre. Même dans les grandes structures, mieux vaut commencer par une base qui fonctionne, puis aller de plus en plus gros ».
Prescriptive data : quel est le rôle du Data Scientist ?
Le prescriptive data dans une DMP permet l’activation de la donnée. Attention, il ne faut pas confondre ce terme de prescriptif avec celui de prédictif : « le prescriptif est un niveau pus avancé : je prédis que M. va partir (prédictif), puis pour avoir des chances de le garder je prescris ceci…(prescriptif) ». Concrètement :
- Prédicitf : Pour chaque appel d’offre, on va prédire le score du client.
- Prescriptif : Permet d’identifier les clients qui vont partir et prévoir quelles actions mener pour les garder (email, bannière, site web…).
Le Data Scientist va ainsi établir les algorithmes pour savoir quoi prescrire et comment prévenir.
Cependant, même si le métier de Data Scientist est actuellement en vogue, Emmanuel Jouanne rappelle que « son quotidien est de se heurter continuellement aux biais et faire en sorte de se débrouiller pour les résoudre. Le travail sur les algorithmes est simplement le sommet de l’iceberg (environ 10% du travail d’un data scientist) ».
D’ailleurs, pour Thierry Vallaud, le Data Scientist s’éloignera peu à peu du codage, pour se rapprocher des problématiques métiers « les outils vont permettre à tout en chacun d’être data scientist : le Data Scientist de demain ne sera donc pas un codeur ».
Définition de la DMP : Pourquoi utiliser la data visualisation ?
Pour finir, passons en revue la dernière étape, celle de la data visualisation. Ce domaine est en pleine évolution, comme nous avons pu le constater dans notre dernier article sur le sujet. Pourtant, selon Emmanuel Jouanne, « la data visualisation permet de cacher toute la complexité en digérant des données longues à lire pour les rendre accessible à l’utilisateur. Elle va ainsi rassembler les informations et les données de façon explicite pour mettre en avant des biais ».
N’oublions toutefois pas que l’ « on peut faire dire n’importe quoi aux chiffre, masquer des informations cruciales en simplifiant à l’extrême », prévient Thierry Vallaud.