IA et Big Data

Qu’est-ce qu’une DMP (data management platform) : définition et explications

Quelle définition de la DMP (Data Management Platform) pouvons-nous donner ? Utilisée d’abord par les géants du Web et du e-commerce, la DMP a désormais pris place dans des entreprises de taille moins importante, afin de pouvoir centraliser les données relatives aux clients et prospects, provenant de sources diverses, online et offline. Mais qu’est-ce exactement qu’une DMP ? Comment sont rangées toutes ces données ? Comment les analyser ? Quels outils sont utilisés pour les exploiter ? C’est à ces questions qu’ont répondu 3 experts du sujet, Emmanuel Jouanne (Business Development Manager chez Data Publica), Thierry Vallaud (Directeur BVA Data Sciences) et Mick Levy (Directeur de l’Innovation chez B&D), lors d’une conférence organisée par notre partenaire CCM Benchmark le 25 mai dernier et animée par Yann Gourvennec, fondateur de Visionary Marketing

Définition de la DMP (Data Management Platform) : définition et explications

Définition de la DMP (Data Management Platform) : comment ça marche vraiment
Définition de la DMP (Data Management Platform) : comment ça marche vraiment

Qu’entend-on par DMP ?

La DMP est un outil récent qui a évolué pour dépasser son but initial ; nos experts nous donnent leur définition des formes que peut prendre la DMP :

Mick Levy définit la DMP comme « une grande machine à la fois à data, ou l’on recueille, et croise les données en temps réel, et à activation de la data (envoi de mails, placement de bannières, agencement du contenu, etc.) »

Selon Thierry Vallaud, « la DMP était à l’origine une base permettant d’optimiser l’achat de publicité en ligne, et était utilisée dans le marché des médias et du real time bidding ». Les DMP permettent d’optimiser l’achat de publicité : grâce à cela, on peut suivre le ROI des campagnes publicitaires. Le terme a ensuite dérivé, et la DMP désigne aujourd’hui une base marketing.

Cette plateforme, en permettant le recueil, le croisement et l’intelligence des données va permettre par exemple de reconnaître les clients : en effet, « un client peut avoir plusieurs images différentes – parfois jusqu’à 15 », précise Mick Levy.

Concernant le marché Thierry Vallaud nous prévient : « ce n’est plus un eldorado, on se dirige vers de la concentration et il aura certainement une redistribution des cartes »

Une DMP B2C mais aussi B2B

Une DMP n’est pas utile qu’en B2C : elle est également utilisée en B2B. Voici ci-dessous un tableau récapitulatif des deux DMP, montrant leurs principales différences.

Définition de la DMP (Data Management Platform) : comment ça marche vraiment
Définition de la DMP : différences entre une DMP B2B et une DMP B2C

On peut ainsi retenir côté B2B, que la collecte des données est relativement aisée car les entreprise sont visibles et il n’y a aucun besoin d’anonymisation.

 Les données collectées dans cette DMP B2B proviennent de sources différentes:

  1. Données administratives ;
  2. Site web de l’entreprise (dirigeants, activité, prix etc.) ;
  3. Réseaux sociaux (principalement Linked In) ;
  4. Open Data.

Une fois collectées, les données représentent plusieurs dizaines de Teraoctects de fichiers. Le but est donc de trouver des prospects dans cette masse de données : pour ce faire, « on va matcher des critères (environ 300 à 400 variables par entreprises, hors mots clés) par ressemblances entre entreprises, en fonction d’un scoring établi à partir de ces variables », explique Emmanuel Jouanne. Le but de ce calcul est de proposer des prospects à des entreprises comme Amazon propose à ses clients des produits similaires.

Analyse des données : comment fonctionnent les outils de data mining ?

Collecter et classer les données n’est qu’une première étape, qui précède la suivante : celle de l’analyse des données. Dans ce travail il existe un acteur central : le data miner. Il y a quelques années, le data miner était une personne qui faisait des calculs sur Excel pour analyser les données collectées ; aujourd’hui, il y a plus de données, qui sont également plus incertaines. Il existe donc des programmes avec lesquels on extrait des données en fonction de critères de scores, et sur lesquels on utilise des librairies d’outils.

« Ces outils se pluggent sur la base, soit en temps réel soit en asynchrone – on n’a pas besoin de tout faire en temps réel », explique Thierry Vallaud, « on analyse les pubs les plus vues, celles qui ont le plus déclenché le clic, etc.  Cela permet d’effectuer un retracage du chemin parcouru par le client en fonction de ce que l’on veut savoir. Chaque champ de la base permet de faire de l’analyse et donc du data mining ».

Machine learning et DMP : « l’algorithme de Pavlov »

Parmi les outils utilisés pour le data mining, on trouve le machine learning. « Au fur et à mesure, on accumule une connaissance qui permet d’utiliser des algorithmes reproductibles et affinables » explique Emmanuel Jouanne.

Il existe ainsi deux approches de machine learning pour faire apprendre à la machine le résultat attendu :

  • Le mode supervisé : il s’agit du même fonctionnement que l’application de rencontre Tinder : l’utilisateur participe à l’élaboration des préférences selon les caractéristiques qui correspondent le plus. Il y a donc un accompagnement humain.
  • Le mode non supervisé : il n’y a pas d’intervention humaine. Le système s’améliore selon des faits/événements (par exemple la signature de contrats).

Quel que soit le mode utilisé, le machine learning adopte une démarche très pragmatique : « on n’explique pas les règles à la machine », précise Emmanuel Jouanne. « Par exemple, Google Translate a deux solutions : faire une traduction selon un découpage sujet/verbe/complément, ou récupérer des portions de phrase traduite dans le Web selon le contexte. La 2e version statistique offre des résultats plus pertinents que la 1ère. C’est la même chose dans la DMP : on n’essaie pas d’expliquer à la machine, on lui montre simplement un profil de client type ».

Définition de la DMP : les algorithmes fonctionnent par ressemblance

« Ces algorithmes fonctionnent par ressemblance », ajoute Mick Levy, « on affiche une pub, puis on enregistre une réaction (bonne ou non) ». Cela permet ensuite de dresser un profil de client positif ou négatif, et de coup en coup, affiner le profil. « C’est le principe du chien de Pavlov (avec l’algorithme dans le rôle du chien) : quand l’algorithme (le chien) a un comportement attendu, on le « récompense », sinon, non ».

Coupler la DMP au Data Lake : quel intérêt ?

Quand on parle de data, il est impossible de ne pas mentionner le Data Lake. Mais qu’est-ce exactement qu’un Data Lake et que peut-il apporter à la DMP ?

« Le terme de Data Lake est très flou », explique Emmanuel Jouanne, « il s’agit simplement d’un entrepôt de données moins structurées :

  • Avant, on collectait les données suivant une intention (données structurées)
  • Aujourd’hui, on est dans la logique Big data : on met toutes les données dans un lac et après coup, on trouvera des choses intéressantes

D’après Emmanuel Jouanne, le principal intérêt du Data Lake est la segmentation : on peut désormais segmenter avec des données que l’on n’exploitait pas auparavant. On arrive ainsi, avec l’utilisation d’algorithmes, à trouver des tendances et phénomènes.

Le couplage entre une DMP et un data Lake est toutefois recommandé pour les entreprises ayant un niveau de maturité suffisamment haut. En effet, pour une entreprise encore novice dans le domaine du Big Data, le risque de créer une usine à gaz est important. « Il vaut mieux commencer par une petite DMP, puis une grosse DMP, puis un Data Lake », conseille Thierry Vallaud, « sinon, on risque de se perdre. Même dans les grandes structures, mieux vaut commencer par une base qui fonctionne, puis aller de plus en plus gros ».

Prescriptive data : quel est le rôle du Data Scientist ?

Le prescriptive data dans une DMP permet l’activation de la donnée. Attention, il ne faut pas confondre ce terme de prescriptif avec celui de prédictif : « le prescriptif est un niveau pus avancé : je prédis que M. va partir (prédictif), puis pour avoir des chances de le garder je prescris ceci…(prescriptif) ». Concrètement :

  • Prédicitf : Pour chaque appel d’offre, on va prédire le score du client.
  • Prescriptif : Permet d’identifier les clients qui vont partir et prévoir quelles actions mener pour les garder (email, bannière, site web…).

Le Data Scientist va ainsi établir les algorithmes pour savoir quoi prescrire et comment prévenir.

Cependant, même si le métier de Data Scientist est actuellement en vogue, Emmanuel Jouanne rappelle que « son quotidien est de se heurter continuellement aux biais et faire en sorte de se débrouiller pour les résoudre. Le travail sur les algorithmes est simplement le sommet de l’iceberg (environ 10% du travail d’un data scientist) ».

D’ailleurs, pour Thierry Vallaud, le Data Scientist s’éloignera peu à peu du codage, pour se rapprocher des problématiques métiers « les outils vont permettre à tout en chacun d’être data scientist : le Data Scientist de demain ne sera donc pas un codeur ».

Définition de la DMP : Pourquoi utiliser la data visualisation ?

Pour finir, passons en revue la dernière étape, celle de la data visualisation. Ce domaine est en pleine évolution, comme nous avons pu le constater dans notre dernier article sur le sujet. Pourtant, selon Emmanuel Jouanne, « la data visualisation permet de cacher toute la complexité en digérant des données longues à lire pour les rendre accessible à l’utilisateur. Elle va ainsi rassembler les informations et les données de façon explicite pour mettre en avant des biais ».

N’oublions toutefois pas que l’ « on peut faire dire n’importe quoi aux chiffre, masquer des informations cruciales en simplifiant à l’extrême », prévient Thierry Vallaud.

Follow me

Cédric Jeanblanc

Cédric is a Web Marketing consultant at Visionary Marketing. He was named "Rising Star of Content Marketing" by the Content Marketing Academy in 2017, he specializes in the production of multimedia content, feature articles, videos and podcasts. _________________________ Cédric est consultant en marketing Web chez Visionary Marketing. Il a été nommé "Rising Star of Content Marketing" par la Content Marketing Academy en 2017. Il est spécialisé dans la production de contenus multimédia, d'articles de fond, de vidéos et de podcasts. More »
Bouton retour en haut de la page