IA et Big Data

Quand le Covid aide à décrypter l’usage des applications

Derrière l’histoire des sites web vedettes de la pandémie Covidtracker et Vitemadose, se cache une véritable leçon sur ce qui déclenche l’usage des applications. Alors que la pandémie de Covid semble derrière nous et même si quelques doutes persistent, revenons sur l’intervention de Guillaume Rozier, l’initiateur de ces deux projets, lors du dernier salon Big Data et IA 2021, dont Visionary Marketing était partenaire encore une fois cette année. Un salon un peu particulier, tant les professionnels du secteur étaient impatients de se revoir, ce qui s’est vu dans les couloirs du salon, où l’on avait du mal à circuler tant la foule était dense. Voici mon compte-rendu de ce discours que j’ai trouvé intéressant et dont j’ai retrouvé les sources des explications.

Quand le Covid aide à décrypter l’usage des applications

Quand le Covid aide à décrypter l'usage des apps mobiles
Big Data IA Covid et usage des applications : explications de Guillaume Rozier lors du salon Big Data et IA 2021

Guillaume Rozier est consultant data scientist chez Octo Technologies, qui appartient au groupe Accenture, et a fondé, en dehors de ses activités professionnelles, CovidTracker et ViteMaDose. Il a décrit la genèse de la création de ces deux plateformes, qui ont permis de mettre le Big Data au service du citoyen, et évoque les trois leçons qu’il a retenues pour agir face à un phénomène de ce type :

  1. il faut d’abord comprendre le phénomène afin de coller au plus près du futur usage de l’application, ce qui nécessite des données, mais aussi des traitements et une hiérarchisation ;
  2. l’utilisation de la data via l’IA doit être centrée utilisateur pour que ça soit un grand succès ;
  3. et enfin la puissance de l’open data, un service double.

Les coulisses de la création de CovidTracker et de ViteMaDose : mettre le Big Data au service du citoyen

CovidTracker est une plateforme qui permet de suivre l’épidémie, via des tableaux de bord, des outils, des newsletters, des articles, pour essayer de comprendre le niveau de gravité de l’épidémie, et son évolution dans les différentes tranches d’âge et les différents départements en France. Gratuite, sans publicités, cette plateforme développée en open source utilise uniquement des données disponibles en open data, et elle produit elle-même des données ouvertes mises à disposition de la communauté.

« Le succès rencontré a complètement dépassé tout ce qu’on pouvait imaginer », souligne Guillaume, « avec plus de 10 millions d’utilisateurs actifs, 50 000 abonnés via les réseaux sociaux, et 5 millions de vues par jour ».

Usage Apps Mobiles
La genèse de la création de l’application Covidtracker nous ouvre les yeux sur ce qui déclenche l’usage des apps mobiles.

Guillaume Rozier a commencé à s’intéresser aux données de l’épidémie à la fin du mois de février 2020. La situation commençait à devenir critique en Chine, en Italie, mais on avait très peu d’informations sur ce qui se passait en France. Il avait envie de comprendre comment évoluait l’épidémie sur notre territoire. Allions-nous nous retrouver dans la même situation que les deux pays cités plus haut ? Serions-nous confinés à notre tour ?

Il a d’abord rassemblé des données à la main, parfois en allant les chercher via des universités qui les agrégeaient, et commencé à réaliser les premiers traitements statistiques et les premières visualisations pour comprendre le développement de cette épidémie.

Les partages de ces premières analyses par messages avec quelques amis et sur Twitter ont commencé à intéresser quelques personnes qui sont devenues addicts et qui ont voulu une mise à jour quotidienne des analyses pour comprendre quelle était la situation en France.

Il a ensuite commencé à organiser toutes ces données sur un microsite, à écrire en Python des programmes pour télécharger ces données de plus en plus nombreuses et à concevoir des algorithmes pour générer analyses et graphiques.

Des journalistes, des médias, des citoyens ont commencé à s’intéresser à l’initiative et ont interviewé Guillaume pour comprendre l’évolution de l’épidémie.

« Ils avaient besoin de ce travail de pédagogie pour passer du big data à des métriques et des analyses compréhensibles par le grand public », souligne-t-il.

Un projet collaboratif

Plusieurs personnes l’ont rejoint, ce qui l’a poussé à créer une vraie plateforme, un vrai site Internet, avec le nom CovidTracker.

CovidTracker résout finalement le problème du passage de données complexes, avec beaucoup d’indicateurs, avec une volumétrie assez élevée, à quelque chose de beaucoup plus simple pour que le citoyen, les médias, les journalistes puissent comprendre l’évolution d’une situation complexe.

La deuxième plateforme, ViteMaDose permet de trouver un rendez-vous de vaccination plus facilement et plus rapidement, via des algorithmes qui scannent les plateformes de réservation pour détecter et agréger au même endroit les créneaux disponibles pour la vaccination Covid.

En mai dernier, c’était 20 millions de recherches effectuées par semaine, plusieurs millions par jour, souligne Guillaume. Construit sur le même principe que CovidTracker, gratuit, sans pub, via open source et utilisant et produisant des données en open data.

L’idée de créer ViteMaDose est venue suite à plusieurs constats : la difficulté de trouver un créneau de vaccination ; les numéros de téléphone ne répondaient pas pour la plupart ; le ministère de la Santé publiait en open data des données utilisées par très peu de personnes, mais qui contenaient la liste des centres de vaccination avec les pages de réservation pour tous ces centres.

Ces données étaient très peu accessibles aux citoyens, alors qu’il y avait beaucoup de créneaux de rendez-vous disponibles

Guillaume Rozier a créé un algorithme pour scanner toutes ces pages, détecter tous les rendez-vous disponibles et les rassembler au même endroit. Ainsi est née la première version de ViteMaDose, le 1er avril 2021.

Conscient de l’intérêt de cette plateforme, encore très artisanale, mais immédiatement utilisée par plusieurs milliers de personnes, Guillaume a lancé un appel à compétences le lendemain sur Twitter. Plus de 150 contributeurs l’ont rejoint pour améliorer la solution, perfectionner les algorithmes, les rendre beaucoup plus rapides, les adapter à toutes les plateformes qui existent aujourd’hui, refaire entièrement le site Internet, le design et l’expérience utilisateur, et produire des applications mobiles. En quelques jours seulement est née la version telle que nous la connaissons aujourd’hui et qui a été mise en avant par le président de la République en mai dernier.

[Précision importante : Visionary Marketing est un site professionnel et B2B qui ne s’intéresse aucunement aux diverses opinions sur les vaccins ni à leur légitimité. Tous les commentaires ou remarques qui touchent à ces sujets seront systématiquement ignorés ou modérés] 

Vite Ma Dose règle le même problème que CovidTracker : comment passer du Big Data, des données nombreuses et parfois éparpillées dans des formats différents, à quelque chose de simple et d’accessible pour le grand public

Leçons pour agir et développer l’usage des applications

Guillaume Rozier a retenu principalement trois leçons de ces différents développements.

Pour agir, il faut d’abord comprendre un phénomène

Cela nécessite beaucoup de données, mais aussi des traitements et une hiérarchisation

« Au début de l’épidémie, on était en plein brouillard », souligne-t-il, « nous ne comprenions pas la situation, il était donc difficile de lutter et d’agir ». Cette loi est aussi valable dans de nombreux autres domaines, on peut l’appliquer au-delà de l’épidémie.

Pour éclaircir ce brouillard, comprendre la situation, il faut collecter et stocker beaucoup de données. C’est nécessaire, mais ce n’est pas suffisant. Il faut aussi des traitements statistiques, simples, ou complexes basés sur du Machine learning, de l’intelligence artificielle ou des traitements visuels. Et une fois qu’on a appliqué des traitements sur ces données, il faut aussi appliquer une hiérarchisation, un classement dans l’information qui va in fine permettre de prendre des décisions et d’agir face à une situation complexe, souligne-t-il.

Dans le cas de l’épidémie, Guillaume a commencé à collecter des données manuellement, et a aussi fait pression sur les différentes organisations publiques ou privées pour publier un certain nombre de jeux de données sur l’épidémie et sur la situation sanitaire. Ces données ont permis de constituer des bases de données qui ont servi à comprendre l’épidémie et à éclaircir ce brouillard.

Guillaume prend l’exemple suivant, très simple, qui montre que les traitements ne sont pas forcément très compliqués, mais très importants : le 11 mai 2020, à la fin du premier confinement, alors que la situation s’améliorait de jour en jour, de semaine en semaine, une dépêche annonce 348 nouveaux décès en 24 heures, donc un bilan quotidien à nouveau en hausse.

Les données, en hausse brutale, étaient inquiétantes. En prenant un peu de recul, il s’agissait simplement d’une saisonnalité des données : des pics en début de semaine, et des creux en fin de semaine. Il y avait moins de personnel dans les hôpitaux le week-end, ils ne pouvaient donc pas saisir les données et les saisissaient le lundi et le mardi. Beaucoup plus de décès étaient enregistrés le lundi et le mardi et beaucoup moins le samedi et le dimanche. Il était donc absurde de comparer le lundi avec le dimanche. On était bien en régression depuis plusieurs semaines et une simple moyenne mobile a permis de lisser les données et d’éviter ce biais.

Des traitements beaucoup plus complexes peuvent passer par de l’IA, du Machine learning, et permettre de mieux comprendre les données et de les rendre interprétables.

Une fois tous ces traitements appliqués, on a toujours affaire à beaucoup de métriques et d’indicateurs que le cerveau humain n’est pas capable d’intégrer pour comprendre un phénomène. Il y a un travail de hiérarchisation à faire pour essayer de comprendre quels sont véritablement les principaux indicateurs qui vulgarisent tous les autres, souligne Guillaume.

« On a fait ce travail sur l’épidémie et on a retenu deux indicateurs principaux qu’on affiche en page d’accueil et qui résument plus ou moins bien la situation épidémique et sanitaire », souligne-t-il.

Face à un phénomène complexe, il faut d’abord le comprendre. Pour le comprendre, il faut évidemment beaucoup de données, du big data, mais aussi d’autres éléments, comme des traitements et une hiérarchisation de l’information. À eux trois, ils permettent de mieux comprendre ce phénomène, et d’agir

De la data centrée utilisateur : utile, utilisable, utilisée

La deuxième leçon retenue par Guillaume suite aux développements de CovidTracker et de Vite Ma Dose est que la data et les solutions basées sur la data peuvent être extrêmement utiles, avoir un intérêt immense, mais si elles ne sont pas centrées utilisateurs, elles peuvent rater le coche.

  1. Donnée utile signifie que la solution développée, l’algorithme, la plateforme, le produit, doivent répondre à un problème bien défini ;
  2. Donnée utilisable signifie facile d’utilisation. C’est intuitif, simple. Si on met un utilisateur face à cette solution, il sait instinctivement comment l’utiliser ;
  3. Donnée utilisée signifie que la solution est effectivement utilisée au quotidien et donc qu’elle s’adresse à un public bien défini.
usages des applications
Les 3 critères qui font l’usage des applications. À noter que les explications issues du discours de Guillaume Rozier ont été sourcées sur le site d’Henri Lotin qui a traduit là un article d’IxDF selon ses propres dires. Redde Caesari quæ sunt Caesaris.

La puissance de l’open data, un service double

La troisième leçon est la puissance de l’open data et de la publication des données de manière libre et ouverte.

« Nous n’aurions jamais pu créer ces initiatives sans open data, sans les publications des données du gouvernement, de Santé Publique France, de l’Insee, etc. Cela permet des réutilisations totalement inattendues », souligne Guillaume Rozier.

Le fait que les données aient été publiées nous a donné envie de développer ces différentes plateformes. Généraliser l’open data est très important, car cela va permettre à plein d’entreprises, de citoyens, d’organisations de créer des produits ou des solutions basées sur ces masses de données

usage des applications
Ma photo rend assez mal l’impression de foule que j’ai ressentie lors du salon Big Data et IA 2021. Les professionnels étaient à l’évidence ravis de pouvoir se rencontrer à nouveau.

L’ingénieur conclut sur deux exemples de réutilisation des données de ses plateformes :

  • Un directeur de centre hospitalier les a remerciés, car il utilise CovidTracker quotidiennement en cellule de crise à l’hôpital pour prévoir les besoins, notamment humains et en matériel ;
  • Les données de ViteMaDose sont utilisées en open data sur sante.fr, un site gouvernemental, pour afficher directement les rendez-vous de vaccination disponibles

Au-delà du phénomène Covid et de la qualité de la prestation fournie par une bande d’enthousiastes qui ont démontré à nouveau, si besoin était la puissance de la coopération positive, c’est à une véritable explication sur les mécanismes de l’usage des applications que nous avons assisté. Une leçon utile pour tous les entrepreneurs qui désirent se lancer et réussir dans le monde très concurrentiel de la Tech.

Yann Gourvennec
Follow me

Yann Gourvennec

Yann Gourvennec created visionarymarketing.com in 1996. He is a speaker and author of 6 books. In 2014 he went from intrapreneur to entrepreneur, when he created his digital marketing agency. ———————————————————— Yann Gourvennec a créé visionarymarketing.com en 1996. Il est conférencier et auteur de 6 livres. En 2014, il est passé d'intrapreneur à entrepreneur en créant son agence de marketing numérique. More »
Bouton retour en haut de la page