IA et Big Data

IA “générative” ou dégénérative ?

IA générative… un terme que nous entendons prononcer tous les jours ou presque. Seraient-ce les machines qui se sont hissées au niveau des humains ou les humains qui se seraient abaissés au niveau des machines ? À l’occasion de la sortie de l’eBook annuel de prospective de Digimind, je publie ici ma contribution sur un sujet qui n’a pu échapper à personne en cette nouvelle année 2023, et qui est pourtant à l’agenda de Visionary Marketing depuis 2020. À noter également que nous interviendrons lors d’une table ronde organisée par Digimind à la BPI le 16 février 2023

IA “générative” ou dégénérative ?

IA générative
Nous avons demandé à Midjourney de nous dessiner le futur du content marketing à l’ère de l’IA générative et nous devons avouer que pour une fois l’app a fait un super boulot de « créativité » (rappelons que cette créativité est limitée puisqu’elle s’appuie sur un corpus donné inventé par des humains).

Impossible d’échapper au buzz du moment sur ChatGPT3 ou Dall-E. il éclipse tous les autres. GPT3 — qui sera bientôt rendu obsolète par son successeur — laissait déjà entrevoir des résultats bluffants pour certains, effrayants pour d’autres, il y a plus de 2 ans. 

À l’époque, j’avais annoncé dans un webinaire organisé par PushEngage que l’impact serait certainement très fort pour le contenu SEO, mais que les vrais créateurs de contenus s’empareraient sans doute de ces outils pour améliorer leurs créations.

IA générative
Ce qui est particulièrement savoureux avec l’appli d’IA générative Midjourney c’est sa propension à inventer des langages délirants. Le futur du content marketing selon cette appli sera donc le Volapük.

L’IA et la traduction

Je pratique la traduction depuis toujours, et j’ai suffisamment de recul maintenant sur ces outils ultra-puissants, comme Deepl. Ils permettent d’améliorer et de fluidifier les traductions de manière spectaculaire.

Pour autant, ni Deepl ni ses clones n’ont tué ni rendu inutiles les traducteurs, bien au contraire. Le ticket d’entrée des bons outils est un frein notable au développement des usages. Par ailleurs, la machine produit un résultat brut qu’il convient systématiquement de retravailler. 

On pourrait même débattre sur la rapidité d’exécution de la traduction assistée par l’IA. 

J’observe que le gain réalisé grâce à l’outil touche essentiellement la phase préliminaire de la création du contenu. La plus facile. Un gain de productivité est vite mangé par la nécessité de retravailler le texte. C’est-à-dire les 2e, 3e, 4e, etc. passes de la traduction.

Les outils d’IA dite « générative »

Pour la création de contenus, surtout en ligne, les outils d’IA dite “générative” vont avoir un impact considérable.

À quelques nuances près que je vais détailler.   

Ma vision d’il y a 2 ans était un peu étroite. Les résultats concrets en sortie de l’application étaient difficiles à toucher du doigt. Ce n’est plus le cas aujourd’hui, que ce soit pour la génération d’images ou de contenus. Même si pour l’instant, il s’agit surtout de geeks qui testent l’outil et qui s’amusent. Les véritables créateurs de contenus commencent eux aussi à s’emparer de ces outils pour des créations plus élaborées. 

Pour autant, pour ce qui est de la création de contenus en B2B, je ne suis pas spécialement inquiet. Ce qui ne veut pas dire que l’état de l’art ne va pas évoluer, voire être bousculé, de manière radicale. 

Voyons mes cinq points sur l’impact de l’IA sur la création de contenus.

De l’impact de l’IA générative sur la création de contenus et le content marketing en 5 points

Point no.1 : Attention à l’effet démo, aux cadavres exquis et aux erreurs d’interprétation sur la “puissance” de la machine 

Si les résultats en sortie de ces applications sont souvent spectaculaires, il ne faut pas tout mélanger cependant. D’une part, ces applications puisent dans des bases de données aujourd’hui limitées. GPT3 ne connaît pas les événements ultérieurs à 2021. 

De plus en plus énigmatique, ce dessin que Bilal ne renierait pas et qui est peut-être même inspiré par ses livres

Même s’ils sont « puissants », un terme souvent utilisé à leur égard, il s’agit toujours d’outils statistiques, qui produisent des sortes de cadavres exquis réalisés à partir de contenus préexistants, réorganisés et réécrits au travers de la “boîte noire” de l’API d’OpenAI. La machine est d’ailleurs souvent prise en défaut sur des sujets pointus. 

Un indéniable effet démo

Il y a donc un indéniable effet démo qui donne une impression de finitude et d’immédiateté. Là où les changements prendront des années ou des décennies à se mettre en œuvre. On nous dira que GPT4 corrigera ces biais, cela reste à voir. 

Regardons en arrière

Dès les années 80, les informaticiens étaient capables d’automatiser de A à Z une comptabilité.

Pourtant, c’est seulement 40 ans plus tard que l’on commence à voir des services en ligne automatisés. Et l’industrialisation et la généralisation du domaine comptable vont prendre encore beaucoup de temps.

Difficile d’imaginer une légende pour cette image produite par une IA générative sur le sujet du futur du content marketing !

Il en est ainsi sur un sujet « simple », carré et mathématique comme la comptabilité. On imagine donc le temps de mise en œuvre de l’automatisation pour un champ d’application aussi complexe que la création de contenus…

Point no.2 : Le contenu SEO sera écrit par des machines d’IA générative

Mais pour le bas de gamme du contenu, fondé sur des bases de données (descriptions immobilières, analyses d’états financiers…) c’est une autre histoire. Idem avec la génération de textes à destination unique du référencement sur la base de mots-clés (contenu dit “SEO”). Pour ceux-là on pourra assez rapidement conclure que la messe est dite. 

Et cela ira très vite. 

D’ailleurs on commence légèrement à trembler chez Google. Il faut dire que déjà depuis un bon bout de temps, on observe une baisse de l’impact de la recherche dans les moteurs. Google s’est spécialisé en moteur de réponse (la fameuse “position zéro”) ce n’est plus un moteur de questionnement. 

La moitié des recherches n’en sont pas

Un des résultats est que la moitié des recherches sur le moteur n’en sont pas. Ajoutez à cela une masse conséquente de contenus de référencement pouvant être produite par ces milliers d’agences dites de « contenus SEO ». Je pense que vous arriverez à la conclusion que les moteurs de recherche seront encore plus noyés de ces contenus bas de gamme. 

IA
Avez-vous remarqué à quel point les robots sont standardisés par l’IA générative ?

Certainement que ces moteurs seront contraints de concevoir des réponses logicielles (similaires aux logiciels de détection de plagiat comme Turnitin) pour détecter et éliminer ces contenus indésirables. 

À la manière des jeux de chats et de souris qu’on observe dans la cybersécurité par exemple. Mais pour l’heure, j’imagine mal les moteurs être capables d’éliminer ces contenus automatiques.

À moins que la baudruche ne se dégonfle comme c’est souvent le cas après des effets démos. Retour au point no.1…

Les développeurs de ces logiciels de détection de plagiat dans les écoles vont également commencer à transpirer. 

Point no. 3 : Si tout le monde comprend votre sujet, où sera encore la valeur de votre contenu ?

De la même manière, si un sujet est trop accessible, trop concret, trop documenté ou trop couru. Dans ce cas il y aura de fortes chances pour que les bases de données soient déjà remplies d’informations à son sujet. Cela permet aux bots d’arriver assez rapidement à pondre des textes pseudovalides, qui sont en fait des accumulations de clichés pris ici ou là. Et/ou de la reformulation de contenus existants. Avec en prime, quelques élucubrations plus ou moins cohérentes et crédibles. 

Frankenstein artificiel. Nous nous sommes quelque peu égarés avec ce prompt Midjourney. Nous avons rendu notre robot écrivain agressif, ce qui est pourtant interdit par les responsables de l’appli. Notre bot a cependant beaucoup de retard sur les humains sur ce point. On remarquera au passage qu’il y a un « style » pour chaque IA générative d’images. Ce qui s’explique par les images qu’on lui a donné à digérer. Car ces images « hallucinées » (voir la vidéo explicative) ne sont pas sorties de nulle part. Et les premières poursuites sur l’usurpation des droits à la création sont déjà en cours.
Plus difficile dans le Business to Business

Dans le business to business, il sera plus difficile de tromper son monde. Il est peut-être des recoins de la production de contenus professionnels qui sont davantage du ressort de la comparaison ou de la documentation. Et qui seront plus impactés que d’autres. Il en est autrement des sujets très pointus. Pour ceux-là l’interprétation par l’expert, le spécialiste, qui vient donner du sens à des sujets très pointus, donc mal documentés, aura du mal à être produite par une moulinette statistique. 

Il n’est même pas certain que ces applications aient une quelconque utilité pour certains types de contenus. Comme ceux liés à l’expérience, aux anecdotes, au ressenti. Et pour lesquels la documentation est faible et les analyses complexes.

Une chose est certaine, c’est que pour subsister, le contenu de qualité en B2B devra devenir de plus en plus personnel et original, fouillé et authentique. Sans oublier les indispensables anecdotes du terrain qui lui donnent sa crédibilité.

Ceci n’est pas une nouveauté cependant. L’abondance de contenus que nous avons subie ces dernières années nous a déjà obligés à produire des narrations professionnelles sans cesse plus sophistiquées et originales. 

La production en masse d’un contenu médiocre

La production en masse d’un contenu médiocre par des machines ne fera qu’accentuer cette tendance. Mais cela ne s’arrête pas là. 

Revenons-en au référencement. Celui-ci pourrait bien être changé en profondeur par la multiplication de ces machines dites « génératives ».

Si les contenus disponibles sur l’Internet ouvert sont massivement suspectés d’avoir été produits par des machines, alors dans le marketing aux professionnels, mais aussi dans le domaine du grand public, la nécessité impérieuse reviendra de se référer à des sources fiables, identifiées, connues et reconnues

Point no. 4 : Médias, le retour… peut-être 

En d’autres termes, aux bons vieux « médias », ces sources d’information qui sont censées croiser les données et les comparer. Cela leur imposera de jouer à nouveau leur rôle de contrôle de l’information en s’interdisant scrupuleusement l’utilisation de la machine… sauf à en contrôler chacun des résultats de manière drastique. 

Pour comprendre comment fonctionnent les algorithmes dits « de diffusion », il faut regarder cette vidéo

L’abondance d’un bien en tuant systématiquement la valeur, on peut imaginer que la rareté redeviendra désirable. La valeur devrait donc changer de camp.

C’est en fait une bonne nouvelle pour les contenus de marque produits par ces professionnels qui sont des références sur leurs marchés. À condition qu’ils jouent le jeu et s’appliquent ces règles de contrôle et de sérieux drastique. 

Si les médias traditionnels, et professionnels, ne jouent pas ce rôle ou se bornent à singer les producteurs de contenu du Web, cela sera alors une chance encore bien plus grande offerte aux entreprises pour prendre cette place de marques médias

En conclusion, ne laissons pas l’IA générative ou « dégénérative » devenir le fossoyeur de la raison

Il y a quelques jours, un célèbre philosophe et ex-ministre de la Culture, discourait sur l’avenir de la connaissance et de l’éducation.

Il réagissait à chaud à un article du Monde sur les médias sociaux.

Et une autre explication du fonctionnement du NLP et notamment de ChatGPT3 

Un monde dystopique ou des examens trop banals ?

Il y décrivait un monde dystopique où, je cite, « En moins de 15 secondes, GPT passe un examen de droit difficile et « l’étudiant » n’est suspecté d’aucun plagiat ! ». Il est certain, je l’ai déjà écrit plus haut, que la détection de plagiats sera de plus en plus cruciale. 

Sauf que, passés l’effet de surprise et la lecture des émois des uns et des autres, on peut faire remarquer que dans l’article en question, le fameux « examen », lié au droit, paraît-il, n’est décrit nulle part, qu’on n’en connaît ni la teneur ni la difficulté.

Il se pourrait bien que la machine soit « intelligente ». C’est à débattre, il s’agit ici de statistiques donc il faudrait comprendre et connaître l’algorithme de la boîte noire OpenAI. Ou alors que ce soit un examen trop bas de gamme. « Recracher » des définitions par exemple. Pour cela, une machine le fera toujours mieux qu’un homme. 

La machine d’IA n’argumente pas bien, elle n’argumente pas du tout

Et si la machine « n’argumente » pas bien (bis repetita, c’est une machine elle n’argumente pas elle cherche, elle assemble et elle réorganise), pourquoi l’examinateur n’a-t-il pas testé ses élèves sur l’argumentation comme il se doit ?

Les thèmes comme le RGPD — apparemment inclus dans cet « examen » — sont sujets à de nombreuses interprétations, comme un débat récent autour de Camaïeu la démontré.

IA générative et dégénérescence des intelligences humaines

Bref, une seule chose est sûre à la lecture de cet article. C’est que son auteur sera bientôt remplacé par un robot. Car il ne raisonne pas beaucoup mieux que lui et est beaucoup plus lent.

IA générative
Inutile de vouer un culte à l’IA générative, mieux vaut raisonner calmement et faire la part des choses… même et surtout si on s’émerveille sur le caractère fabuleux de ces algorithmes.

Les autres continueront de passionner leurs publics. Ils lanceront des débats de fond et de créer de la valeur pour leurs clients. La véritable leçon de ce buzz hivernal est qu’il ne faut pas laisser des machines dites « génératives » amorcer la dégénérescence de nos intelligences humaines. 

Pour télécharger le livre blanc collectif de Digimind, c’est par ici :

Vous pouvez aussi vous inscrire au petit déjeuner du 16 février 2023 auquel nous interviendrons.

Yann Gourvennec
Follow me

Yann Gourvennec

Yann Gourvennec created visionarymarketing.com in 1996. He is a speaker and author of 6 books. In 2014 he went from intrapreneur to entrepreneur, when he created his digital marketing agency. ———————————————————— Yann Gourvennec a créé visionarymarketing.com en 1996. Il est conférencier et auteur de 6 livres. En 2014, il est passé d'intrapreneur à entrepreneur en créant son agence de marketing numérique. More »
Bouton retour en haut de la page