IA et Big Data

IA générative dans l’enseignement supérieur, état des lieux

et la fin de l'examen traditionnel

Alain Goudey est directeur de l’innovation numérique à Neoma Business School et co-auteur d’une étude académique à comité de lecture sur l’IA générative dans l’enseignement supérieur. Cette enquête porte sur la façon dont les étudiants, les enseignants et les doyens perçoivent la légitimité de l’IA générative dans les établissements français de formation au management. Ses conclusions sont à la fois rassurantes et dérangeantes.

Enseignement supérieur et IA générative : légitimité, paresse intellectuelle et la fin de l’examen traditionnel

L'IA générative dans l'enseignement supérieur
Le portrait qui se dégage d’une étude sur l’IA générative dans l’enseignement supérieur évoque ces attractions foraines qu’on appelle palais des glaces, où chaque partie prenante voit un problème différent et cherche une solution qui lui est propre. Toutes les illustrations de cet article ont été réalisées avec Midjourney.

Lorsqu’Alain Goudey et ses collègues ont commencé à enquêter sur l’enseignement supérieur français début 2024, ils ne cherchaient pas à trancher le débat sur l’IA générative bonne ou mauvaise. Ils voulaient comprendre quelque chose de plus précis : comment le même outil pouvait être simultanément valorisé, redouté, accepté et dénoncé, parfois par la même personne.

Leur étude, publiée dans Communications of the Association for Information Systems (CAIS), s’appuie sur des enquêtes menées auprès de 668 étudiants, 204 enseignants et 29 directeurs d’établissement (les « deans » du système anglo-saxon), complétées par 22 entretiens approfondis avec des enseignants ayant adopté l’IA en avance de phase. Ce qui en ressort évoque ces attractions foraines qu’on appelle palais des glaces : chaque partie prenante voit un problème différent et cherche une solution qui lui est propre.

Le point de départ est un chiffre qui aurait dû clore le débat. Entre 80 et 92 % des étudiants, selon l’établissement, utilisent déjà des outils d’IA générative dans leur travail universitaire. Ce chiffre a été atteint en à peine dix-huit mois après le lancement public de ChatGPT. L’outil n’a pas attendu l’autorisation des institutions. Il s’est déployé de lui-même. Et dans bien des cas, l’enseignement supérieur est encore en train de rédiger sa note de cadrage.

Le piège de la productivité

Alain met le doigt sur le fond du sujet d’emblée. Les étudiants apprécient l’IA générative pour sa rapidité, sa capacité à générer des idées et son rôle d’appui à l’apprentissage. Mais ils craignent aussi, et leurs établissements avec eux, ce que les chercheurs appellent la « paresse métacognitive » : l’érosion progressive de l’effort cognitif qui produit un apprentissage réel. Pour lui, ce n’est pas une contradiction à résoudre, c’est un défi de conception pédagogique.

« La résolution de ce problème passe par la conception des cours, où il faut réintroduire délibérément l’effort cognitif et la réflexion dans l’usage de l’IA générative en tant qu’outil, et non en tant que substitut à la cognition humaine ».

Un problème de posture

Le problème n’est pas la technologie, mais la posture que l’utilisateur adopte face à elle. Celui qui formule ce qu’Alain appelle une « requête naïve » obtient une réponse naïve : bien mise en forme, parfaitement médiocre. L’outil est capable de bien davantage, à condition que l’utilisateur apporte suffisamment de connaissances métier et d’esprit critique à l’échange.

« Il faut cultiver sa propre réflexion plutôt que de déléguer l’ensemble du processus à la machine ».

C’est, je l’ai souligné durant notre entretien, moins une question de prompt engineering que de discipline intellectuelle de base : savoir interroger la question avant de la poser. Les départements de philosophie enseignent cela depuis des siècles, sans se soucier de la mode.

L'IA générative dans l'enseignement supérieur
IA générative dans l’enseignement supérieur : les enseignants doivent former les étudiants aux outils d’IA générative et à leurs limites. Ils enseignent aussi l’Odyssée d’Homère et Frankenstein de Shelley dans le cadre du cursus de management. Image réalisée avec Midjourney.

Une autre vision de la culture numérique

Cette observation a conduit Alain à formuler une vision de la culture numérique qui tranche avec ce qu’on entend généralement. Le débat ne porte pas seulement sur la maîtrise technique des outils, il porte autant sur la connaissance suffisante du sujet pour juger si le résultat produit a une quelconque valeur. L’IA générative ne remplace pas l’expertise : elle amplifie celle que l’utilisateur porte déjà en lui.

Ce qui soulève une question dérangeante pour les établissements qui forment des diplômés sans leur donner l’occasion de développer cette expertise.

À Neoma, la réponse est délibérément double. Les enseignants forment les étudiants aux outils d’IA générative et à leurs limites. Ils enseignent aussi l’Odyssée d’Homère et Frankenstein de Shelley dans le cadre du cursus de management. L’objectif n’est pas l’enrichissement culturel pour lui-même : il s’agit de donner aux étudiants des modèles mentaux pour se représenter ce que peut être le leadership, ou ce qui arrive quand une création échappe aux intentions de son créateur.

Alain appelle cela « construire une infrastructure cognitive » :

« Nous devons permettre aux étudiants d’appréhender le monde à travers différents modèles, différents types de processus et cadres théoriques, afin de développer une véritable pensée critique sur ce que produit l’IA ».

Une école de management qui fait l’impasse sur ces fondements produit des diplômés capables de manier l’outil, mais incapables d’en évaluer les résultats.

Des examens qui mesuraient la mauvaise chose

C’est dans le domaine de l’évaluation que le problème apparaît le plus clairement. Un enseignant capable de produire un examen de deux heures en trois minutes fait face à des étudiants qui peuvent y répondre en un temps tout aussi court. La valeur de diagnostic de l’exercice s’est ainsi évaporée.

« Si ChatGPT ou n’importe quel outil d’IA générative peut réussir un examen, il faut repenser cet examen ».

La réponse d’Alain n’est pas un retour au papier-crayon, même s’il reconnaît que l’évaluation écrite en présentiel reste la solution la plus simple à portée de main.

Si un outil d’IA générative peut réussir un examen, il faut repenser cet examen. La valeur diagnostique de l’exercice traditionnel a disparu. Image réalisée avec Midjourney.

Sa réponse est structurelle : évaluer les compétences tout au long du cours plutôt que de mesurer l’acquisition de contenus en fin de parcours, via des évaluations plus fréquentes et à moindres enjeux.

Une solution ?

La résolution de problèmes en situation réelle, l’évaluation par le processus et les examens oraux en présentiel préservent une partie de ce que l’examen traditionnel était censé mesurer. Mais Alain est honnête sur les limites : aucun format n’est totalement à l’abri. Les modèles d’IA évoluent trop vite pour qu’une solution unique reste valable durablement. La bonne réponse n’est pas de trouver une formule définitive, mais de considérer la refonte des évaluations comme un travail permanent.

La conclusion de l’article va plus loin : ce que l’enseignement supérieur vend réellement devra peut-être changer. Si des contenus peuvent être récupérés, synthétisés et restitués à coût quasi nul par un outil accessible à quiconque dispose d’un navigateur, un diplôme qui certifie la maîtrise de ces contenus certifie quelque chose dont la valeur s’érode. Ce qui résiste à cette érosion, ce sont les compétences que l’IA ne peut pas encore reproduire de façon crédible : le jugement contextuel, le raisonnement éthique, la capacité à construire des cadres d’analyse et à les confronter à la réalité.

C’est aussi, en substance, la manière dont j’aborde l’enseignement de l’IA, que ce soit avec des étudiants d’écoles d’ingénieurs ou de commerce, notamment dans le cadre de mon cours à Omnes Education (qui en est désormais à sa quatrième année consécutive).

IA générative dans l’enseignement supérieur : une institution fragmentée

La réponse institutionnelle de l’enseignement supérieur à l’IA générative a été, pour le dire avec ménagement, inégale. Sciences Po a interdit ChatGPT en janvier 2023, avant de changer d’avis. Trente-cinq universités publiques françaises se sont associées à Mistral AI. Les établissements élaborent une charte nationale. Neoma, où Alain est directeur de l’innovation numérique, a été l’une des premières écoles de commerce françaises à formaliser son approche, en lançant un programme de formation des enseignants, du personnel et des étudiants autour d’un socle commun initial, avant de passer à des ateliers spécialisés sur la conception des cursus, l’évaluation et la refonte des expériences d’apprentissage.

Ce que la recherche révèle, c’est que cette activité institutionnelle ne résout pas un problème unique. Trois groupes de parties prenantes tentent chacun de résoudre leur propre version du problème sous le même intitulé.

Les étudiants veulent des règles et une formation à la culture de l’IA. De leur côté, les enseignants développent leurs propres approches pédagogiques via des ateliers entre pairs. Les doyens définissent les politiques et négocient les infrastructures souveraines. Les préoccupations s’échelonnent dans une direction prévisible : la performance académique individuelle pour les étudiants, l’intégrité des évaluations pour les enseignants, la réputation institutionnelle pour les doyens. Ces trois groupes ne sont pas toujours en dialogue.

L’objectif, tel que Neoma l’a mis en pratique, est de réunir les trois publics autour de la technologie sous un cadrage partagé, suffisamment tôt pour qu’aucun groupe ne puisse s’enfermer dans une position rendant toute coordination ultérieure impossible.

La question de l’équité

La question de l’équité traverse ces trois niveaux. L’accès aux modèles d’IA haut de gamme n’est pas gratuit. Lorsque j’ai soulevé la question de l’écart entre les abonnements de base et les offres professionnelles, la réponse d’Alain est révélatrice : le problème d’infrastructure est réel, mais secondaire.

« La plus grande inégalité ne porte pas sur l’accès à l’outil, mais sur la capacité à l’utiliser correctement ».

À Neoma, le partenariat institutionnel avec Mistral donne à tous les étudiants accès à un outil de niveau professionnel. Ce que montrent les données, même à accès égal, c’est un fossé important entre les étudiants qui utilisent l’IA générative pour obtenir la réponse la plus rapide possible et ceux qui s’en servent pour approfondir leur réflexion. Ce fossé ne se comble pas par l’égalisation des abonnements.

Même si je partage l’essentiel de ce qu’Alain avance, je pense que la hausse des prix des modèles haut de gamme est prévisible. Elle tient à l’écart entre les investissements consentis et les retours commerciaux obtenus. Cela conduira quasi inévitablement à une fracture économique entre ceux qui ont les moyens et ceux qui ne les ont pas. Il suffit de regarder la grille tarifaire de Claude d’Anthropic pour s’en convaincre. Au-delà du modèle Pro, très limité en termes d’usage de tokens, notamment si l’on utilise le modèle Opus 4.6 plus sophistiqué, les tarifs atteignent déjà 1 200 € par an. Ce n’est pas une somme négligeable, d’autant plus préoccupante à l’heure où Claude s’impose rapidement comme la référence pour les utilisateurs soucieux de qualité.

Tarifs de Claude
Quel sera l’impact des prix vertigineux de l’IA générative sur l’enseignement supérieur ?

Le problème des « héros de l’IA »

L’une des formulations les plus frappantes qui ressort des travaux d’Alain est ce qu’il appelle le phénomène des « héros de l’IA ». Dans les établissements d’enseignement supérieur français, certains enseignants font un travail pédagogique excellent et innovant avec l’IA générative : ils conçoivent de nouveaux formats d’évaluation, animent des ateliers, repensent des modules entiers autour de l’apprentissage augmenté par l’IA. Ils produisent des résultats. Et ils le font en grande partie seuls, sans reconnaissance institutionnelle, sans incitations de carrière, sans aucun mécanisme pour partager ce qu’ils ont appris.

Les incitations sont mal calibrées. Dans l’enseignement supérieur, c’est la production de recherche qui est récompensée, pas la conception pédagogique, du moins pas de la même façon. Un enseignant pionnier qui repense entièrement un programme autour des compétences liées à l’IA générative recevra peut-être moins de reconnaissance professionnelle qu’un collègue qui publie un seul article dans une revue.

« Nous devons aider tous ces héros de l’IA à obtenir davantage de considération pour l’innovation pédagogique, ce qui n’est pas nécessairement le cas par défaut dans l’enseignement supérieur ».

Le risque, si rien n’est fait, est l’émergence d’un système à deux vitesses : une minorité d’enseignants à l’aise avec le numérique qui tirent leurs étudiants vers l’avant, tandis que la majorité reste à la traîne, ni formée ni encouragée à s’engager. L’innovation de terrain est réelle et précieuse. Sans structures institutionnelles pour la reconnaître, la valoriser et la reproduire, elle reste une exception plutôt qu’un modèle.

IA générative dans l’enseignement supérieur : quand la légitimité s’effrite

L’armature théorique de l’étude repose sur le modèle triadique de légitimité de Suchman, qui distingue la légitimité pragmatique (l’outil sert-il mes intérêts ?), la légitimité morale (est-il conforme à mes valeurs ?) et la légitimité cognitive (est-il tenu pour acquis dans la façon dont les choses fonctionnent ?). Ce modèle a été conçu pour des technologies adoptées progressivement. L’IA générative l’a mis à l’épreuve dans des conditions d’adoption massive quasi instantanée. Alain et ses co-auteurs n’y voient pas une raison de rejeter le cadre, mais une occasion de l’enrichir : ils introduisent un continuum légitimité-illégitimité plutôt qu’une simple alternative binaire.

Ce que révèlent les étudiants

Le résultat qu’Alain décrit comme l’asymétrie la plus notable dans les données concerne la dimension morale chez les étudiants. Les plus grands utilisateurs d’IA générative n’accordent aucune légitimité morale à ces outils dans un contexte académique. Ils les associent, avec une forte fréquence, à la triche, au plagiat, à la dévaluation des diplômes et à l’injustice. Ils utilisent un outil qu’ils considèrent comme éthiquement compromis. Ce n’est manifestement pas tenable.

Sur ce point, Alain a une opinion très différente.

« Utiliser l’IA générative ne constitue pas nécessairement de la triche. Cela dépend entièrement de la façon dont on l’utilise et à quelle fin ».

L’échec institutionnel, selon lui, tient au fait que les établissements n’ont pas fait suffisamment pour modifier la perception que les étudiants ont de la technologie.

Ce que révèlent les enseignants

Les enseignants offrent un tableau plus complet. Les six dimensions de légitimité et d’illégitimité sont présentes dans leurs réponses. Ils reconnaissent l’utilité de ces outils tout en mettant en doute leur fiabilité, les jugent professionnellement nécessaires tout en trouvant leur architecture opaque, et invoquent leur potentiel inclusif tout en signalant la paresse intellectuelle et l’érosion de la pensée critique comme leur préoccupation la plus fréquemment citée : 58 occurrences dans le corpus qualitatif.

Ce que révèlent les directions pédagogiques

Pour les directions de ces institutions, le thème dominant est stratégique. La pression concurrentielle, la crainte de se laisser distancer et les gains d’efficacité dans les flux administratifs génèrent une légitimité pragmatique et cognitive. Ce qui introduit de l’illégitimité, ce sont les risques liés à la gouvernance : protection des données, surconfiance dans les résultats produits par l’IA, menace pour l’intégrité des évaluations à l’échelle institutionnelle.

Le mouvement théorique le plus significatif de l’article consiste à traiter l’illégitimité comme une catégorie analytique à part entière, et non comme la simple absence de légitimité. L’argument, emprunté à la théorie du changement, est que les signaux d’illégitimité doivent être lus comme des signaux d’alerte qui appellent une réaction rapide. Un établissement qui interprète le malaise moral des étudiants vis-à-vis de l’IA générative comme un simple problème de communication passe à côté du signal. Ce malaise dit quelque chose sur ce que le cursus enseigne réellement, et sur ce que l’évaluation mesure effectivement.

Lorsque les étudiants associent l’IA générative à la triche, à l’injustice et à la dévaluation des diplômes, ils ne sont pas irrationnels. Ils se trouvent dans les phases de déni et de résistance du modèle de changement de Scott et Jaffe. Les établissements ne peuvent pas se contenter d’étouffer ce signal : ils doivent traiter ce qu’il révèle.

L'IA générative dans l'enseignement supérieur

Source : adapté de Scott & Jaffe, « Survive and Thrive in Times of Change », tracé avec Claude. Voir : expertprogrammanagement.com/2018/05/scott-and-jaffe-change-model/

France, souveraineté et course mondiale

Le contexte français ajoute une couche de complexité que la recherche saisit avec précision statistique et nuance qualitative. Sur le plan quantitatif, l’analyse n’a révélé aucune différence statistiquement significative dans la dynamique d’adoption de l’IA générative entre les universités publiques et les écoles de commerce. Sur le plan qualitatif, les choses diffèrent. Les écoles de commerce évoluant dans un marché très concurrentiel, ont avancé plus vite. Les universités publiques se sont mobilisées de façon plus systématique autour de la gouvernance, de la souveraineté et des infrastructures collectives, comme en témoigne l’alliance de 35 établissements avec Mistral AI et EdTech France.

Alain n’y voit pas une contradiction, mais une division du travail qui, bien gérée, pourrait constituer un véritable atout.

« Nous devons jouer collectif, parce que la compétition est mondiale ».

La question de l’infrastructure d’IA souveraine, notamment la fédération ILaaS et le partenariat du ministère de l’Enseignement supérieur avec Mistral, déployé dans 26 universités pilotes depuis septembre 2025, n’est pas simplement symbolique. Il s’agit de permettre aux établissements français d’exploiter, de gouverner et d’adapter leurs outils d’IA sans dépendance envers des fournisseurs dont la tarification, les conditions et les capacités peuvent évoluer à tout moment.

Encore faut-il que l’effet d’entraînement vers tel ou tel outil ne devienne pas trop fort. En ce moment, il est difficile de résister à l’envie d’utiliser Claude d’Anthropic quand tout le monde loue la qualité de son code et de ses résultats.

Et le reste du monde ?

La comparaison internationale est difficile à ignorer. Singapour, la Corée du Sud et les Émirats arabes unis intègrent la maîtrise de l’IA comme compétence nationale fondamentale dès le secondaire. Le regard d’Alain est direct : les décideurs publics français ne sont pas encore suffisamment préparés à l’ampleur de ce qui vient.

« Avoir moins de personnes compétentes en IA que dans d’autres parties du monde est très dangereux pour notre économie et pour l’ensemble de nos organisations ».

Le réflexe réglementaire, profondément ancré dans la culture politique européenne, n’est pas sans fondement. Prendre le temps de réguler de façon responsable a de la valeur. Mais cela ne peut pas se substituer à la rapidité d’adoption au niveau des compétences et des cursus.

La question qui encadre la recherche

L’entretien se termine, comme il se doit, par la méta-question : qu’est-ce que cela signifie d’étudier la légitimité de l’IA générative en utilisant l’IA générative ? L’équipe d’Alain a utilisé ChatGPT, Perplexity, NotebookLM et OpenAI O3 dans le processus de recherche, et l’a indiqué explicitement dans la déclaration d’utilisation de l’article. Sa réponse à la question des biais est prudente. Chaque étape de l’analyse a impliqué un codeur humain. L’équipe a confronté le codage assisté par IA à une analyse indépendante préalable des mêmes données, réalisée pour un rapport institutionnel français, puis comparé les deux séries.

« Il faut être transparent sur l’usage que l’on fait de ces outils, pour quel objectif, à chaque étape ».

Cette déclaration était un choix délibéré, précisément parce que le sujet de l’article rendait toute autre approche intenable.

Utiliser l’IA pour améliorer la qualité d’un texte et l’utiliser pour en générer un que l’on présente ensuite comme le sien sont deux choses différentes. Techniquement, c’est une question de degré. Dans les faits, c’est la différence entre un travail assumé et une abdication. L’équipe d’Alain a su naviguer entre les deux pour publier. La plupart des étudiants de son corpus cherchent encore à tracer cette ligne, dans un environnement où personne ne l’a clairement expliquée et où les outils d’évaluation n’ont pas encore été reconstruits pour lui donner du sens.

Trois recommandations, une par partie prenante

Lorsqu’on lui a demandé une recommandation concrète par groupe de parties prenantes, les réponses d’Alain ont été sans ambiguïté.

Pour les étudiants : associer la culture technique de l’IA, comprendre le fonctionnement des outils et connaître leurs modes de défaillance, à une réflexion critique et éthique authentique sur les résultats produits. Ni l’une ni l’autre de ces dimensions ne suffit seule. Un étudiant capable de formuler des requêtes avec fluidité mais incapable d’évaluer le résultat n’a rien appris d’utile.

Pour les enseignants : ces enseignants pionniers, que lui-même appelle les « héros de l’IA », ne peuvent pas être laissés à opérer seuls. Les établissements doivent créer les conditions du partage des bonnes pratiques au sein de la communauté enseignante, et accorder à l’innovation pédagogique la reconnaissance professionnelle qui lui fait actuellement défaut. Un enseignant qui repense de fond en comble son dispositif d’évaluation mérite au moins autant de crédit institutionnel qu’un collègue qui soumet une communication à un colloque.

Pour les dirigeants institutionnels : un cadre politique à plusieurs niveaux n’est pas une option. Les étudiants, les enseignants et le personnel administratif n’abordent pas l’IA générative depuis le même angle, et une politique unique imposée de haut en bas ne satisfera aucun d’eux. La direction doit gérer ces trois dimensions en même temps, et ouvrir un dialogue véritable entre les groupes avant qu’une crise ne force la main.

« Les doyens doivent penser à toutes ces dimensions en même temps, et c’est là la partie difficile de l’histoire autour de l’intelligence artificielle ».

Des trois niveaux, Alain identifie le niveau institutionnel comme le plus urgent. Les étudiants et les enseignants s’adaptent déjà, imparfaitement, en temps réel. Les cadres institutionnels qui permettraient de donner un sens et une direction à ces adaptations restent, dans la plupart des cas, à construire.

L’urgence n’est pas exagérée. La complexité non plus. Le défi d’intégrer l’IA générative de façon responsable dans l’enseignement supérieur est un défi qu’aucun établissement ne peut se permettre d’ignorer, ni de relever seul.


Alain Goudey est professeur et directeur de l’innovation numérique à Neoma Business School. Il est co-auteur de « Legitimacy and Illegitimacy of Generative Artificial Intelligence in Higher Education: Perceptions from the French Management Context », publié dans les Communications of the Association for Information Systems.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page