IA et Big Data

Éthique des données : ne pas laisser IA et Big Data aux mains des experts

La plupart des universités du monde proposent des cours sur la science des données, le machine learning et l’intelligence artificielle. N’est-il pas temps d’ajouter l’éthique des données à l’ordre du jour, à une époque où des géants de la technologie comme Facebook et Google – pour n’en nommer que quelques-uns – sont devenus des cibles familières pour le manque de respect envers les données de leurs utilisateurs ? Ou du moins pour leur incapacité à empêcher que de telles données ne soient volées par des acteurs externes comme le tristement célèbre Cambridge Analytica. Cette contribution constituera le cadre de ma présentation au nom du Business Analytics Institute à la conférence du CDEFI sur « Ethique et numérique« , le 6 juin à Toulouse.

Quelle est l’importance de l’éthique des données

Ethique des données
Nous avons tous nos croix à porter, mais Mark en porte une encore plus grande : celle de nos données volées par Cambridge Analytica, entre autres. Collage d’un artiste anonyme – Paris Janvier 2019]

Quelles questions doivent être abordées, quels thèmes doivent être explorés et comment la matière peut-elle être enseignée efficacement ?

L’éthique des données implique l’étude et l’adoption de pratiques, d’algorithmes et d’applications qui respectent les droits fondamentaux des personnes  et les valeurs de la société. L’importance des données dans les économies modernes se fait  chaque jour plus évidente.

Toutefois le succès, non seulement dans le domaine scientifique mais aussi dans le monde des affaires et pour la société en général, dépend de la connaissance des données existantes et de ce qu’elles représentent.

Il n’est pas étonnant que les universités du monde entier proposent aujourd’hui des spécialisations en data science, en machine learning et en intelligence artificielle.

Pourtant, laisser la data science aux seules mains des experts serait faire preuve à la fois de myopie et d’ignorance des dangers, tant les entreprises publiques et privées s’appuient de plus en plus sur l’analyse des données pour surveiller et évaluer presque tous les aspects de notre vie quotidienne.

L’éthique des données se limite-t-elle aux préoccupations concernant les escroqueries par courriel, l’utilisation abusive du microciblage et l’immoralité des fermes de trolls ?

Les universitaires de Cambridge ont monétisé leur recherche de données psychométriques pour prédire et influencer les préférences comportementales. Facebook a ainsi délibérément influé sur les timelines de sept cent mille de ses utilisateurs sans leur consentement.

Amazon a continué à commercialiser agressivement son outil de reconnaissance faciale Rekognition en dépit des interrogations sur la vie privée et les biais d’usage.

Les tribunaux recourent à des algorithmes pour établir le profilage des condamnés en termes de « risque » en fonction de la couleur de leur peau à chaque étape de la procédure judiciaire. Les employeurs recrutent à l’aide d’algorithmes qui, par nature, favorisent certains groupes socioéconomiques.

Les applications de la science des données ne peuvent pas être rejetées comme étant simplement  » business as usual « , car leurs conséquences éthiques conditionnent l’avenir des entreprises et de la société.

Quels types de problèmes essayons-nous de résoudre… 

lorsque l’on met en œuvre les techniques de la science des données pour automatiser des processus, interpréter des données sensorielles, maîtriser des relations conceptuelles ou influencer la dynamique environnementale ?

L’intelligence artificielle (IA) peut être distinguée de l’apprentissage automatique ou Machine Learning (ML) en comparant ses objectifs, ses méthodes et ses applications.

De par sa nature même, l’apprentissage automatique s’est historiquement concentré sur la production de nouvelles connaissances, alors que l’IA vise à remplacer l’intelligence humaine.

L’apprentissage par la machine utilise des algorithmes pour améliorer l’apprentissage supervisé, non supervisé ou renforcé, et l’IA utilise des algorithmes pour reproduire le comportement humain.

Les scientifiques des données déploient l’apprentissage machine pour mieux comprendre les tendances des données, ils espèrent que l’intelligence artificielle apportera la réponse à des problèmes complexes.

Si l’objectif du Machine Learning est d’améliorer notre capacité à prendre de meilleures décisions, celui de l’IA est de fournir la solution optimale. Les implications éthiques de la science des données dépendent des objectifs, des pratiques et des applications de chaque organisation.

L’éthique des données est-elle un sujet plus vaste que l’intelligence artificielle elle-même ?

Si la portée de l’intelligence artificielle est difficile à mesurer, son impact sociétal s’étend bien au-delà de la simple tentative de  » faire quelque chose d’utile avec le marécage croissant de données  » à notre disposition.

Les données ne sont-elles que de la technologie, l’IA peut-elle être réduite à une forme de logique expérimentale conçue pour guérir les maux de la vie moderne ?

Parce que l’intelligence artificielle reflète les visions, les préjugés et la logique de la prise de décision humaine, nous devons examiner dans quelle mesure l’intelligence artificielle peut être isolée des grands défis économiques et sociaux qu’elle a été conçue pour relever.

De nouveaux enjeux comme la protection de la vie privée, l’engagement du public à l’égard des données, les paramètres pertinents pour évaluer le progrès humain et la relation entre les données et la gouvernance suggèrent que les données conditionnent la façon dont nous voyons et évaluons le monde qui nous entoure.

Si les données ont peu de valeur tant qu’elles ne sont pas utilisées pour comprendre les actions décisives, l’éthique des données doit se concentrer moins sur les données et sur les algorithmes qui ont un impact sur la rationalité limitée qui définit les décisions humaines.

En somme, comme le suggèrent les partisans de la science ouverte, il n’y a pas d’opposition binaire entre données et action, seulement des interactions entre interventions et contextes.

Data Ethics
Nous sommes à la croisée des chemins. Soit nous suivons la voie de l’éthique des données, soit nous choisissons l’autre voie qui nous conduit à plus de vols de données et à moins de respect pour les utilisateurs. Cette question est vitale pour le monde numérique.

Quelles sont les matières qui doivent être abordées dans un programme d’études sur l’éthique des données ?

Comme l’illustrent les initiatives prises en Europe, au Brésil, en Inde, à Singapour et en Californie, les questions relatives aux renseignements personnels identifiables, au consentement explicite, ainsi qu’aux droits d’accès, de rectification et d’oubli doivent toutes être examinées.

Les biais implicites devraient aussi figurer dans les priorités ainsi que la compréhension de la manière dont les attitudes et les préjugés influencent notre compréhension des données, de la cognition, de la logique et de l’éthique.

Les questions de gouvernance entourant la transformation numérique pourraient être analysées, y compris la manière dont les managers et les organisations auxquelles ils appartiennent, s’emparent des données et en sont responsables.

L’impact de la technologie sur les processus de décision devrait également être discuté, car notre recours aux données a modifié en profondeur les définitions traditionnelles de  » liberté de choix « ,  » vie privée « ,  » véracité  » et  » confiance « .

Enfin, la compatibilité entre intelligence artificielle et innovation peut être examinée : notre recours au scientisme déprécie d’autres formes d’intelligence humaine, notamment l’intelligence émotionnelle (interpersonnelle), linguistique (intelligence des mots), intrapersonnelle (connaissance de soi) et spirituelle (existentielle).

Enfin, comment et où enseigner l’éthique des données ?

Comme point de départ, Rob Reich suggère que tous ceux qui sont formés pour devenir technologues devraient posséder un cadre éthique et social leur permettant de réfléchir aux implications de leur travail.

Pourtant, comme le démontrent les auditions parlementaires sur l’IA en France et en Allemagne, les étudiants qui se préparent à une carrière en politique publique et dans d’autres domaines gagneraient à mieux comprendre l’impact sociétal des sciences des données.

Plutôt que de proposer une liste de choses à « faire et ne pas faire » sur l’éthique des données, il serait préférable de s’inspirer des conséquences éthiques de la résolution de problèmes à partir des données.

En l’absence de cette liste universelle des choses à  » faire et ne pas faire « , Shannon Vallor soutient que les étudiants doivent acquérir une  » sagesse pratique «  pour relever les défis éthiques que posent les générations successives de technologies.

Si l’éthique des données ne pourra sans doute être  entièrement appréhendée à l’intérieur d’un seul cours, elle peut être mieux explorée dans un cadre appliqué à l’étude universitaire et à la recherche dans son ensemble.

C’est en ce sens que le Business Analytics Institute propose ce sujet de l’ « Ethique des données” aussi bien sous forme d’un module clé en mains que d’un cadre pédagogique. Si vous êtes intéressé, veuillez contacter ethics @ baieurope.com

Lee Schlenker

Lee Schlenker

Prof. Lee SCHLENKER teaches in the fields of Business Analytics and Community Management and is a Senior Consultant at the Business Analytics Institute.
Bouton retour en haut de la page