Le smartphone est-il l’avenir de l’IA générative ?
Lors du XYZ Paris qui s’est déroulé à Station F le 27 septembre 2024, George Tsirtsis de Qualcomm a souligné le problème de l’IA, à savoir l’évolutivité, et a esquissé une nouvelle voie pour l’avenir de cette technologie : l’IA générative sur smartphone. Pour le fabricant de puces, l’avenir n’est pas le cloud mais votre bon vieux portable (de préférence équipé de ses puces).
Et si l’IA générative sur smartphone était l’avenir ?
L’IA générative a un problème d’évolutivité
Permettez-moi d’aller « droit au but », a déclaré Tsirtsis, « l’IA générative a un problème de passage à l’échelle ». Le problème vient du simple fait que le calcul pour servir les requêtes d’IA générative, et pour y répondre, est beaucoup plus élevé qu’une recherche traditionnelle sur le web, environ 10 fois plus, et encore, c’est une estimation prudente ».
Des problèmes de taille
C’est même pire que cela, selon le directeur principal de la technologie de Qualcomm Europe.
« Lorsque vous allez sur ChatGPT ou tout autre assistant propulsé par l’IA, le calcul et l’électricité utilisés sont beaucoup plus élevés que pour les sites webLe site web B2B est la vitrine digitale de votre entreprise. C'est le moyen le plus simple et efficace de présenter les produits et services de votre entreprise à vos futurs clients. traditionnels. Il faut multiplier ce chiffre par 10 du fait du déluge d’applications et de fonctions alimentées par l’IA générative et le multiplier à nouveau par les milliards d’utilisateurs de cette technologie. »
Les développeurs peuvent travailler différemment
La bonne nouvelle, c’est que lorsque l’on comprend qu’il y a un problème, il est plus facile de trouver des solutions. Qualcomm pense que la réponse à cet énorme équation est… votre smartphone.
« La solution consiste à distribuer les calculs à la périphérie. L’avenir est clairement hybride », a poursuivi M. Tsirtsis, « nous aurons affaire à de très grands modèles dans le nuage et à de plus petits modèles à la périphérie (SLM ou Smaller Large Models) ».
« Les SLM ne sont pas si petits que cela », nous a expliqué M. Tsirtsis. « Il s’agit de modèles faits de 10 à 15 milliards de paramètres avec des dizaines de milliers de fenêtres contextuelles symboliques. Il y a quelques jours, Meta a annoncé la dernière génération de LAMA 3.2, un modèle à 1 milliard de paramètres, à 3 milliards de paramètres et un modèle multimodal à 11 milliards de paramètres.
Mais tous ces SLM peuvent fonctionner sur des smartphones, et « ils peuvent fonctionner très efficacement ».
Les données restent elles aussi sur votre appareil
Il ne s’agit pas seulement d’efficacité. La confidentialité des données fait également partie de l’équation. « L’autre grand avantage pour vous, en tant que développeur ou entrepreneur, est que vous pouvez vous assurer que les données sensibles de vos clients restent sur l’appareil », a-t-il ajouté.
Une plateforme pour faciliter la vie des développeurs
Qualcomm insiste sur le fait que sa nouvelle architecture pour l’IA générative n’est pas une utopie. Elle est là et elle fonctionne. « L’IA sur smartphone est déjà là », a déclaré le représentant de Qualcomm. .
« Il y a plus de 100 modèles qui ont déjà été optimisés pour nos différentes plateformes matérielles et vous pouvez même charger votre propre modèle et l’optimiser sur place. Les développeurs peuvent tester leurs applications sur n’importe lequel des nombreux appareils que nous mettons à disposition dans la ferme d’appareils accessible en ligne. Ils n’ont pas besoin d’acheter tous les différents smartphones existants pour tester leurs applications ».
À cette fin, Qualcomm a lancé une plate-forme en ligne dédiée aux développeurs sur aihub.qualcomm.com.
L’avenir nous dira si cela résout l’énigme de l’évolutivité de la GenAI, mais il y a au moins un peu de lumière au bout du tunnel de l’IA.
- Accessibilité des sites Web - 11/10/2024
- 9 conseils pour mettre en œuvre le changement - 10/10/2024
- Le mécénat d’entreprise réinventé par une start-up innovante - 09/10/2024