Face à ChatGPT, édité par OpenAI, Bard, la réplique de Google, ou les autres concurrents des grandes plateformes mondiales, l’Europe tente d’exister avec tout un écosystème de start-up. Plus petites, mais bien présentes.
« Le lancement de chatGPT a tout changé. C’est un moment de réveil pour les entreprises européennes. Mais la bataille de l’IA générative n’est pas perdue ». Comme Laurent Daudet, de la start-up française LightOn, des chercheurs-entrepreneurs européens se lancent à la conquête du marché prometteur de l’intelligence artificielle. Depuis quelques semaines, les géants américains de la tech rivalisent de modèles capables de produire du texte ou des images. En tête, ChatGPT et son modèle GPT-3, créé par la société OpenAI alliée à Microsoft. Google, Amazon, Meta (Facebook) et Apple sont en embuscade. Sans oublier le chinois Baidu.
En Europe, faute de géants, des dizaines de start-up sortent leurs propres outils, allant des concepteurs d’applis basées sur des modèles d’IA existants à celles, bien plus rares, qui entraînent leurs propres modèles. Mais tous sont nourris des milliers de lignes de codes partagées librement (en « open source ») par des chercheurs européens et américains, y compris issus des « Big tech ».
Parmi les plus importants figurent l’allemand Aleph Alpha et son modèle multimédia, ainsi que le français Bloom, modèle en open source soutenu par le CNRS, conçu par un consortium de chercheurs internationaux réunis par la start-up franco-américaine Hugging Face. De nombreuses sociétés européennes lancent des outils spécialisés, comme Stable Diffusion (génération d’images), la suédoise Sana Labs (gestion de l’information) ou la néerlandaise Creative Fabrica (génération de visuels). D’autres proposent des plateformes de modèles, comme Dust. Toutes lèvent des fonds mais qui se chiffrent en dizaines de millions d’euros, loin des milliards de dollars de Microsoft, Google et Meta.
Lire aussi : « Pour certains métiers, ChatGPT va être un choc »
Pourtant, les Européens sont convaincus de pouvoir relever le gant. « Nous allons lancer cette année un modèle de 300 milliards de paramètres, quand GPT-3 n’en a que 175 milliards. Et nous avons inventé la multimodalité : les requêtes et les réponses peuvent combiner textes et images », explique à l’AFP le fondateur d’Aleph Alpha, Jonas Andrulis. « C’est un marché de milliards de dollars. Nous accélérons pour survivre face à Microsoft, notre concurrent sur le marché des entreprises », dit-il, précisant n’avoir « que très peu d’aide de l’UE ». « Nos modèles de base sont aussi performants que GPT-3 ou DeepMind de Google », assure de son côté Laurent Daudet, cofondateur de LightOn. « Le nombre d’usages est phénoménal, le conversationnel en est un, mais on ne va pas se battre sur ce terrain où les Américains excellent. On va proposer des contenus pour les entreprises : synthèse de documents, résumés d’échanges de mail, rédaction de notices spécialisées… »
Bloom aligne 176 milliards de paramètres, un peu plus que GPT-3, mais sans outil de conversation (« chatbot »). « L’Europe est un peu à la ramasse mais, d’ici la fin de l’année, Bloom aura un chat conversationnel de grande qualité », assure Teven Le Scao, d’Hugging Face. Certains parient sur le grand public, comme Pablo Ducru, chercheur au MIT qui prépare une application capable de générer textes, images et musiques inspirés par un artiste qui recevra des royalties. « Chacun créera son contenu », s’enthousiasme le cofondateur de Raive, installé aux États-Unis pour faciliter sa recherche de fonds.
La concurrence est rude
Beaucoup d’IA européennes sont multilingues. Bloom gère les sept langues les plus parlées du monde, dont le français, l’anglais, l’espagnol et le chinois. Aleph Alpha en gère cinq. Avantage : les Européens préfèrent un outil qui parle leur langue. Mais la qualité des productions dépend de la taille du corpus de textes d’entraînement, plus large pour l’anglais. « Nos clients préfèrent GPT-3 pour les textes en anglais et notre modèle pour l’allemand et le français », reconnaît le fondateur d’Aleph Alpha.
Autre inquiétude, le partage de code en licence ouverte, élément fondateur de toutes les IA existantes, se raréfie avec la concurrence qui se durcit. « C’était à la fois de la compétition et de la collaboration », note Teven Le Scao. Pour créer des IA, pas besoin de grandes équipes mais l’Europe doit avoir trois choses, résume Pablo Ducru. « D’abord, la puissance de calcul, qui coûte cher. Puis l’accès aux données pour l’entraînement. Enfin, des talents, d’où la question des rémunérations ».
L’élément qui fera la différence pourrait aussi être le retour des utilisateurs, indispensable pour améliorer les résultats. ChatGPT, qui bénéficie d’interactions avec plus de 100 millions d’internautes, pourrait ainsi creuser son écart.