Avec Mistral AI, c'est l'autre pépite française de l'intelligence artificielle. Cette plateforme collaborative franco-américaine partage plus de 500 000 modèles d'IA en open source. Explications avec son cofondateur, Thomas Wolf.
Comment est née Hugging Face ?
On s'est créé en 2016. Au début, on fabriquait un jeu vidéo, d'où le nom un peu amusant. Hugging Face, c'est l'emoji avec des mains de chaque côté. Puis, en 2019, on a pivoté vers l'open source et la création d'outils pour les développeurs d'IA. C'est une entreprise de droit américain mais créée par trois Français. On a donc une culture et un cœur très français. D'ailleurs, l'open source est une valeur très française et on a des champions ici. Notre bureau français, qui était tout petit avant l'IA, est devenu le centre gravitationnel de la boîte. Aujourd'hui, on compte plus de 11 millions d'utilisateurs dans le monde.
Quels sont les avantages des modèles d'IA en source ouverte ?
C'est un modèle qu'on peut inspecter. Il y a une transparence qui est très utile, qui peut même aller jusqu'à la transparence des données d'entraînement, ce qui permet de comprendre quelles données ont été utilisées pour créer le modèle. Concernant la sécurité, ce qui est très intéressant, c'est qu'un modèle ouvert, vous pouvez l'avoir sur vos serveurs. Vous n'êtes pas obligés d'utiliser les serveurs d'une entreprise américaine qui veut garder son modèle fermé. On peut aussi choisir des modèles plus petits, les adapter à son cas d'utilisation particulier et obtenir des performances égales à un modèle très gros comme GPT-4 (de l'acteur incontournable OpenAI, ndlr). On peut très facilement les contrôler et réduire les coûts parce que le modèle est plus petit.
Qui sont vos partenaires ?
On en a énormément, au point qu'on nous surnomme pafois "la Suisse de l'IA". Amazon Web Services (AWS, l'outil de création et de déploiement d'applications d'intelligence artificielle générative d'Amazon, ndlr) est l'un de nos partenaires historiques. On est partenaire avec tous les gros fournisseurs de cloud, comme Google et Microsoft, et on est aussi avec tous les créateurs de processeurs, comme Nvidia, AMD, Intel ou IBM. On collabore aussi avec tous les créateurs de modèles d'IA, comme Mistral. Ils créent de très bons modèles ouverts donc on est très content qu'ils soient dans la communauté.
Comment voyez-vous l'évolution de l'IA générative à court terme ?
2023, ça a été la révolution des modèles de texte. On s'est rendu compte qu'on pouvait faire déjà énormément de choses avec du texte. 2024, c'est l'extension à toutes les autres modalités. On a des modèles d'image qui s'intègrent désormais dans les modèles de texte, on a des modèles de vidéo. On a des modèles qui deviennent multimodaux, c'est-à-dire qu'au-delà du texte, ils sont capables d'utiliser l'image, la vidéo, le son et bientôt la robotique.
La France peut-elle encore rivaliser avec les géants américains et chinois ?
Oui, je suis très optimiste là-dessus. C'est très sain de voir l'Europe, la France en particulier mais l'Europe de façon plus générale, remonter très fort dans la course à l'IA ces derniers mois. Je pense qu'on a énormément de talents et, sur le financement, on voit que, maintenant, on peut aussi faire des grosses entreprises en Europe. Il fallait quelques exemples pour lancer la pompe et on commence à les avoir.