Rares, chères et indispensables, les cartes graphiques, pierres angulaires du développement d'intelligences artificielles (IA), font l'objet d'une sévère concurrence entre les opérateurs européens de cloud, qui misent sur une importante puissance de calcul à louer à leurs clients, dans un contexte de tension d'approvisionnements.
La guerre à l'armement a commencé. À l'ère de l'IA, les géants du cloud veulent faire main basse sur les cartes graphiques. A huit jours d'intervalle fin janvier, deux entreprises françaises, OVHcloud et Scaleway (filiale du groupe Iliad, propriété de l'homme d'affaires Xavier Niel), ont annoncé mettre à disposition de nouveaux processeurs graphiques (GPU en anglais, des unités de calcul beaucoup plus rapides et puissantes qu'un microprocesseur classique) de la marque américaine Nvidia. Une fois acquises par ces sociétés, ces GPU peuvent être louées à distance par des clients souhaitant développer des modèles d'IA, avec des forfaits à l'heure, voire à la minute. Le principe est largement répandu en Europe: le géant allemand SAP comme la petite start-up britannique Ori tentent ainsi d'exister face aux poids lourds américains Google, Amazon et Microsoft.
Face à la concurrence de ces mastodontes qui, selon l'Autorité française de la concurrence, représentaient « 80% de la croissance des dépenses en infrastructures et applications de services cloud public en France » en 2021, les Européens jouent la carte de la souveraineté. Si la start-up française Mistral AI, qui veut s'imposer comme alternative européenne au leader américain OpenAI, a notamment choisi d'entraîner son modèle Mixtral chez Scaleway, « c'est aussi une question d'image », relève Hanan Ouazan, associé chez Artefact, une entreprise de conseil en data et IA. « L'argument de la souveraineté tomberait à l'eau si toutes les données se retrouvaient sur des serveurs américains ».
Apparues en 1999 et d'abord utilisées dans les jeux vidéo, les cartes graphiques connaissent aujourd'hui un second souffle. « Il n'y a pas d'alternative pour faire de l'IA générative que d'utiliser des GPU », explique Hanan Ouazan. Mais leur coût est élevé : si le prix du modèle star H100, commercialisé par Nvidia, n'est pas communiqué, il serait vendu environ 40 000 dollars, selon l'estimation la plus courante sur le marché. Or un seul GPU est loin d'être suffisant pour développer une IA élaborée, et leur maintenance est aussi une affaire délicate.
Opacité
Le cloud devient donc une solution intéressante pour les développeurs d'IA, y compris les plus importants, tels Mistral AI. Toutefois, les plateformes de cloud n'échappent pas aux tensions d'approvisionnement récurrentes sur le marché des matériaux semi-conducteurs, sur lesquels sont basés les GPU. Chaque opérateur tente donc de tirer son épingle du jeu pour bénéficier des livraisons des dernières cartes graphiques. Incontournable, Nvidia représentait 82% des GPU livrés dans le monde fin 2022, d'après le cabinet californien Jon Peddie Research. Contactée par l'AFP, l'entreprise n'a pas confirmé mais affiche sur son site plusieurs centaines de « partenaires » en Europe, un statut qui semble loin de garantir un lien privilégié.
« Ce qui fait la différence, c'est l'expertise technique: face à des GPU qui sont extrêmement rares, la pire chose qui puisse arriver à Nvidia, c'est quelqu'un qui achète des GPU et qui ne sait pas les mettre à disposition des gens qui en ont besoin », plaide Damien Lucas, directeur général de Scaleway. David Chassan, directeur de la stratégie d'Outscale, filiale de Dassault spécialisée dans le cloud, vante lui une « relation très proche avec Nvidia », qui permet à l'entreprise d'anticiper les besoins et disponibilités sur un an.
Les plateformes entretiennent également une certaine opacité, refusant de révéler le nombre de GPU, et de modèles H100, qu'elles possèdent. « Dans ce milieu-là, pour exister, il faut compter en milliers », concède néanmoins le directeur général de Scaleway, qui précise que son entreprise a réalisé en 2023 un investissement de 100 millions d'euros dans l'IA, essentiellement dirigé vers l'acquisition de GPU. Malgré cette accumulation, et la flexibilité promise par les clouds, la rareté de la ressource se fait toujours sentir pour les développeurs. « Nous avons des clients qui investissent directement dans des GPU, parce qu'ils ne peuvent pas avoir de quotas d'utilisation réservés à moins de s'engager auprès d'un fournisseur de cloud à utiliser des GPU pour un montant assez élevé », remarque Hanan Ouazan