OpenAI s’accorde avec Reddit pour entraîner ses modèles d’IA

Publié le 17 mai 2024

2 min de lecture

Par AM/AFP

Reddit et OpenAI deviendront également partenaires publicitaires.

Régulièrement accusé par des médias, des auteurs et des artistes de violer le droit d’auteur pour alimenter ses modèles, OpenAI va pouvoir utiliser en temps réel les messages et conversations publiées sur Reddit pour enrichir ses services d’IA générative. Les deux entreprises ont signé un accord en ce sens.

OpenAI va avoir accès aux échanges des utilisateurs du réseau social Reddit pour entraîner ses modèles d’intelligence artificielle générative, une étape importante pour l’entreprise accusée par de nombreux auteurs et éditeurs d’avoir pillé internet pour créer des programmes comme ChatGPT.

Les deux entreprises ont annoncé l’accord jeudi 16 mai, sans divulguer de montant. Il prévoit qu’OpenAI puisse utiliser en temps réel les messages et conversations publiées sur Reddit pour enrichir ses services d’IA générative (production de contenus sur simple requête en langage courant). En échange, Reddit va ajouter des outils d’IA à sa plateforme de discussions pour les utilisateurs et les modérateurs, des fonctionnalités qui reposeront sur les modèles d’OpenAI.

« Reddit est devenue l’une des plus grandes archives ouvertes de conversations humaines authentiques, pertinentes et toujours à jour sur tout et n’importe quoi », a déclaré le patron de Reddit, Steve Huffman, cité dans le communiqué. « L’inclure dans ChatGPT […] va aider les gens à trouver plus facilement ce qu’ils cherchent sur internet, et aider de nouveaux publics à trouver leur communauté sur Reddit ». OpenAI deviendra en outre un partenaire publicitaire de Reddit. La plateforme a déjà passé un accord similaire avec Google en février.

Reddit pas profitable

Le réseau social fondé en 2005 et entré en Bourse en mars dernier compte environ 100 000 forums et plus de 267 millions d’utilisateurs hebdomadaires. Malgré son succès auprès du public, il n’a jamais réussi à dégager de profits, et ses dirigeants cherchent à tirer parti des besoins des géants technologiques en matières premières - les contenus créés par des humains - pour entraîner leurs modèles d’IA générative.

En juin dernier, Reddit avait relevé les tarifs demandés aux éditeurs tiers pour utiliser les données et conversations postées sur ses forums, afin d’empêcher les géants du secteur (OpenAI, Google, Microsoft…) d’exploiter gratuitement ces contenus. La décision avait suscité un tollé, car de nombreux petits développeurs ont conçu des applications liées à la plateforme sur la base de prix modérés, voire de l’accès gratuit à son interface de programmation (API).

OpenAI et ses concurrents font de leur côté face aux plaintes d’auteurs, d’artistes et d’organisations de presse, dont le New York Times, qui accusent les groupes d’avoir violé leurs droits d’auteur pour alimenter leurs modèles. Par ailleurs, OpenAI a précisé dans son communiqué que son cofondateur et directeur général, Sam Altman, est actionnaire de Reddit.

OpenAI s’accorde avec Reddit pour entraîner ses modèles d’IA

Titre Newsletters

Sous-titre L'essentiel de l'actualité Stratégies

Les articles liés

Titre Newsletters

Sous-titre L'essentiel de l'actualité Stratégies