INTELLIGENCE ARTIFICIELLE

Ces sites qui utilisent ChatGPT pour pomper des articles médias sans les créditer

Publié le 28 août 2023

2 min de lecture

Par Cécilia Di Quinzio

Dans une nouvelle enquête, NewsGuard met en lumière une tendance inquiétante : l’utilisation croissante de l’intelligence artificielle pour réécrire et reproduire des articles issus de sources d’information de renom, sans les citer. Cette pratique automatisée soulève des préoccupations en matière de droits d’auteur, de plagiat et de financement, alors que de grandes marques se retrouvent involontairement à financer ces pratiques trompeuses à travers la publicité programmatique.

37. C’est le nombre (édifiant) de sites qui se servent de l’IA générative pour reformuler des articles qui avaient d’abord été publiés par des médias tels que CNN, le New York Times ou Reuters, recensés par la start-up NewsGuard qui lutte contre les fake news. Dans chaque cas, les sources d’information d’origine sont omises, même si les articles sont clairement extraits de ces sources. Certains des 37 sites identifiés semblent être entièrement automatisés, fonctionnant sans intervention humaine.

Dans son rapport intitulé « Misinformation Monitor : août 2023 », NewsGuard montre que l’utilisation de chatbots pour générer du contenu original est devenue plus sophistiquée, rendant difficile la distinction entre un contenu produit par un humain et un contenu généré par l’IA, bien que les IA générative comme ChatGPT d’OpenAI ou Bard de Google possèdent des politiques interdisant l’utilisation de leur technologie à des fins de plagiat.

« Il y a probablement des centaines – sinon des milliers – de sites qui se servent de l’IA pour extraire des contenus de sources extérieures », déplore NewsGuard, qui a contacté Google et OpenAI pour obtenir des commentaires sur l’utilisation de leurs outils par de telles « fermes de contenu », mais n’a pas obtenu de réponse.

Publicités programmatiques

Il est à noter que ces sites plagiaires s’appuient sur de la publicité programmatique de grandes marques pour se financer. « Avec le bon code et un chatbot, un site d’actualité peut fournir un flux régulier de revenus passifs », assure NewsGuard, qui a identifié des publicités programmatiques de grandes marques présentes sur 15 des 37 sites accusés de plagiat, incluant des pubs pour 55 entreprises renommées. Ces publicités étaient affichées sur des articles contenant du contenu réécrit par l’IA.

Le fonctionnement de la publicité programmatique, basé sur des algorithmes pour diffuser des publicités ciblées aux internautes, reste assez opaque. Il est probable que les marques ne soient pas conscientes du fait qu’elles financent ces fermes de contenus. NewsGuard a choisi de ne pas divulguer les noms des marques dans ce rapport.

Des sites utilisent des publicités programmatiques pour financer ces pratiques, et NewsGuard a trouvé des annonces de grandes marques sur 15 des 37 sites identifiés. Cependant, les marques ne sont probablement pas conscientes de financer ces sites plagiaires via la publicité programmatique.

Prise de conscience

Les médias internationaux sont bien conscients de cette menace. Mi-août, le New York Times déclarait qu’il envisageait une action en justice contre OpenAI pour avoir entraîné ses algorithmes sur des articles du célèbre quotidien américain en violation du droit d’auteur. Des négociations sont en cours pour que la maison-mère de ChatGPT rémunère le New York Times à ce sujet, faute de quoi l’affaire pourrait se régler devant un tribunal.

Plus tôt cet été, dans une lettre ouverte, des groupes de médias internationaux, dont l’AFP, The Associated Press ou le groupe Gannett/USA Today, appellent les dirigeants politiques et responsables du secteur à encadrer l’usage de l’intelligence artificielle dans le domaine de l’information.

Les articles liés

Les créateurs food font recette sur TikTok

Tata Communications accélère sur l’IA avec Kaleyra AI

Google veut passer au « fingerprinting », les autorités anglaises s’inquiètent