Un blog américain affirme que le classement des articles d'actualité du géant n'est pas en mesure de distinguer ceux qui sont écrits par des humains et ceux qui sont produits par l'intelligence artificielle.
Google News n’est pas en mesure de bloquer les articles créés par Chat GPT ou d’autres formes d’IA générative qui plagient ou copient des articles de presse en vue de produire rapidement du contenu, de récupérer de l’audience, et donc de capter des revenus publicitaires. C’est ce qu’a révélé le blog américain 404 Media, dans un post repéré par L’Usine Digitale le 18 janvier. Le billet de blog signale que le géant lui a précisé qu’il luttait contre les Spams mais ne cherchait pas à savoir si un article de presse était écrit pas un humain ou par une IA « ouvrant ainsi la voie à davantage de contenu généré par l'IA sur Google News ».
Le blog cite par exemple Worldtimetodays, qui se présente comme un portail d’actualité et qui regorge de publicités : ce site publie plusieurs dizaines d’articles par jour, sans doute en demandant à un service d'IA générative de réécrire des articles trouvés sur de vrais sites d’information. En milieu de semaine dernière, il a publié par exemple un article très similaire à celui publié un jour plus tôt sur le site Distractify, avec même la photo du même auteur. A ceci près, il était adressé aux fans de « War of Stars », plutôt qu’aux fans de Star Wars.
Phénomène difficilement détectable
Selon 404 Media, cette affaire démontre qu’il est plus aisé qu’on ne le pensait de pénétrer la blackbox de Google News et d’intégrer son classement dans les première places via un système qui reste déterminé par un algorithme confidentiel et opaque. Ensuite, elle prouve que Google n’est pas armé pour modérer son service d’actualité à l’ère de l’IA et à l’heure où presque tout le monde est en mesure de produire du contenu sans se soucier de sa qualité ou de son originalité. Si les fermes de contenus capables de générer des fakes ne sont pas une nouveauté, y compris sur Google News, le recours à l’IA générative massifie le phénomène et le rend d’autant plus difficilement détectable que des progrès considérables ont été accomplis par l’IA en matière d’écriture et de construction de textes ou d’images.
Alors que les éditeurs de presse s’étaient opposés à la reprise de leurs contenus sans versement de droits d’auteurs, allant jusqu’au blocage par Google News pendant sept ans en Espagne, la production d’articles plagiaires déclinés de publications ouvre un nouveau chapitre des relations tendues entre OpenAI, Google (Bard, Gemini) et les éditeurs de médias. L’un d’eux, le New York Times a déjà engagé des poursuites contre Open AI.