En créant Data.ina.fr, l’Institut national de l’audiovisuel permet aux amateurs de médias de faire leur propre recherche à partir du dépôt légal de vingt médias audiovisuels.
Marine Le Pen cinquième personnalité la plus citée dans les JT derrière Emmanuel Macron, Donald Trump, Vladimir Poutine et Joe Biden, entre le 1er janvier 2019 et le 30 juin 2024, mais troisième personnalité derrière Macron et Poutine sur les chaînes d’info continue grâce à sa deuxième place sur CNews… C’est l’un des enseignements du nouvel outil de datavisualisation de l’INA, concocté grâce à l’IA. S’adressant tant aux amateurs de médias et aux journalistes qu’aux chercheurs et aux experts, le nouveau site Data.ina.fr permet de se faire une idée précise du traitement de vingt médias audiovisuels, des chaînes TV aux matinales de radio.
Ses clés de lecture ne s’arrêtent pas aux personnalités : on y trouve également la répartition du temps de parole entre les hommes et les femmes (avec la musique, le bruit et le silence) ainsi qu’une sélection par mots ou par pays. Utile pour voir que la couverture éditoriale de l’Europe commence à baisser dès 2022, que la Russie est le troisième pays le plus cité derrière la France et les États-Unis, ou que la catégorie de son attribué par l’IA à une femme ne dépasse jamais 39 % (Franceinfo, avec 53 % de sons « homme ») et tombe à 17 % sur Canal+ (44 % de sons « homme »), 18 % sur RMC (79 % de sons « homme ») ou 26 % sur CNews (64 % « homme »). Derrière l’entrée « lieux », une carte du monde atteste, par exemple, que la Chine est cinq fois plus citée que l’Inde.
« Vulgarisation, acculturation et pédagogie sont au cœur de la démarche de Data.ina.fr », défend Camille Pettineo, rédactrice en chef data et responsable éditoriale du site, qui souligne que le taux de confiance des IA utilisées est de 83 %. L’algorithme, qui a été développé par les équipes de recherche de l’INA, offre aussi de faire des sélections de médias, ou dans le temps. 16 questions grand public et 28 graphiques interactifs sont proposés mais une recherche sur des expressions précises (« shrinkflation » par exemple) est aussi possible. Tous les six mois, le site sera mis à jour et une enquête éditoriale sera produite à partir des données de 700 000 heures de contenus. L’INA, qui vise les 2 milliards de vidéos vues cette année, s’attaque désormais à « porter un regard nouveau sur les médias », comme dit son président Laurent Vallet.