Saooti, leader de l’audio digital en France et pionnier dans l'utilisation de l'IA pour les podcasts et la webradio, franchit une nouvelle étape. Avec une offre complète, intégrant des outils d’IA toujours plus performants, Saooti enrichit l’expérience utilisateur et permet d’optimiser la création, la gestion et la diffusion de contenus audio.
« L’innovation, c’est l’ADN de Saooti », rappelle Laurent Hué, cofondateur et directeur exécutif de Saooti. La filiale du Groupe Sipa Ouest-France spécialisée, dans la conception et la diffusion de podcasts, consacre 50 % de son budget annuel à l’évolution de ses plateformes technologiques et la moitié de ses salariés sont des ingénieurs dédiés à l’innovation.
Saooti n’a pas attendu la « révolution » de l’IA générative pour avoir recours à l’intelligence artificielle. Celle-ci est utilisée depuis de nombreuses années pour la génération de contenus audio à partir d’écrits (text-to-speech). Grâce aux avancées technologiques récentes, le recours s’est toutefois étendu à la génération de textes à partir d’audio ou de vidéos (speech-to-text, video-to-text), au clonage de voix et, enfin, à la production de textes, d’images ou proc ha i ne me nt de vidéos via l’IA générative.
La technologie de conversion de l’audio vers le texte (speech-to-text) a fait un bond ces dernières années qui assure désormais une fiabilité incontestée aux transcriptions. Une avancée qui permet d’accroître l’accessibilité d’un contenu audio ou vidéo via le sous-titrage automatique, mais aussi l’automatisation de l’indexation et de l’archivage.
L’émergence de l’IA générative permet, elle, de franchir une nouvelle étape avec le clonage de voix. « Il est désormais possible de concevoir un podcast à partir d’une base d’articles, podcast qui peut cloner - avec son accord - la voix d’un journaliste ou d’une personnalité », souligne Laurent Hué. La « révolution » multimodale liée à l’IA générative permet aussi d’automatiser la traduction, atout indispensable pour les grands groupes, les médias internationaux, et toutes les organisations opérant sur des marchés mondialisés.
La force de Saooti, c’est également la maîtrise de technologies d’IA complémentaires. L’orchestration de plusieurs moteurs d’IA et l’hybridation avec les données d’usage permet notamment d’accélérer la publication de contenus audios, d’audïoser des contenus écrits à grande échelle, d’adopter le multilinguisme et d’enrichir les outils de médiatisation.
La transcription d’un podcast ou d’une vidéo, par exemple, se fait d’abord via la technologie speech-to-text ; le recours à l’IA générative permettant ensuite de générer des mots-clés, des sous-titres, une description automatique ou des chapitres, autant d’éléments qui permettent de proposer des suggestions d’écoute performantes. Les usages et les bénéfices sont nombreux. Un simple bouton sur la plateforme Saooti Play permet de générer, à partir d’un podcast ou d’une vidéo, des posts adaptés à chaque réseau social. Le chapitrage d’un podcast ou d’une vidéo est à la fois une aide à la navigation pour l’usager et améliore aussi le référencement SEO. Travaillant pour les médias, de grandes entreprises et des institutions publiques (ministères, Education nationale, etc.), Saooti veille attentivement à la question de la protection des données. Grâce à un accord avec Azure Open AI Service (Microsoft), les technologies et les données sont hébergées en Europe et bénéficient ainsi de la réglementation européenne particulièrement protectrice (RGPD, IA Act, etc.).
Signe de cette nouvelle étape de son développement, l’activité d’hébergement et de diffusion des contenus audio change de nom : Octopus devient ainsi Saooti Play. Une façon de rappeler le lien organique avec la structure éditoriale, Saooti Creative, mais aussi d’évoquer les possibilités (quasi) infinies offertes par l’IA. « Dans ‘Play’, il y a bien sûr la référence au bouton d’écoute, mais il y a aussi le côté assez ludique offert par l’IA générative », s’enthousiasme Laurent Hué.