Podcasts, notes vocales, salons de discussions… À bas bruit, l’audio fait sa révolution digitale. La décennie qui s’ouvre sera celle de la voix et, avec elle, celle de l’éloquence.
Le procès des attentats du 13-Novembre, qui s’est ouvert en septembre 2021, est historique à plusieurs égards. Il s’agit de la plus grande audience criminelle jamais tenue en France, avec le recueil essentiel de la parole des victimes et de leurs proches. Le procès est aussi exceptionnel de par son dispositif : pour permettre aux 2 230 parties civiles de suivre le procès sans être présentes dans la salle d’audience, le ministère de la Justice a mis en place une webradio privée et sécurisée. Cette solution inédite, déployée par Saooti, est significative de la révolution en cours : « Après la digitalisation de l’écrit et la transformation de la presse, et l’avènement de la vidéo en streaming, c’est au tour de l’audio de se "webiser" », analyse Laurent Hué, cofondateur et directeur de Saooti.
Après l’essor du streaming musical, la manifestation la plus évidente de cette révolution de l’audio est la croissance du podcast, qui gagne des adeptes. Le format, adapté à l’écoute sur smartphone, est particulièrement apprécié des 15-35 ans. En 2021, l’Hexagone comptait 15 millions d’auditeurs de podcast par mois, soit une augmentation de 20 % en un an, selon Médiamétrie. Parmi eux, la grande majorité (13,3 millions) a consommé des podcasts proposés par les stations de radio, un média « qui se délinéarise », commente Laurent Hué.
« Les gens veulent trouver les contenus quand ils veulent. On passe de la programmation à l’"on demand" », résume Cécilia Gabizon, vice-présidente d’ETX Studio. Selon elle, l’audio digital « fait tomber la barrière à l’entrée », permettant l’émergence de créateurs, studios et plateformes spécialisées. Anne-Marie de Couvreur, présidente et fondatrice de Mediameeting, compare l’époque actuelle à la libéralisation des ondes en 1981 : « On revit la même chose, il y a un nouvel espace de liberté pour les Français. Avec le podcast, on peut explorer des sujets très intimes qui étaient peu abordés dans les médias traditionnels. »
Commande vocale
La reconnaissance vocale a aussi fait un bond depuis la présentation de Siri par Apple en 2011. Le boom des assistants vocaux depuis 2016 (Alexa d’Amazon, Assistant Google…) a fait entrer la commande vocale dans les usages. « Il y a une démocratisation de cette technologie qui arrive dans les maisons, les voitures, les hôtels et les téléphones », constate Florian Guichon, directeur des opérations de Vivoka. La société française vend depuis un an et demi sa solution « Voice Development Kit » à une centaine d’entreprises (Thales, Banque populaire, Caisse d’Épargne…) afin qu’elles développent leur propre assistant vocal pour faciliter le travail de leurs employés. Par exemple, les techniciens de Suez utilisent cette technologie pour dicter des matricules de compteurs à la machine.
« Nouveau clic droit »
Nicolas Pingnelain, head of sales d’Ircam Amplify, en est persuadé : « La voix va devenir le nouveau clic droit de la souris. » La société, qui commercialise les innovations audio de l’Ircam, centre de recherche rattaché au Centre Pompidou, travaille sur des projets de voix de synthèse pour les marques. « La suite logique du chatbot est la voix. On est aux prémices de la personnification des marques, bien au-delà de l’identité sonore. L’interaction avec la marque passera de plus en plus par la voix, qui portera des valeurs et des caractéristiques très réelles », poursuit-il, citant en exemple l’habitacle automobile, comme Mercedes et sa voix féminine.
Cécilia Gabizon, d’ETX Studio, abonde dans le sens de cette nouvelle incarnation des marques avec les « voxa » et donne l’exemple du défilé Balenciaga printemps-été 2022 pour lequel une voix robotique récitait La vie en rose. L’utilisation de ces voix de synthèse entre dans les mœurs avec la « synthèse vocale » (text-to-speech) sur TikTok, qui a aussi fait son apparition en novembre dans les Reels d’Instagram. « L’avantage de ces voix de synthèse est qu’elles sont capables de traiter une grande quantité de contenus et peuvent, si la technologie est bonne, switcher dans une autre langue », explique Cécilia Gabizon.
Éloquence inédite
La révolution de l’oralité est aussi visible dans les usages de messagerie comme WhatsApp ou Messenger, avec l’envoi de messages vocaux. Inspirées par le buzz médiatique de Clubhouse et le succès des applications de visioconférence, les plateformes sociales créent des salons de discussion, comme Twitter avec « Spaces » ou Facebook avec « Messenger Rooms ». Ces nouvelles façons de communiquer interrogent le concept d’éloquence. Invité de l’émission Popcorn sur YouTube, le politologue Clément Viktorovitch dit au sujet des streamers de Twitch : « C’est une forme d’éloquence complètement inédite : ce n’est pas un discours, ce n’est pas une discussion, ce n’est pas un jeu de question/réponse. Je propose qu’on appelle ça un monologue conversationnel. » Installée dans les débats de la présidentielle, les pitchs de start-up ou les ted talks, désormais, l’éloquence est aussi une épreuve du bac avec le Grand oral, nouveauté de juin 2021. C’est donc certain, the future is vocal.