Gaie, triste ou effrayée : la voix électroniquement manipulée en direct d'une personne et entendue par celle-ci modifie son humeur. L'expérience répond à un vieux débat en psychologie et, réalisée depuis une plateforme librement accessible, elle pourra être adaptée à bien d'autres études.

au sommaire


    « On connaît encore très mal les mécanismes qui sont mis en jeu par la production des émotions vocales », explique l'auteur principal de l'étude Jean-Julien Aucouturier du laboratoire Sciences et technologies de la musique et du son (STMS, CNRS/Ircam/Ministère de la culture et de la communication/université Pierre et Marie CurieMarie Curie). « De précédentes recherches ont suggéré que les personnes essaient de contrôler la façon dont elles expriment leurs émotions, par exemple en essayant de ne pas paraître affectées par un événement, ou en se forçant à sourire même si ce n'est pas sincère. Nous voulions étudier à quel point les personnes ont conscience de leurs propres expressions émotionnelles. »

    Dans cette première étude utilisant une plateforme audio numériquenumérique, et publiée dans les Pnas, les participants lisent un court texte à voix haute tout en écoutant avec un casque leur voix, modifiée à leur insu pour être plus gaie, triste ou effrayée.

    Les différentes possibilités réalisées avec la plateforme. © CNRS

    Les différentes possibilités réalisées avec la plateforme. © CNRS

    Humeur sous influence

    L'étude montre que les participants n'ont pas perçu la modification réalisée sur leur propre voix, mais que cette écoute a bien influencé leur humeur dans le sens de la modification apportée. Cela montre que les participants ne contrôlent pas leur propre voix dans un but spécifique, et qu'ils écoutent leur voix pour savoir comment ils se sentent.

    « Le rapport qui existe entre l'expression et l'expérience d'une émotion est l'objet d'un très vieux débat en psychologie, ajoute Petter Johansson, co-auteur de l'étude à l'université de Lund en Suède. C'est la première mise en évidence d'un effet de rétroactionrétroaction dans une expérience émotionnelle dans le domaine auditif ». Les modifications émotionnelles des voix ont été produites par des algorithmes de traitement du signal audionumérique pour simuler les caractéristiques acoustiques d'une émotion vocale. Par exemple, pour la manipulation « joyeuse », la hauteur de la voix est modifiée avec un algorithme de décalage et d'inflexion de pitch pour la rendre plus positive, la plage dynamique de la voix est augmentée avec un algorithme de compression pour la rendre plus confiante, et son contenu spectral est modifié avec un filtre passe-haut pour la rendre plus exaltée.


    Tutoriel du logiciel libre D.AV.I.D. (Da Amazing Voice Inflection Device) lors de sa présentation à la quatrième conférence internationale sur la musique et les émotions qui se tenait en octobre 2015 à Genève. © Cream, Ircam

    Diverses applications de la plateforme D.A.V.I.D.

    Les chercheurs estiment que ce nouvel outil de transformation de voix ouvre de nombreuses pistes de recherche. « Jusqu'à aujourd'hui, ce type de manipulation émotionnelle de la voix n'avait jamais été réalisé sur de la parole en temps réel, mais seulement sur des segments audio enregistrés, explique Jean-Julien Aucouturier. Nous mettons notre plateforme à disposition en téléchargement open-source sur notre site Web [disponible ici, NDLRNDLR], et invitons toute personne intéressée à télécharger et expérimenter avec ce nouvel outil. »

    Pour des applicationsapplications plus grand public, Katsumi Watanabe, l'un des co-auteurs japonais de l'étude à l'université Waseda et à l'université de Tokyo, estime que la plateforme pourrait également être utilisée à des fins thérapeutiques par exemple, pour des troubles de l’humeur pour induire un changement d'attitude positive en racontant des événements chargés émotionnellement avec un ton de voix artificiellement modifié.

    Cela pourrait aussi augmenter l'expressivité des chanteurs d'un karaoké ou lors de concerts live, ou pour contrôler l'atmosphèreatmosphère émotionnelle des conversations lors de réunions ou de jeux vidéojeux vidéo en ligne.