Fujitsu développe une nouvelle technologie de synthèse vocale

Informatique

GPS

Apple

actualité

• 3 Min

Fujitsu Laboratories a mis au point une technologie de synthèse vocale dans laquelle l’intonation de la voix peut être adaptée en fonction du contexte dans lequel elle est employée. Les services basés sur des voix de synthèse seront mieux personnalisés pour être plus audibles et plus agréables. Une innovation qui devrait profiter notamment aux assistants vocaux qui équipent les GPS et les smartphones.

au sommaire

Les ingénieurs de Fujitsu ont élaboré une nouvelle technique de synthèse vocale qui permet d’adapter le ton aux circonstances. Finies les voix synthétiques monocordes. Selon le contexte, la voix artificielle pourra adapter le ton selon qu’il y ait une urgence, un problème ou pour se faire entendre distinctement dans un environnement bruyant. Le système pourra également permettre de personnaliser les voix pour les rendre plus attrayantes, ce qui serait agréable notamment pour les assistants vocaux que l’on trouve dans les GPS et les smartphones. © Fujitsu Laboratories

Les voix de synthèse sont désormais très présentes dans notre quotidien, qu'il s'agisse de celles que l'on entend dans les transports en commun, certains distributeurs automatiques, les services téléphoniques, les GPS des automobilesautomobiles ou encore les assistants vocaux des smartphones. Mais force est de constater qu'elles sont toujours aussi monocordes et impersonnelles. Le résultat est que l'information diffusée par ce biais n'est pas assez adaptée au contexte. De surcroît, faire évoluer une voix de synthèse nécessite le traitement d'un gros volumevolume de données, ce qui prend du temps.

Fujitsu Laboratories a travaillé sur ce sujet et conçu une nouvelle technologie qui permet de créer des voix de synthèse adaptées aux circonstances dans lesquelles elles sont utilisées. « La technologie de synthèse vocale actuelle est capable de traiter une grande variété de textes, mais d'une voix monocorde. Il y a un besoin d'une synthèse vocale qui soit en mesure de transmettre le texte parlé aux auditeurs selon les circonstances afin de le rendre facile à comprendre », explique l'entreprise japonaise dans son communiqué.

Voix de synthèse qui s’adapte au contexte

Pour rendre le processus de synthèse plus polyvalent, les ingénieurs de Fujitsu ont utilisé une méthode qui consiste à isoler et à convertir en paramètres les caractéristiques du phrasé d'un discours telles que l'intonation, la clarté ou les pauses. Ces paramètres sont stockés dans une base de données et analysés par un algorithme qui utilise l'apprentissage machine pour que le ton de la voix soit approprié à la situation. Une voix synthétique pourra ainsi prendre un ton alarmé en cas d'urgence ou un ton clair et facile à entendre dans un environnement bruyant.

Le principe du système de synthèse vocale mis au point par Fujitsu. Un fournisseur de service (<em>service provider</em>) enregistre une voix. Celle-ci est analysée pour extraire ses caractéristiques (ton, clarté, pauses, etc.) qui sont transformées en paramètres qui vont alimenter une base de données (<em>parameter database</em>). Dans une situation d’urgence (<em>emergency</em>), la synthèse vocale est traitée par un algorithme basé sur l’apprentissage machine qui va ajuster le ton de la voix de synthèse (<em>synthesized voice</em>) au contexte. © Fujitsu Laboratories

Le principe du système de synthèse vocale mis au point par Fujitsu. Un fournisseur de service (service provider) enregistre une voix. Celle-ci est analysée pour extraire ses caractéristiques (ton, clarté, pauses, etc.) qui sont transformées en paramètres qui vont alimenter une base de données (parameter database). Dans une situation d’urgence (emergency), la synthèse vocale est traitée par un algorithme basé sur l’apprentissage machine qui va ajuster le ton de la voix de synthèse (synthesized voice) au contexte. © Fujitsu Laboratories

L'intérêt est qu'un système vocal pourra s'adapter en temps réel. Dans les usines par exemple, les machines qui utilisent des voix de synthèse pour informer les opérateurs pourront moduler l'intonation de leurs messages : calme et normal en opération de routine, préoccupée en cas d'erreur de manipulation ou bien agitée devant l'urgence. Les autorités municipales pourraient aussi se servir d'un tel système pour diffuser des messages à la population afin de faire de la préventionprévention en cas de situation à risque (événement climatique, tremblement de terretremblement de terre, tsunamitsunami, etc.). Une voix posée et clairement audible serait diffusée pour prodiguer des recommandations tandis qu'en cas de catastrophe, le ton pourrait être adapté en fonction de l'urgence.

Premières applications pour le courant de l’année 2014

Par ailleurs, la technologie de Fujitsu présente l'avantage de nécessiter seulement une petite quantité d'échantillons sonores et de réduire d'environ un tiers le temps nécessaire pour créer une voix synthétique. Il serait ainsi plus aisé de personnaliser un service vocal et de le mettre à jour en fonction des besoins. Fujitsu pense que son innovation permettrait d'adapter les voix de synthèse selon les préférences des utilisateurs, en les rendant plus attachantes ou typées selon les usages. De quoi par exemple personnaliser un peu plus un assistant vocal comme le Siri d'Apple, ou bien la voix d'un système de guidage GPS.

Les ingénieurs voient même encore un peu plus loin en imaginant que le système pourrait servir dans un cadre médical. Une personne malade susceptible de devenir aphone pourrait enregistrer sa voix à l'avance pour communiquer avec son entourage en se servant de son double vocal synthétisé. Fujitsu Laboratories indique qu'il faut encore peaufiner la technologie, et l'entreprise pense proposer les premières applicationsapplications dans le courant de son exercice fiscal de 2014.

par Marc Zaffagni

Journaliste

le 3 avril 2014

Nos articles

à lire aussi

Après avoir démontré sa puissance en battant deux concurrents humains en direct lors du jeu télévisé Jeopardy, Watson a trouvé des applications commerciales très rémunératrices pour IBM dans les domaines de la finance et de la médecine. © IBM

Tech

Informatique

IBM veut faire de l’ordinateur Watson un superassistant vocal

actualité

• 30/08/2012

Fujitsu a profité du Mobile World Congress pour présenter son prototype de tablette dont l’écran tactile délivre un effet haptique qui reproduit certaines sensations du toucher. Quatre démonstrations permettaient de ressentir les cordes d’un instrument de musique, les boutons d’une table de mixage de disc-jockey, la serrure d’un coffre-fort ainsi que la peau d’un crocodile. © Fujitsu Laboratories

Tech

Technologie

Un prototype de tablette tactile à effet haptique chez Fujitsu

actualité

• 07/03/2014

Certains, comme, sans doute, cette chanteuse peinte par Degas, ont une belle voix. Mais beaucoup ont une voix ordinaire, peut-être voisine de celle de quelqu'un qui l'a perdue. Le projet VocaliD permettra peut-être d'en faire don, de manière simple, par exemple en lisant (ou en relisant) Le magicien d'Oz, de L. Frank Baum. © The York Project, domaine public

Santé

Médecine

VocaliD, ou comment faire don de sa voix à qui en a besoin

actualité

• 24/03/2014

Et voilà iOS 7 ! © Karlis Dambrans, Flickr, CC by 2.0

Tech

Informatique

Apple : le point sur les principales nouveautés d’iOS 7

actualité

• 14/09/2013

Le marché des smartphones. © DisobeyArt, Shutterstock

Tech

Télécoms

Smartphones : la guerre des systèmes d’exploitation mobiles

dossier

• 05/09/2012

Tech

Robotique

La robotique de A à Z

dossier

• 19/02/2018

Comment appeler Siri par la voix dans macOS ? @ Apple

Tech

Informatique

Mac : comment activer Siri par la voix ?

question réponse

• 31/01/2018

Apple, avec ses Airpods sans fil, innove toujours plus. © Apple

Tech

Électronique

Apple : comment bien configurer ses Airpods ?

question réponse

• 19/12/2022

Déverrouiller son Mac avec son Apple Watch, c'est possible. © hurricanehank, fotolia

Tech

Informatique

Comment déverrouiller son Mac avec une Apple Watch ?

question réponse

• 16/05/2018

Tech

Smartphone

iPhone X : comment fonctionne Face ID d'Apple ?

question réponse

• 07/10/2017

Tech

Technologie

Transfert de technologie

dossier

• 31/08/2002

Tech

Technologie

La technologie de la signalisation ferroviaire

dossier

• 15/01/2002

Tech

Fujitsu se développe sous Linux

actualité

• 03/11/2003

Pour rattraper son retard sur la concurrence en matière de messagerie instantanée, Google travaille sur une nouvelle application qui s’appuiera sur une intelligence artificielle pour répondre aux requêtes des internautes. © Geralt, CC0 DP, Pixabay

Tech

Internet

Google développe une nouvelle messagerie « intelligente »

actualité

• 25/12/2015

Tech

Drôle de Tech

Drôle de Tech : l'Apple Watch trahit les voleurs, un robot épluche des laitues et des Mercedes choisissent leur parking

actualité

• 30/09/2018

La sélection de la

Rédaction

Inédit : une réduction de -250 € sur les suites Microsoft Office et Windows sur Godeal24 !

Tech

Bureautique

Inédit : une réduction de -250 € sur les suites Microsoft Office et Windows sur Godeal24 !

Article

L’intelligence organoïde, promesse ou utopie ?

Tech

Intelligence artificielle

L’intelligence organoïde, promesse ou utopie ?

Article

Tech

Voiture

Renault Group accélère sur les pièces reconditionnées pour les voitures électriques

Article

100 millions de lunettes dorment au fond des tiroirs des Français. © Vecstock, Freepik

Tech

Jeunes Pousses

Cette startup française change la vision du monde avec des lunettes recyclées à petits prix !

Article

À l'horizon 2050, 100 % du gaz circulant dans le réseau de distribution pourrait être du gaz vert. © Wirestock, Freepik

Tech

Jeunes Pousses

Décarbonation : 20 % des gaz qui circuleront dans les réseaux en 2030 seront verts

Article

Quelque 600 000 décès par an en Europe sont liés à la pollution de l'air. © Nikitabuida, Freepik

Tech

Jeunes Pousses

Des purificateurs d’air pour tous les logements des athlètes aux Jeux olympiques

Article

Grâce à un nouveau système à base d’hydrogel, les diabétiques pourraient ne plus avoir besoin de se piquer les doigts pour vérifier leur glycémie. © Cultura Creative, Adobe Stock

Tech

Technologie

Des chercheurs ont utilisé la boussole des smartphones pour mesurer la glycémie !

Article

Illustration d'un avion hypersonique. Celui de Venus Aerospace pourvu d'un moteur-fusée à détonation rotative pourrait atteindre une vitesse de pointe à Mach 9. © Robert, Adobe Stock (image générée avec l'aide de l'IA)

Tech

Technologie

Projet Stargazer : premier vol d'un drone supersonique doté d'un moteur à détonation révolutionnaire

Article

Liens externes

<em>Fujitsu Develops New Speech Synthesis Technology</em>

À voir aussi

synthese vocale definition

signature vocale

reconnaissance vocale

recherche vocale

traduction vocale google

pac fujitsu

fujitsu siemens

fujitsu n124

fujitsu siemens scaleo

voix de synthese

Mots Clés

Fujitsu Laboratories

Voix

Synthèse vocale

Siri

Fujitsu