Après avoir faire montre de sa puissance pour le jeu de Go, l’intelligence artificielle de DeepMind (Google) s’attaque à la synthèse vocale avec une réussite tout aussi spectaculaire. © Sergey Nivens, Shutterstock

Quand Google parle presque comme un humain

Smartphone

Intelligence artificielle

Google

actualité

• 2 Min

DeepMind, la filiale de Google spécialisée en intelligence artificielle, a développé un programme de synthèse vocale qui reproduit la parole humaine avec un naturel inédit. Baptisé WaveNet, ce système s’avère nettement plus performant que les technologies de synthèse vocale existantes.

au sommaire

Un jour, il est assez probable que vous puissiez converser au téléphone avec un robot sans même vous en apercevoir. C'est ce que laisse entrevoir la dernière innovation de la firme britannique DeepMind. Après avoir battu un champion du monde de jeu de Go grâce à son programme d’intelligence artificielle (IAIA) AlphaGoAlphaGo, cette filiale de GoogleGoogle s'est attaquée à un autre domaine, celui de la synthèse vocale.

WaveNet, sa nouvelle IA, est capable d'imiter la parole humaine avec une efficacité 50 % supérieure aux technologies existantes. Le système fonctionne en apprenant à former les ondes sonoresondes sonores que produit la voix humaine. Lors de tests à l'aveugle, des auditeurs ont classé WaveNet largement devant les solutions de synthèse vocale par concaténation et par modélisationmodélisation paramétrique qui sont aujourd'hui les plus répandues.

La synthèse vocale par concaténation est celle utilisée par les assistants virtuels que l'on trouve sur smartphones, les SiriSiri, CortanaCortana et autres Assistant Google. Leurs voix respectives proviennent de l'enregistrement de séquences courtes d'une voix humaine qui sont combinées pour former des phrases. Le résultat est assez naturel, mais le problème est que toute évolution du système nécessite d'enregistrer de nouvelles séquences (écouter un exemple de synthèse vocale par concaténation créé par Google).

Ces graphiques illustrent le résultat de 500 tests à l’aveugle menés par DeepMind pour évaluer la performance de WaveNet. Était noté sur une échelle de 1 à 5 le niveau de réalisme des séquences audio entendues en anglais et en mandarin. On constate que l’IA se classe juste après la parole humaine et loin devant les autres systèmes de synthèse vocale existants. © DeepMind

La synthèse vocale de Google écoute et imite

La synthèse vocale par modélisation paramétrique consiste à générer une voix artificielle par ordinateur en se basant sur des règles de grammaire et de prononciation. L'avantage est qu'il n'y a pas besoin d'une source humaine. Mais le résultat manque pour le moins de naturel, comme on peut en juger dans cet autre extrait de Google.

WaveNet se sert d'une voix humaine comme référence, mais au lieu de la sectionner pour composer ses phrases, l'intelligence artificielle en extrait les ondes sonores dont elle se sert comme modèle pour créer des voix différentes. En gros, cette IA écoute puis imite. Comme on peut l'entendre dans cet extrait, WaveNet surclasse effectivement les autres méthodes de synthèse vocale. Et le système ne se cantonne pas qu'à la voix puisqu'il peut aussi faire de la musique et sait par exemple jouer du piano.

Toutefois, malgré l'apparente facilité qui se dégage de cette démonstration, il ne faut pas s'attendre à la voir arriver de sitôt dans les smartphones, ordinateurs et autres robots. En effet, WaveNet nécessite une puissance de calcul encore trop importante pour une machine individuelle. Mais on peut faire confiance à Google pour trouver le moyen d'exploiter cette technologie dès que possible.

par Marc Zaffagni

Journaliste

le 13 septembre 2016

Nos articles

à lire aussi

Maintenant qu’il a démontré les capacités de son intelligence artificielle au jeu de go, DeepMind, l'IA de Google, se tourne vers un jeu vidéo de stratégie comme StarCraft pour améliorer sa faculté d’apprentissage. © Agsandrew, Shutterstock

Tech

Technologie

DeepMind, l'IA de Google, déclare la guerre sur StarCraft II

actualité

• 10/08/2017

Circuit quantique supraconducteur © Erik Lucero

Tech

Ordinateur quantique

Ordinateur quantique : IBM conteste la suprématie quantique clamée par Google

actualité

• 23/10/2019

Le marché des smartphones. © DisobeyArt, Shutterstock

Tech

Télécoms

Smartphones : la guerre des systèmes d’exploitation mobiles

dossier

• 05/09/2012

Des robots ont toujours peuplé notre imaginaire. © Hersson Piratoba, CC by-nc 2.0

Tech

Robotique

Robots et avatars

dossier

• 27/05/2021

Tech

Smartphone

Activer la commande vocale « Ok Google » sur Android et iOS

question réponse

• 24/12/2022

D’autres assistants vocaux, comme Iris, reprennent directement l’interface et les fonctions de Siri. Vlingo s’intègre lui au mode Voiture d’Android avec la lecture automatique des messages reçus. © Guénaël Pépin

Tech

Personnaliser

Android : utiliser un assistant vocal performant comme Vlingo

question réponse

• 23/06/2012

Tech

Intelligence artificielle

Intelligence artificielle : ces pionniers qui ont révolutionné l'IA

question réponse

• 21/02/2024

Tech

Google

Google : comment désactiver les données de géolocalisation sur son smartphone ?

question réponse

• 05/03/2023

Tech

Informatique

De Google Earth à Géoportail 3D

dossier

• 03/07/2006

Tech

Robotique

Introduction à la vie artificielle

dossier

• 30/08/2001

Les principaux assistants vocaux sont tous très performants lorsqu’il s’agit de comprendre une question. Moins lorsqu’il faut répondre… © Loup Ventures

Tech

Smartphone

Test de QI : l'Assistant Google fait mieux qu'Alexa, Cortana et Siri

actualité

• 27/07/2018

L'IA de Google DeepMind lit sur les lèvres mieux qu'un humainAprès la reconnaissance vocale, Google et sa filiale DeepMind ont fait une nouvelle démonstration de leur maîtrise de l’intelligence artificielle. © CC0 DP via Pixabay

Tech

Intelligence artificielle

L'IA de Google DeepMind lit sur les lèvres mieux qu'un humain

actualité

• 25/11/2016

L’optimisation énergétique des réseaux neuronaux est la clé de l’intégration de l’intelligence artificielle dans les terminaux mobiles. © Jose-Luis Olivares, MIT

Tech

Smartphone

Bientôt l'intelligence artificielle dans mon smartphone ?

actualité

• 19/07/2017

Tech

Intelligence artificielle

Google veut humaniser l'intelligence artificielle

actualité

• 11/07/2017

Arriver à exploiter la puissance d’une intelligence artificielle à partir d’une simple clé USB va permettre de faire grandement évoluer les capacités de nombreux appareils électroniques. © Macro-vectors, Shutterstock

Tech

Robotique

Intel lance la version 2 de son intelligence artificielle sur clé USB

actualité

• 19/11/2018

La sélection de la

Rédaction

Avec son réseau de voisins-relais, Pickme permet de réduire les 20 % d’échecs à la première livraison. © Pickme

Tech

Jeunes Pousses

Les voisins-relais, la bonne idée pour réduire les échecs de livraison

Article

Dernier jour : une réduction de -250 € sur les suites Microsoft Office et Windows sur Godeal24 !

Tech

Bureautique

Dernier jour : une réduction de -250 € sur les suites Microsoft Office et Windows sur Godeal24 !

Article

40 % des aides ne sont pas réclamées en France ! Klaro a créé une application destinée à faciliter l’accès aux aides. © peopleimages.com, Adobe Stock

Tech

Jeunes Pousses

Ne passez plus à côté des aides auxquelles vous avez droit grâce à cette appli

Article

L’intelligence organoïde, promesse ou utopie ?

Tech

Intelligence artificielle

L’intelligence organoïde, promesse ou utopie ?

Article

Tech

Voiture

Renault Group accélère sur les pièces reconditionnées pour les voitures électriques

Article

100 millions de lunettes dorment au fond des tiroirs des Français. © Vecstock, Freepik

Tech

Jeunes Pousses

Cette startup française change la vision du monde avec des lunettes recyclées à petits prix !

Article

À l'horizon 2050, 100 % du gaz circulant dans le réseau de distribution pourrait être du gaz vert. © Wirestock, Freepik

Tech

Jeunes Pousses

Décarbonation : 20 % des gaz qui circuleront dans les réseaux en 2030 seront verts

Article

Quelque 600 000 décès par an en Europe sont liés à la pollution de l'air. © Nikitabuida, Freepik

Tech

Jeunes Pousses

Des purificateurs d’air pour tous les logements des athlètes aux Jeux olympiques

Article

À voir aussi

google corp humain

convergence presque sure

mon corps me parle

ne parle pas anglais

mon corps parle

beluga parle

parle trop vite articule pas assez

Mots Clés

WaveNet

Synthèse vocale

Cortana

Apple Siri

Synthèse vocale par concaténation

Synthèse vocale par modélisation paramétrique

Deepmind