Une intelligence artificielle peut apprendre une langue sans aide humaine

Intelligence artificielle

Facebook

actualité

• 4 Min

Des chercheurs travaillant sur des projets indépendants ont créé des intelligences artificielles bilingues qui peuvent apprendre une nouvelle langue sans piocher dans un dictionnaire existant, et même sans intervention humaine. Une avancée remarquable.

au sommaire

« Imaginez que vous donniez à une personne de nombreux livres en chinois et en arabe, tous différents, et que vous lui demandiez de traduire du chinois en arabe. Cela semble impossible, n'est-pas ? Eh bien un ordinateur peut le faire. » Voici ce qu'annonce Mikel Artetxe, ingénieur informaticien à l'université du Pays Basque (UPV) de San Sebastiàn en Espagne. Il est l'auteur de l'un des deux articles scientifiques publiés sur arXiv et décrivent une méthode d'apprentissage automatique (machine learning) non supervisée capable de réaliser des traductions sans recourir à un dictionnaire. Le système fonctionne également sans texte parallèle ou identique existant dans une autre langue.

Le second article (Unsupervised Machine Translation Using Monolingual Corpora Only), totalement indépendant mais qui utilise la même technique, est l'œuvre de Guillaume Lample, un ingénieur en informatique français travaillant pour le département d'intelligence artificielle de FacebookFacebook. Dans les deux cas, les chercheurs démontrent qu'un réseau neuronal peut apprendre à traduire une langue sans aller piocher dans un dictionnaire.

Ces dernières années, la traduction automatique a fait d'immenses progrès grâce aux réseaux neuronaux qui ont dopé les performances de l'apprentissage automatique. Cependant, ce type d'IA nécessite de gros volumesvolumes de contenus traduits préalablement par des humains. La traduction est le fruit d'un apprentissage supervisé au cours duquel la machine fait une supposition puis reçoit la réponse correcte d'un humain, ce qui lui permet ensuite d'ajuster son traitement en conséquence. Cette méthode est efficace pour les langues très répandues, l'anglais ou le français par exemple, pour lesquelles il existe de nombreux documents parallèles. Mais elle fonctionne nettement moins bien pour des langues rares qui n'offrent pas d'un tel corpus.

L’IA fait de la géographie pour apprendre les mots

Dans le cas des deux nouvelles méthodes dont il est question, les experts ont développé un apprentissage automatique non supervisé. Pour cela, ils se sont appuyés sur les associations identiques qui existent entre des mots quelle que soit la langue. Par exemple, le mot table est souvent employé avec le mot chaise. Partant de là, la machine va cartographier ces connexions pour chaque langue, un peu comme un atlas routier où les mots remplaceraient les noms des villes. L'IA rapproche ensuite ces cartes et repère les connexions similaires mais avec des noms différents. C'est ainsi qu'on obtient un dictionnaire bilingue sans données préalables. Une sacrée prouesse technique !

Les deux systèmes d'IA sont capables de traduire non seulement des mots individuels, mais aussi des phrases complètes. Pour ce faire, deux techniques d'entraînement sont utilisées. La première, nommée back translationtranslation ou « traduction inversée », consiste à traduire grossièrement une phrase d'une langue vers une autre puis à la traduire à nouveau dans sa langue d'origine. Si la traduction de retour n'est pas identique à l'originale, le réseau neuronal ajustera son fonctionnement en conséquence.

La seconde technique d'entraînement nommée denoising, que l'on peut traduire par « réduction du bruit », est similaire à la traduction inversée dans son principe. Elle consiste à ajouter ou retirer des mots à une phrase puis à la traduire. C'est en combinant ces deux techniques que les chercheurs ont obtenu les meilleurs résultats. Au cœur des deux systèmes, celui de Mikel Artetxe et celui de Guillaume Lample, se trouve une étape qui crée une représentation plus abstraite d'une phrase avant de la traduire dans un autre langage. Cette capacité d'abstraction est un élément clé dans la perspective de la création d'une intelligence artificielle généraliste. Interrogés, les deux chercheurs ont estimé qu'ils pourraient progresser en intégrant les variantes de leurs techniques respectives.

La capacité d’abstraction que les chercheurs ont réussi à intégrer dans leur système d’apprentissage automatique non supervisé est déterminante. © Anoyo, Fotolia

Le machine learning non supervisé est un élément clé de l’IA de demain

Les deux systèmes ont été comparés sur des tests de traductions anglais-français tirés d'une base commune de 30 millions de phrases. Ils ont chacun obtenu un score de 15 dans un sens (anglais-français) et dans l'autre (français-anglais). Sur le même exercice, Google Traduction obtient un score de 40, mais le service utilise de l'apprentissage supervisé. Les traducteurs humains sont en tête avec un score de 50. Si la méthode non supervisée est encore loin de ces niveaux de performance, elle s'e révèle déjà meilleure que la traduction mot à mot.

De plus, les auteurs précisent que leurs IA pourraient progresser si l'on introduisait une part d'apprentissage supervisé avec quelques milliers de phrases traduites en parallèle. Le système est encore balbutiant mais il va assurément progresser. Et le simple fait qu'une machine soit capable d'apprendre à traduire sans intervention humaine est déjà un immense progrès.

Voir aussi

Télécharger Google Traduction

Ce qu’il faut

retenir

Actuellement, la traduction automatique la plus performante est le fruit d’un apprentissage automatique supervisé.
Deux équipes de chercheurs, indépendamment, ont développé des méthodes très proches pour entraîner des IA de façon non supervisées qui sont capables de traduire des phrases sans connaissances préalables de la langue.

par Marc Zaffagni

Journaliste

le 30 novembre 2017

Nos articles

à lire aussi

Il sera désormais possible de transcrire un discours entier dans une autre langue avec Google Traduction. © Cybrain, Shutterstock

Tech

Traducteur

Google Traduction : la retranscription en temps réel arrive !

actualité

• 18/03/2020

Jusqu'où ira l'intelligence artificielle ? Nul ne le sait mais, depuis quelques années, des applications concrètes voient le jour. © Carlos castilla, Shutterstock

Tech

Technologie

Intelligence artificielle : les 7 innovations majeures selon Joël de Rosnay

actualité

• 25/08/2017

La maîtrise des échecs fut presque une simple formalité pour AlphaZero, l'IA de Google DeepMind. © Phongphan5922, Fotolia

Tech

Technologie

AlphaZero : l'IA de Google DeepMind devient imbattable aux échecs

actualité

• 07/12/2017

Intel dévoile ses premiers processeurs avec IA intégrée. © Intel

Tech

Intelligence artificielle

Intel Nervana : les premiers processeurs pour l'intelligence artificielle sont là !

actualité

• 21/08/2019

Des robots ont toujours peuplé notre imaginaire. © Hersson Piratoba, CC by-nc 2.0

Tech

Robotique

Robots et avatars

dossier

• 27/05/2021

Sciences

Métiers

Machine learning engineer

métier

• 10/06/2021

L'ingénieur en intelligence artificielle va créer des programmes informatiques pour que la machine raisonne comme l'Homme, les émotions en moins. © phonlamaiphoto, Adobe Stock

Sciences

Métiers

Ingénieur en intelligence artificielle

métier

• 26/12/2023

Le tech lead est le référent technique de l'entreprise. Il est garant des solutions technique déployées au sein de l'entreprise et de leur bon fonctionnement. © Seventyfour, Adobe Stock.

Sciences

Métiers

Tech lead

métier

• 29/12/2023

Le responsable informatique et réseau est responsable du parc informatique de son entreprise. Il gère aussi bien l'achat de matériel ou de licence informatique que la partie sécurité des systèmes d'information. © LIGHTFIELD STUDIOS, Adobe Stock.

Sciences

Métiers

Responsable informatique et réseau

métier

• 25/12/2023

Comment fonctionnent les logiciels de traduction automatique ? © Vegefox.com

Tech

Traducteur

Comment l'intelligence artificielle peut-elle être mise au service de la traduction ?

question réponse

• 12/07/2021

Qu’est-ce qui distingue exactement le machine learning du deep learning ? © D. Ichbiah généré avec Dreamlike.art

Tech

Intelligence artificielle

Machine Learning vs Deep Learning : quelles différences ?

question réponse

• 07/04/2024

Vivre mieux pendant plus longtemps. Voilà une bonne raison de parler une langue étrangère. © monsitj, Fotolia

Santé

Cerveau

Apprendre une langue étrangère : les bonnes raisons

question réponse

• 04/08/2018

Lorsqu’il s’agit d’apprendre une langue étrangère, les Français ne sont pas doués. Mais peut-être ont-ils une bonne excuse à présenter ? © esthermm, Fotolia

Santé

Divers

Pourquoi est-il difficile d’apprendre une langue étrangère ?

question réponse

• 01/07/2018

Tech

Google Maps

Google intègre une intelligence artificielle dans Maps et cela change tout !

brève

• 01/11/2023

Santé

Démence

Une intelligence artificielle peut prédire une démence future en lisant sur votre visage

brève

• 08/02/2021

La sélection de la

Rédaction

Avec son réseau de voisins-relais, Pickme permet de réduire les 20 % d’échecs à la première livraison. © Pickme

Tech

Jeunes Pousses

Les voisins-relais, la bonne idée pour réduire les échecs de livraison

Article

Dernier jour : une réduction de -250 € sur les suites Microsoft Office et Windows sur Godeal24 !

Tech

Bureautique

Dernier jour : une réduction de -250 € sur les suites Microsoft Office et Windows sur Godeal24 !

Article

40 % des aides ne sont pas réclamées en France ! Klaro a créé une application destinée à faciliter l’accès aux aides. © peopleimages.com, Adobe Stock

Tech

Jeunes Pousses

Ne passez plus à côté des aides auxquelles vous avez droit grâce à cette appli

Article

L’intelligence organoïde, promesse ou utopie ?

Tech

Intelligence artificielle

L’intelligence organoïde, promesse ou utopie ?

Article

Tech

Voiture

Renault Group accélère sur les pièces reconditionnées pour les voitures électriques

Article

100 millions de lunettes dorment au fond des tiroirs des Français. © Vecstock, Freepik

Tech

Jeunes Pousses

Cette startup française change la vision du monde avec des lunettes recyclées à petits prix !

Article

À l'horizon 2050, 100 % du gaz circulant dans le réseau de distribution pourrait être du gaz vert. © Wirestock, Freepik

Tech

Jeunes Pousses

Décarbonation : 20 % des gaz qui circuleront dans les réseaux en 2030 seront verts

Article

Quelque 600 000 décès par an en Europe sont liés à la pollution de l'air. © Nikitabuida, Freepik

Tech

Jeunes Pousses

Des purificateurs d’air pour tous les logements des athlètes aux Jeux olympiques

Article

Liens externes

À voir aussi

intelligence artificielle

intelligence artificielle danger

intelligence artificielle exemple

intelligence artificielle voiture autonome

innovation intelligence artificielle

lettre de motivation intelligence artificielle

thèse cifre intelligence artificielle

tipe intelligence artificielle

Mots Clés

Machine learning

Apprentissage automatique non supervisé

Apprentissage automatique supervisé

Guillaume lample

Mikel Artetxe

Traduction automatique

Réseau neuronal

Google Traduction