Google a mis au point un robot domestique dont l’IA est capable de comprendre des phrases et d’y réagir correctement sans jamais avoir été programmé pour cela. Le robot s’appuie sur un puissant modèle de langage allant chercher les informations nécessaires sur le Web.

Cela vous intéressera aussi

[EN VIDÉO] Interview : pourquoi construire des robots humanoïdes ? L’androïde est sans doute le type de robot le plus complexe sur le plan mécanique. Futura-Sciences a interrogé Jean-Claude Heudin, directeur du laboratoire de recherche de l’IIM (Institut de l’internet et du multimédia) afin de comprendre pourquoi il incarne le pinacle de la robotique.

Énoncer la commande vocale « J'ai faim » à un robot pour qu'il rapporte quelque chose à manger, cela pourrait sembler presque normal ou du moins faisable en 2022. Et pourtant, lorsque l'on sait que le robot en question n'a jamais été programmé pour comprendre ce qu'il faut faire pour répondre à cette requêterequête, cela reste très impressionnant.

Ce robot domestique, issu des laboratoires de GoogleGoogle et conçu par Fei Xia, un chercheur de la firme, vient de faire la démonstration de ses capacités. Le robot est doté d'une Intelligence artificielle qui lui permet de transformer une phrase qu'il ne connait pas en une suite d'événements physiquesphysiques. Pour y parvenir, le robot va rechercher un maximum d'informations sur le Web, afin de savoir ce qu'il faut faire selon la phrase énoncée. Le robot peut donc saisir toutes les subtilités et complexités du langage selon Google.

Cela veut dire qu'il n'y a pas besoin d'enrichir le robot avec de nombreuses commandes vocales, comme c'est le cas avec les assistants virtuels comme Alexa, Siri ou l'assistant Google. Ainsi, le chercheur a montré que, lorsque l'on renversait un liquideliquide, le robot réagissait en apportant une éponge alors qu'il ne l'avait jamais fait avant ni même appris à le faire.

Un puissant moteur linguistique

Pour comprendre et agir, le robot s'appuie sur le modèle de langage le plus puissant de chez Google. Il porteporte le nom de PaLM et absorbe de gigantesques quantités de textes provenant d'ouvrages ou du Web en utilisant le générateurgénérateur de texte OpenAI GPT-3. C'est de cette façon qu'il peut enrichir ses compétences linguistiques et réagir correctement à une phrase. PaLM est également capable d'expliquer en langage naturel comment il parvient à une réponse précise face à une question.

Côté matériel, l'architecture du robot, c'est-à-dire une colonne roulante dotée d'un bras articulé avec une pince, provient d'Everyday Robots, une filiale de Google planchant sur un robot majordome.

Même si ce robot intégrant une version de PaLM boostée, est prometteur, il ne faut pas oublier que les IA, même performantes restituent ce qu'elles ingurgitent sur le Web. C'est ainsi que le chatbot de Meta s'est retrouvé à répondre de façon raciste avec des tendances complotistes après quelques semaines d'activité.