Après avoir dominé les humains aux échecs, au jeu de go ou encore à StarCraft, l'intelligence artificielle franchit un nouveau pas en aidant les robots à manipuler des objets dans le monde réel. Au MIT, un robot combine pince, capteurs et caméra pour jouer au Jenga.


au sommaire


    Une équipe d'ingénieurs du Massachusetts Institute of Technology (MIT) vient de mettre au point un robot d'un nouveau genre. Celui-ci utilise une nouvelle approche de l'apprentissage automatique pour parvenir à manipuler correctement des objets dans le monde réel, en s'exerçant au jeu Jenga.

    L'intelligence artificielle a fait de grands progrès dernièrement dans son approche aux jeux comme les échecs ou le go, parvenant à battre les meilleurs joueurs mondiaux. Même avec des jeux plus complexes, comme StarCraft, les machines parviennent désormais au niveau des humains. Cependant, tous ces jeux restent virtuels. Avec le Jenga, le robot doit se confronter à un obstacle de taille : le monde réel.

    Les systèmes classiques d'apprentissage, qui se basent généralement sur les informations uniquement visuelles, rencontrent des difficultés pour ce genre d'applicationapplication. Cette nouvelle approche de l'apprentissage ajoute des informations tactiles. Grâce aux informations sur les manipulations effectuées, avec par exemple la force exercée et la résistancerésistance des blocs à être poussés ou tirés, le robot parvient à établir des schémas de fonctionnement avec un petit nombre d'expérimentations.

    L'apprentissage automatique permet au robot de limiter son nombre d'essais. © MIT

    Des informations tactiles pour interagir avec le monde physique

    Le robot développé par le MIT embarque une pince souple, une articulationarticulation avec un capteur de pression et une caméra externe qui lui permettent de mesurer ses interactions avec le monde physiquephysique. Le robot pousse alors un bloc et analyse les données visuelles et tactiles pour les comparer aux mesures et aux résultats de précédentes actions. Il apprend ainsi s'il doit continuer à pousser, ou essayer de déplacer un autre bloc.

    Les chercheurs ont modifié un bras robotique ABB IRB 120 et placé une tour Jenga à portée. Le robot s'est ensuite entraîné à choisir un bloc au hasard et à noter la force exercée et s'il a pu le sortir sans faire tomber la tour. Avec un système classique, l'entraînement aurait nécessité des dizaines de milliers d'essais (en reconstruisant la tour presque autant de fois...), mais avec cette nouvelle approche, seuls 300 essais ont suffi.

    Un modèle d’apprentissage sous forme de « clusters »

    Le robot a ensuite groupé les données selon les mesures et les résultats, par exemple des blocs faciles à déplacer, des blocs qui ont résisté, et d'autres qui ont fait tomber la tour. Le regroupement des informations en « clusters » de cette manière a grandement amélioré l'efficacité de l'apprentissage, et s'inspire du modèle humain : « Le robot construit des regroupements et apprend ensuite un modèle pour chaque cluster, plutôt que d'utiliser un seul modèle qui intègre l'ensemble des possibilités », indique Alberto Rodriguez, l'un des auteurs de l'article publié dans Science Robotics.

    Cette nouvelle approche pourrait avoir de nombreuses applications, par exemple pour le tri des déchets recyclables ou l'assemblage de produits de consommation. Selon Alberto Rodriguez, « sur une ligne d'assemblage de smartphones, presque à chaque étape, la sensation des éléments qui se clipsent, ou d'une vis filetée, provient de la force et du toucher plutôt que du visuel. Des modèles d'apprentissage pour ces actions sont un domaine d'application idéal pour ce genre de technologie ».