Ces images représentent un échantillon des extraits vidéo de la base de données Google qui décrivent les actions de chaque personne. © Google

Tech

L’IA de Google s’entraîne avec YouTube pour identifier les gestes humains

ActualitéClassé sous :intelligence artificielle , Google , analyse prédictive

Google a créé une base de données composées de vidéos YouTube pour entraîner une intelligence artificielle à identifier 80 gestes humains : se serrer la main, parler, courir, marcher... Pour rendre ses services plus efficaces, affirme l'entreprise.

Grâce à ses services en ligne, Google dispose d'une masse de données enrichies gracieusement par ses utilisateurs dont l'entreprise se sert pour faire avancer ses travaux en intelligence artificielle (IA). Le géant californien vient d'annoncer la création d'une base de données constituée à partir de vidéos YouTube qui servira à entraîner des algorithmes à reconnaître les actions humaines.

Nommée AVA, pour atomic visual actions, elle contient 57.600 séquences vidéo de trois secondes montrant une ou plusieurs personnes accomplir des gestes précis. Elles sont accompagnées d'un fichier contenant une description de ces gestes. L'image en tête de cet article montre des instantanés extraits de ces vidéos. C'est ainsi qu'un algorithme pourra apprendre à reconnaître une poignée de mains ou un baiser.

Google veut perfectionner ses méthodes d’analyse prédictive

AVA détaille 80 actions humaines parmi les plus courantes : être assis ou debout, courir, téléphoner, s'étreindre, trinquer, se brosser les dents, écrire, danser, fumer, etc. Google n'a pas puisé dans des vidéos d'amateurs, mais dans des films et des séries avec des acteurs professionnels. Dans l'article scientifique (arXiv) qui accompagne cette annonce, les experts de Google reconnaissent que ce type de contenu est un peu biaisé du fait de la mise en scène et de la dramatisation de certaines actions, mais ils assurent que cet outil est plus complet que ce qui existe dans ce domaine.

Grâce à cette base de données, Google va pouvoir perfectionner ses méthodes d'analyse prédictive, que ce soit pour mieux cibler ses publicités ou repérer des contenus à modérer sur YouTube. Mais l'article trace une perspective plus vaste qui est d'enseigner aux machines à « comprendre ce que les humains font, ce qu'ils pourraient faire et ce qu'ils cherchent à accomplir ».

Interview : comment est née l'intelligence artificielle ?  L’intelligence artificielle vise à mimer le fonctionnement du cerveau humain, ou du moins sa logique lorsqu’il s’agit de prendre des décisions. Jean-Claude Heudin, directeur du laboratoire de recherche de l’IIM (institut de l’Internet et du multimédia), nous explique l'origine de ces recherches.