Une équipe Google spécialisée en apprentissage profond a entraîné PlaNet, un réseau neuronal, à déterminer la localisation d’une photographie en se servant uniquement des pixels qu’elle contient. Cette intelligence artificielle (AI) utilise peu de ressources et pourrait même fonctionner sur un smartphone.

au sommaire


    Avez-vous déjà regardé une photographiephotographie et essayé de savoir dans quel pays voire en quel lieu précis elle a été prise ? Très difficile, et même carrément impossible quand on ne dispose pas d'indice visuel exploitable. Seule une solidesolide expérience de globe-trotteur peut s'avérer utile. Et encore, celle-ci aura forcément ses limites. Chez Google, une intelligence artificielle (AI), qui n'occupe que quelques centaines de mégaoctets de mémoire, est capable de ce genre de prouesse avec un niveau de réussite déjà très impressionnant.

    Baptisé PlaNet, ce réseau neuronal d'apprentissage profondapprentissage profond est capable d'analyser une image et d'en déterminer la localisation. Il est le fruit du travail d'une équipe emmenée par Tobias Weyand, un ingénieur logiciel spécialisé dans la vision par ordinateur. Le système divise le monde en une grille de 26.000 zones dont les dimensions varient selon la quantité de photos prises dans chacune d'elles. Ainsi, la densité du quadrillage est plus importante dans les grandes villes où le nombre de photos prises est plus élevé que dans des régions peu ou pas peuplées (les océans et les pôles).

    Pour entraîner ce réseau neuronal profond, l'équipe GoogleGoogle a eu recours à une immense base de données contenant 126 millions de photographies de lieux, monuments, paysages, etc., accompagnées de leurs coordonnées GPS. 91 millions de ces images ont servi à la formation de PlaNet. Ainsi, l'intelligence artificielleintelligence artificielle a pu se forger une connaissance en rassemblant les images comportant des similitudes pour les associer à une localisation géographique précise.

    Les 34 millions d'images restantes de la base de données ont permis de valider l'efficacité de l'apprentissage et de corriger les erreurs statistiques. PlaNet a ensuite été confronté à des séries de tests aléatoires. Lors d'un premier défi, il a dû analyser 2,3 millions d'images provenant du réseau socialréseau social Flickr. Résultat, l'AI est parvenue à identifier le continent d'origine pour 48 % des clichés et le pays d'origine pour 28,4 % d'entre eux. L'efficacité baisse sensiblement lorsqu'il s'agit de localiser une ville à partir d'une rue (3,6 %)) ou d'une vue plus globale (10,1 %).

    GeoGuess consiste à resituer une image prise au hasard dans Google Street View. On clique sur un point de la mappemonde puis l’on appuie sur le bouton <em>« make a guess »</em> pour voir à quelle distance exacte on se situe de la vérité. © GeoGuess

    GeoGuess consiste à resituer une image prise au hasard dans Google Street View. On clique sur un point de la mappemonde puis l’on appuie sur le bouton « make a guess » pour voir à quelle distance exacte on se situe de la vérité. © GeoGuess

    PlaNet bat les humains au jeu GeoGuess

    Pris comme tels, ces pourcentages peuvent paraître moyens voire médiocres. Mais il faut savoir qu'ils sont déjà supérieurs à ce dont les humains sont capables. Pour preuve, PlaNet a également été confronté à dix voyageurs chevronnés à travers le jeu en ligne GeoGuess. Le but est de situer sur une carte une image tirée au hasard de Google Street View. PlaNet a remporté 28 des 50 manches avec une erreur de localisation moyenne de 1.131 kilomètres contre 2.320 kilomètres pour ses opposants.

    « PlaNet possède un avantage sur les humains car il a vu beaucoup plus de lieux qu'aucun d'entre eux ne pourra jamais visiter et il a assimilé des indices subtils de différentes scènes qui sont difficiles à distinguer même pour un voyageur expérimenté », estime Tobias Weyand.

    Mais ce qui est peut-être le plus impressionnant dans cette démonstration, c'est le fait que ce réseau neuronal n'utilise que 377 Mo de mémoire. Ce qui signifie qu'il pourrait donc fonctionner sur un smartphone. Futura-Sciences a récemment évoqué les progrès réalisés au niveau des processeurs graphiquesprocesseurs graphiques qui permettent d'envisager qu'une intelligence artificielle puisse fonctionner directement sur un smartphone, des objets connectés ou une voiture autonomevoiture autonome sans passer par une connexion InternetInternet. Les travaux de Google vont dans ce sens avec en ligne de mire un perfectionnement de ses propres services.