Mots-clés |
  • smartphone,
  • google

À quel endroit de la planète cette photo a été prise ? Google le sait

Une équipe Google spécialisée en apprentissage profond a entraîné PlaNet, un réseau neuronal, à déterminer la localisation d’une photographie en se servant uniquement des pixels qu’elle contient. Cette intelligence artificielle (AI) utilise peu de ressources et pourrait même fonctionner sur un smartphone.

Sauriez-vous dire dans quel pays cette photo a été prise en vous basant sur les seuls éléments visibles à l’image ? PlaNet, une nouvelle intelligence artificielle de Google, en est capable. © Galyna Andrushko, Shutterstock Sauriez-vous dire dans quel pays cette photo a été prise en vous basant sur les seuls éléments visibles à l’image ? PlaNet, une nouvelle intelligence artificielle de Google, en est capable. © Galyna Andrushko, Shutterstock

À quel endroit de la planète cette photo a été prise ? Google le sait - 2 Photos
Pla Net

PDF

Avez-vous déjà regardé une photographie et essayé de savoir dans quel pays voire en quel lieu précis elle a été prise ? Très difficile, et même carrément impossible quand on ne dispose pas d'indice visuel exploitable. Seule une solide expérience de globe-trotteur peut s’avérer utile. Et encore, celle-ci aura forcément ses limites. Chez Google, une intelligence artificielle (AI), qui n’occupe que quelques centaines de mégaoctets de mémoire, est capable de ce genre de prouesse avec un niveau de réussite déjà très impressionnant.

Baptisé PlaNet, ce réseau neuronal d’apprentissage profond est capable d’analyser une image et d’en déterminer la localisation. Il est le fruit du travail d’une équipe emmenée par Tobias Weyand, un ingénieur logiciel spécialisé dans la vision par ordinateur. Le système divise le monde en une grille de 26.000 zones dont les dimensions varient selon la quantité de photos prises dans chacune d’elles. Ainsi, la densité du quadrillage est plus importante dans les grandes villes où le nombre de photos prises est plus élevé que dans des régions peu ou pas peuplées (les océans et les pôles).

Pour entraîner ce réseau neuronal profond, l’équipe Google a eu recours à une immense base de données contenant 126 millions de photographies de lieux, monuments, paysages, etc., accompagnées de leurs coordonnées GPS. 91 millions de ces images ont servi à la formation de PlaNet. Ainsi, l’intelligence artificielle a pu se forger une connaissance en rassemblant les images comportant des similitudes pour les associer à une localisation géographique précise.

Les 34 millions d’images restantes de la base de données ont permis de valider l’efficacité de l’apprentissage et de corriger les erreurs statistiques. PlaNet a ensuite été confronté à des séries de tests aléatoires. Lors d’un premier défi, il a dû analyser 2,3 millions d’images provenant du réseau social Flickr. Résultat, l’AI est parvenue à identifier le continent d’origine pour 48 % des clichés et le pays d’origine pour 28,4 % d’entre eux. L’efficacité baisse sensiblement lorsqu’il s’agit de localiser une ville à partir d’une rue (3,6 %) ou d’une vue plus globale (10,1 %).

GeoGuess consiste à resituer une image prise au hasard dans Google Street View. On clique sur un point de la mappemonde puis l’on appuie sur le bouton « make a guess » pour voir à quelle distance exacte on se situe de la vérité. © GeoGuess
GeoGuess consiste à resituer une image prise au hasard dans Google Street View. On clique sur un point de la mappemonde puis l’on appuie sur le bouton « make a guess » pour voir à quelle distance exacte on se situe de la vérité. © GeoGuess

PlaNet bat les humains au jeu GeoGuess

Pris comme tels, ces pourcentages peuvent paraître moyens voire médiocres. Mais il faut savoir qu’ils sont déjà supérieurs à ce dont les humains sont capables. Pour preuve, PlaNet a également été confronté à dix voyageurs chevronnés à travers le jeu en ligne GeoGuess. Le but est de situer sur une carte une image tirée au hasard de Google Street View. PlaNet a remporté 28 des 50 manches avec une erreur de localisation moyenne de 1.131 kilomètres contre 2.320 kilomètres pour ses opposants.

« PlaNet possède un avantage sur les humains car il a vu beaucoup plus de lieux qu’aucun d’entre eux ne pourra jamais visiter et il a assimilé des indices subtils de différentes scènes qui sont difficiles à distinguer même pour un voyageur expérimenté », estime Tobias Weyand.

Mais ce qui est peut-être le plus impressionnant dans cette démonstration, c’est le fait que ce réseau neuronal n’utilise que 377 Mo de mémoire. Ce qui signifie qu’il pourrait donc fonctionner sur un smartphone. Futura-Sciences a récemment évoqué les progrès réalisés au niveau des processeurs graphiques qui permettent d’envisager qu’une intelligence artificielle puisse fonctionner directement sur un smartphone, des objets connectés ou une voiture autonome sans passer par une connexion Internet. Les travaux de Google vont dans ce sens avec en ligne de mire un perfectionnement de ses propres services.


À voir aussi sur Internet

Sur le même sujet

Vos réactions

Chargement des commentaires