au sommaire
A partir d'une image (à gauche), le logiciel a retrouvé parmi des millions celles qui lui ressemblent (à droite). © Antonio Torralba/Rob Fergus/Yair Weiss
Jusqu'où peut-on dégrader une image de sorte qu'elle reste reconnaissable ? La question n'est pas si triviale qu'elle en a l'airair et vient de recevoir une réponse de la part d'une équipe internationale. Ces chercheurs ont appliqué à des photographiesphotographies la classique compression JPeg de nombreuses fois de suite. Le résultat est étonnant : la quantité minimale varie, selon les cas, entre 256 et 1.024 octets, soit moins du millième de l'encombrement habituel d'une photo produite par un appareil numérique. Après une telle cure d'amaigrissement, la qualité de la photo devient épouvantable mais l'équipe a démontré qu'elle restait reconnaissable.
Le but de Antonio Torralba (Massachussetts Institute of Technology)), Rob Fergus (Courant Institute of Mathematical Sciences, université de New York) et Yair Weiss (School of Computer Science, Hebrew University, Jérusalem, Israël) n'était pas de réaliser une performance mais de mettre au point une méthode efficace pour trouver un certain type d'image parmi des milliers ou des millions. Actuellement, expliquent-ils, le Web regorge d'images que tout le monde peut utiliser. Même les ordinateurs personnels en stockent un très grand nombre sur leurs disques durs. Mais pour rechercher une image, on ne peut encore que se limiter à du texte, en l'occurrence son titre ou des mots-clés. La reconnaissance de formes existe mais elle est très lente et reste inapplicable à de grands stocks d'images. Impossible, en pratique, pour un logiciellogiciel de résoudre ce problème simple : « quelles sont les photographies où l'on voit un paysage verdoyant ? ».
Images compressées à des taux variables (le nombre de bits est indiqué à gauche). Même lorsqu'il ne reste que 1.024 bits, voire 256, un être humain saura reconnaître l'oiseau, la maison, le dessin de palmier... Le logiciel dont il est question ici saura lui aussi déterminer les caractéristiques des objets photographiés puis les retrouver sur d'autres images. © Antonio Torralba/Rob Fergus/Yair Weiss
Les traits caractéristiques d'une image
D'où cette idée : simplifions les images au maximum pour en faire des copies de faible taille (en octets) et mettons au point une méthode mathématique pour caractériser les formes qui s'y trouvent. C'est ce qu'ont fait les trois chercheurs. « Nous essayons de trouver un code binairecode binaire très court pour identifier une image » précise Antonio Torralba. Pour l'instant, la méthode qu'ils ont mise au point fonctionne par comparaison. A partir d'une image test, elle sait trouver dans une photothèque toutes celles qui lui ressemblent. Montrez-lui une photo de paysage et le logiciel rapportera tous les paysages de la base de donnéesbase de données. Si, parmi, ces images, l'une d'elles a déjà été identifiée par un être humain par le mot « paysage », alors le problème est complètement résolu. Le logiciel sait désormais que ce mot s'applique à toutes les images qu'il a trouvées.
Avec une taille par image réduite entre 256 et 1.024 octets, la méthode permet un travail rapide. Un simple ordinateur personnel peut alors effectuer le travail dans un temps raisonnable en utilisant une quantité de mémoire relativement faible. Pour leurs tests, les chercheurs ont ainsi enregistré 12,9 millions de photographies issues d'InternetInternet dans seulement 600 Mo.
Cette recherche n'est qu'une étape insiste les chercheurs. Il faut qu'au moins l'une des images trouvées ait été identifiée et le problème reste entier pour les objets inhabituels qui figurent rarement dans les images. Mais ce travail brise une limite, en permettant à la puissance informatique d'un micro-ordinateurmicro-ordinateur de fouiller dans d'immenses bases de données, à commencer par le Web.