Impressionnant, le procédé mis au point par Nvidia affiche les images correspondantes au fil de l’écriture. © Nvidia
Tech

Bluffant ! Cette Intelligence artificielle transforme les mots en images

ActualitéClassé sous :technologie , intelligence artificielle , NVIDIA

Il suffit d'écrire quelques mots pour que l'IA de Nvidia affiche en temps réel des images correspondantes. Impressionnant !

---

Découvrez TechPod, le résumé bimensuel de l'actualité de la tech et de la mobilité !

---

Cela vous intéressera aussi

Saisir une phrase et voir apparaitre à l'écran au fur et à mesure des images photoréalistes l'illustrant, c'est la prouesse que parvient à réaliser une Intelligence artificielle mise au point par Nvidia. Baptisée GauGAN 2, il s'agit d'un version évoluée de cette IA, puisque GauGAN avait déjà été présenté en 2019. À l'époque, l'IA savait déjà transformer des croquis en images photoréalistes. Nvidia propose d'ailleurs un logiciel baptisé Canvas pour utiliser ce procédé. La seule contrainte est que le logiciel nécessite une carte graphique puissante de la marque pour pouvoir fonctionner.

Pour transformer les mots en images, GauGAN 2 utilise un modèle d'IA génératif particulier qui a été entraîné à partir de 10 millions d'images de paysages. Il ne sait donc pas vraiment improviser si les mots clés ont plusieurs sens ou s'ils sont trop subtiles, mais ce n'est que le début.

La version 2.0 de « Dessine-moi un mouton » avec ces simples mots « Peignez-moi une image ». La recherche de NVIDIA montre que la démo d'art GauGAN AI répond maintenant aux mots. © NVIDIA Developer

Mixer les mots clés et les croquis

Mieux encore, il est possible de mixer les fonctions de Canvas et celles des mots clés pour combiner le texte et des dessins. Le procédé permet d'aller plus loin dans la personnalisation du rendu en s'appuyant sur le croquis.

Sur son blog, le fondeur a publié une petite vidéo qui montre GauGAN 2 à l'œuvre. Sur une page web, l'utilisateur saisi progressivement des mots clés, tels que ocean waves hitting rocks on the beach (« les vagues de l'océan frappent les rochers sur la plage ») et l'on voit s'afficher les images correspondantes au fur et à mesure de la frappe. Impressionnant ! Nvidia propose de tester l'IA depuis un navigateur mais lors de nos tentatives, la page ne répondait pas.

Abonnez-vous à la lettre d'information La quotidienne : nos dernières actualités du jour. Toutes nos lettres d’information

!

Merci pour votre inscription.
Heureux de vous compter parmi nos lecteurs !