Les IA génératives d'images, également connues sous le nom de « text to image », sont une des révolutions les plus marquantes dans le domaine de l'IA. Qu'il s'agisse de Midjourney, Stable Diffusion, Dall.e, de Leonardo ou d'autres, ces applications sont souvent remarquables pour la beauté de leurs images, les options de modification qu'elles offrent, et la créativité qu'elles permettent à tout un chacun d'exprimer. Grâce à ces outils, de nouveaux horizons s'ouvrent à vous, avec des possibilités insoupçonnées.


au sommaire


    Les « text to image », ou applicationsapplications à même de convertir un texte en une image, ont été l'une des révélations de l'année 2022. L’intelligence artificielle, traditionnellement associée à des activités telles que la robotique, la vision par ordinateur, la reconnaissance du langage ou le comportement de personnages dans les jeux vidéo, s'est attaquée, cette fois, à l'art et à l'esthétique, des domaines dans lesquelles on n'aurait pas forcément imaginé qu'elle puisse s'immiscer. La surprise a été au rendez-vous.

    Voir aussi

    Comment utiliser l'analyse d'image de ChatGPT ?

    Après avoir testé la plupart des applications disponibles à ce jour, nous avons retenu 10 des plus marquantes, que ce soit par la qualité des images, la créativité dont elles font preuve, leur originalité ou encore la facilité d'usage.

    Dall.e

    À tout seigneur, tout honneur, Dall.e a été la première application proposant de générer des images à partir d'une phrase, et ce, dès janvier 2021. Toutefois, cette première version s'apparentait à un prototype. Les images que l'on pouvait créer avaient un aspect « peu fini ».

    Dès avril 2022, Dall.e 2 lui a succédé et cette fois, la qualité des images proposées a été convaincante. Les choix de couleurscouleurs, de décors, les ombres et lumièreslumières ont parfois été dignes d'œuvres artistiques.

    Toutefois, Dall.e 2 était encore loin d'égaler ses deux principaux concurrents, Midjourney et Stable DiffusionDiffusion. Cette situation a été résolue depuis la sortie de la version Dall.e 3 à l’automne 2023 qui fait désormais jeu égal sur de nombreux plans.

    Le point essentiel est que Dall.e 3 a été intégré à ChatGPT et qu'il est donc possible de lui faire appel directement depuis le chatbot, tout en profitant des atouts propres à ChatGPTChatGPT.

    Il faut certes disposer de la version payante de ChatGPT pour pouvoir exploiter Dall.e depuis ce chatbot. Toutefois, il est également possible d'y avoir accès gratuitement si l'on passe par le service Copilot de Microsoft.

    Voir aussi

    Comment utliser Copilot de Microsoft ?

    Ce qui a frappé les premiers utilisateurs de Dall.e, c'est la possibilité d'imaginer des scènes surréalistes et de voir l'application répondre à des demandes telles que : « un kangouroukangourou avec des dreadlocks habillé stylestyle Louis XV qui serre à la main à un cosmonautecosmonaute. Style de peinture à la Frida Kahlo ». Et de fait, les IAIA génératioves d'images nécessitent de s'accoutumer à la façon de formuler ses requêtes afin d'obtenir des résultats d'une grande qualité.

    Il suffit de poser une requête commençant par une expression telle que « dessine » pour que ChatGPT fasse appel à Dall.e 3. Et l’on peut, comme pour toute IA générative, lui demander de représenter des situations fort originales. © D. Ichbiah via ChatGPT-Dall.e 3 de OpenAI
    Il suffit de poser une requête commençant par une expression telle que « dessine » pour que ChatGPT fasse appel à Dall.e 3. Et l’on peut, comme pour toute IA générative, lui demander de représenter des situations fort originales. © D. Ichbiah via ChatGPT-Dall.e 3 de OpenAI

    Mid journey

    Mid Journey est une application qui produit des images d'une qualité indéniable à partir de phrases complexes. À l'origine, cette application était accessible de façon gratuite pour un nombre limité d'images. Qui plus est, il était nécessaire de taper sa demande sur le serveurserveur DiscordDiscord de cette application et de patienter tandis que défilait la génération des images demandées par d'autres utilisateurs du même service. Il arrivait donc que l'on ait du mal à retrouver ses petits.

    À présent, Midjourney est uniquement accessible sous forme payante. L'avantage est qu'il est possible d'accéder à un serveur dans lequel on est seul à poster ses requêtes et à visualiser les résultats. De plus, Midjourney propose désormais un accès depuis une interface Web.

    Il faut croire que Midjourney a bien des atouts car, en dépit de la relative difficulté d'usage et de la nécessité de souscrire un abonnement, cette application figure parmi les plus populaires du domaine de l’intelligence artificielle.

    Il est vrai que Midjourney représente le nec plus ultra des IA génératives d'images. La qualité des visuels qu'il est possible de produire dans les styles les plus divers, son parti pris esthétique, très stylisé, était même tel que cette application a pu présenter comme une mise à jour notable la possibilité de représenter des personnes au physiquephysique ordinaire ! Il n'est pas rare de voir cette application produire des visuels dignes d'un studio d'art, et ce, presque à tous les coups.

    Pour ce qui est de la qualité globale, ses concurrents s'acharnent à réduire l'écart et y parviennent parfois, mais Midjourney continue d'évoluer et d'offrir des services toujours plus impressionnants.

    MidJourney a aussi la capacité de produire le design d'un site Web sur le thème qui lui est donné et ce service est d'une qualité souvent stupéfiante.

    L’une des grandes forces de Midjourney est l’aspect photoréaliste de ses visuels, y compris dans des représentations picturales comme ce tableau. © Laeitano avec Midjourney
    L’une des grandes forces de Midjourney est l’aspect photoréaliste de ses visuels, y compris dans des représentations picturales comme ce tableau. © Laeitano avec Midjourney

    Stable Diffusion

    Stable Diffusion a très vite marqué les esprits par sa capacité à générer des images sophistiquées. La société créatrice de cet outil, Dreamstudio, dispose de serveurs puissants et donc, la génération d'images est plutôt rapide. Avant tout, Stable Diffusion est impressionnant au niveau de la richesse visuelle des images générées, avec une qualité digne de ce qu'aurait pu produire un graphiste, un dessinateur ou encore un photographe de haut niveau.

    Pour générer une image, il faut partir d'un prompt (description) qui doit être idéalement fort long. L'interface peut être intimidante au premier abord dès lors que l'on cherche à influencer les diverses options. Le plus simple est d'essayer divers paramètres et de constater ce qui en sort ou de s'inspirer de créations déjà effectuées en copiant leur prompt, ce qui est possible depuis des galeries telles que Lexica.art. Le résultat correspond rarement à ce que l'on attendait au premier abord et donc on prend assez vite l'habitude de lui spécifier des « negatives prompts », en gros, de lui spécifier aussi ce que l'on ne veut pas voir apparaître dans l'image : pas de gratte-ciel, pas de couleur mauve, pas de personnage hors cadre...

    Stable Diffusion peut aussi partir d'une image existante et en proposer des variations tout en offrant d'ajuster divers paramètres.

    Jusqu'au début de l'automneautomne 2023, Stable Diffusion affichait des capacités inférieures à Midjourney mais depuis la version XL, l’écart a été rattrapé sur de nombreuses fonctions.

    Stable Diffusion est accessible depuis un grand nombre de sites, notamment clipdrop.co, beta.dreamstudio.ai ou stablediffusionweb.com. Si certains sont gratuits, d'autres nécessitent d'acheter des crédits, mais le tarif est fort raisonnable.

    La princesse Leia en compagnie d’une créature extraordinaire. Cette image a été générée avec Stable Diffusion XL. © D. Ichbiah via stability.ai
    La princesse Leia en compagnie d’une créature extraordinaire. Cette image a été générée avec Stable Diffusion XL. © D. Ichbiah via stability.ai

    Leonardo

    S'il fallait décrire de façon simple ce qui fait la force de Leonardo, nous pourrions le résumer en une phrase : une qualité relativement similaire à celle de Midjourney, depuis une interface plus simple, qui favorise une meilleure flexibilité. De fait, c'est depuis un simple site Web que l'on tape sa demande. Leonardo produit des visuels d'une belle qualité avec une probabilité correcte d'obtenir un rendu correspondant bien à ce que l'on a demandé. Et de fait, cette application a rapidement obtenu une popularité notable.

    Lorsque l'on parcourt la galerie des images produites avec Leonardo, il y a de quoi être époustouflé. D'autant que l'application propose aussi des aides fort utiles pour le cas où vous manqueriez d'inspiration au niveau du style, comme une aide à la génération de prompts. Il dispose de maints outils avancés, par exemple ne modifier qu'une partie d'une image avec énormément de flexibilité.

    Leonardo est l’une des applications les accomplies en matière de «<em> text to image</em> ». © D. Ichbiah avec Leonardo.ai
    Leonardo est l’une des applications les accomplies en matière de « text to image ». © D. Ichbiah avec Leonardo.ai

    Adobe Firefly

    En tant que créateur d'applications comme Photoshop, Illustrator ou After Effects, Adobe se devait d'être présent dans le territoire des IA génératives d'images. Et autant le dire, son application Firefly a immédiatement marqué les esprits. Avant tout par sa simplicité d'usage qui surpasse la plupart de ses concurrents. Firefly repose sur un certain nombre de modèles prédéfinis et d'une très haute qualité.

    En combinant diverses options (éclairage, style, etc.) et en s'appuyant sur des galeries de modèles choisis, il est donc possible d'obtenir des résultats magnifiques à partir de requêtes ultrasimples. La version actuelle ne propose que 25 images gratuites par mois et donc, à défaut de s'abonner, il faut utiliser Firefly avec parcimonie.

    Il est aisé d'obtenir des images de ce type depuis Adobe Firefly. © D.Ichbiah via Adobe Firefly 
    Il est aisé d'obtenir des images de ce type depuis Adobe Firefly. © D.Ichbiah via Adobe Firefly 

    NightCafe

    NightCafe propose une interface qui facilite la création d'images. Une fois le prompt défini, il nous faut en premier lieu sélectionner un algorithme prédéfini. NightCafe s'appuie sur divers moteurs, notamment Dall.e ou Stable Diffusion, mais aussi d'autres outils moins connus comme Clip ou VQGAN qui autorisent des créations fort artistiques. Cet outil nous invite aussi à choisir parmi divers styles prédéfinis : artistique, animation numériquenumérique, manga... Il est possible au passage de mélanger plusieurs styles. Il suffit ainsi de se laisser guider et la création d'une image peut sembler assez longue. Certains des résultats que nous avons obtenus étaient plus qu'honorables et certains réellement beaux.

    Parmi les points originaux de NightCafe se trouve le fait que l'application encourage la possibilité de créer des images en faisant intervenir des amis, ce qui est en mesure de « boosterbooster » la créativité. Un avantage de cette application est qu'elle vous propose de gagner des points quotidiens - il suffit de la visiter - ce qui rend possible un usage gratuit prolongé.

    NightCafe facilite la création d'images étonnantes, tout en guidant l'utilisateur dans le processus de création. © D. Ichbiah via NightCafé
    NightCafe facilite la création d'images étonnantes, tout en guidant l'utilisateur dans le processus de création. © D. Ichbiah via NightCafé

    Maze Guru

    Les images issues de Maze Guru sont d'une qualité et d'une créativité appréciables. Une version simplifiée de cet outil est accessible depuis le site Web de Maze Guru. Toutefois, il semblerait qu'il faille d'abord s'inscrire sur le forum Discord de Maze Guru pour accéder à l'outil Web.

    Il est possible avec Maze Guru de générer des visuels fantastiques fictifs, mais aussi une version de soi-même en cyborgcyborg, personnage de Pixar ou autre. Un grand nombre de modèles fort esthétiques sont disponibles et il suffit de cliquer sur des visuels pour les choisir un à un. Autant le savoir, si vous choisissez le modèle Disco, les images peuvent être fort longues à produire.

    Si vous en avez le courage, vous pouvez opérer depuis le serveur Discord de Maze Guru qui fonctionne sur le même principe que MidJourney : génération de quatre images, variations sur l'une d'entre elles, agrandissement... Reconnaissons-le : tout cela n'est pas facile à prendre en main, même si, au bout de quelques minutes de pratique, vous devriez parvenir à maîtriser cette approche. Il reste que l'on prend goût à observer les créations d'autres internautes et il en résulte une source d'inspiration régulière.

    Les visuels issus de Maze Guru sont souvent d'une créativité remarquable. © D. Ichbiah avec Maze Guru
    Les visuels issus de Maze Guru sont souvent d'une créativité remarquable. © D. Ichbiah avec Maze Guru

    Playground

    Apparue au début de 2023, Playground a très vite attiré de très nombreux fans. Il est vrai que cette application a une approche fort conviviale. Attention, il est important de bien choisir l'application playgroundai.com, car playground.ai correspond à une autre application, bien moins sophistiquée.

    Playground démarre par un tutorial visant à nous accoutumer à ses fonctions et le mieux est de le suivre tel quel. Nous découvrons assez vite que la force de Playground est d'être raccordé à la très populaire application Canva, ce qui implique qu'il est aisé d'intervenir dans une image qui a été créée : supprimer des éléments, ajuster le visuel, compléter des parties manquantes... Autant de fonctions que proposent les autres IA génératives mais qui sont ici accessibles depuis une interface familière. Seul revers : la version gratuite est parfois bien lente.

    Playground peut engendrer des visuels d’une belle finesse. © Playground
    Playground peut engendrer des visuels d’une belle finesse. © Playground

    Deep Dream Generator

    Deep Dream est un outil qui se veut simple : il repose donc sur une seule page dans laquelle sont définis les critères de l'image souhaitée - celle-ci pouvant être intégrée à une photographiephotographie existante. Si l'on clique sur « Modifier », Deep Dream propose divers guides. Par exemple, des listes d'artistes (Picasso, Michel AngeAnge...), des effets, de la lumière, le style photographique... Avantage : par défaut, cet outil crée des images en mode paysage, de belle définition et fort rapidement.

    Deep Dream facilite la création d'image en nous guidant dans le choix de styles. © Deep Dream
    Deep Dream facilite la création d'image en nous guidant dans le choix de styles. © Deep Dream

    DeepAI

    Si votre désir est avant tout de produire des images ayant l'aspect de peintures, alors DeepAI est à même de répondre à ce désir. Une fois le texte de son choix introduit, vous pouvez choisir un style pictural, et DeepAI génère un visuel adapté. Si le résultat ne vous convient pas, vous pouvez choisir un autre type de peinture. Les options sont limitées au choix de la forme de l'image (carré, rectangulaire...). Il reste que ce type d'outil est bien adapté à ceux qui ne désirent pas se perdre dans les détails techniques.

    DeepAI produit des visuels ayant un aspect artistique et ce, de façon très simple : pour l'essentiel, vous tapez un texte puis sélectionnez un style prédéfini. © DeepAI
    DeepAI produit des visuels ayant un aspect artistique et ce, de façon très simple : pour l'essentiel, vous tapez un texte puis sélectionnez un style prédéfini. © DeepAI