Ce n'est pas le plus doué des « text to image » mais il est désormais accessible depuis Bing et donc, un grand nombre d'utilisateurs de ce moteur de recherche vont découvrir ce type d'application avec Dall.e 2. Comment peut-on faire pour qu'il génère des images bluffantes ?


au sommaire


    Trois applicationsapplications « text-to-image » (Générateur d'images IA) se sont imposées comme, a priori, les plus intéressantes du domaine.

    • Dall.e 2, de OpenAI, qui a été la première à apparaître ;
    • Midjourney, souvent considérée comme la meilleure en qualité d'image, même si sa prise en main n'est pas aisée. Nous lui avons d'ailleurs consacré un tutorial (ici) ;
    • Stable DiffusionDiffusion, dont l'interface est plus simple et qui rend donc aisé d'obtenir des visuels de qualité.

    D'autres applications ont vu le jour, notamment celles-ci :

    • Leonardo.ai qui se présente comme un sérieux concurrent à Midjourney ;
    • Maze Guru, fort prometteur, mais là encore pas très aisé à prendre en main ;
    • Adobe Firefly, simple d'usage, avec des visuels impressionnants.

    Le souci, avec les applications précitées est qu'il faut habituellement s'inscrire en vue de demander un accès, qui n'est généralement attribué qu'au bout de quelques semaines.

    Dall.e 2

    Dall.e 2 est l'œuvre de OpenAI, soit le créateur de ChatGPT. Or, ce n'est pas l'application la plus brillante en la matièrematière. Toutefois, il est probable que de nombreux utilisateurs vont découvrir les « text to image » avec Dall.e 2 car cet outil a été intégré à Bing Image Creator de MicrosoftMicrosoft, accessible depuis Bing. Alors, autant savoir comment amener Dall.e 2 à produire de belles images. L'une des clés va résider dans l'ajout d'un stylestyle particulier. Nous allons en voir maints exemples ici.

    Dall.e 2 est accessible depuis cette adresse. Cliquez sur Try DALL-E pour avoir accès à l'interface de frappe d'un texte.

    Nous sommes partis de cette requête : « un répliquant de Blade Runner assiste à une soirée mondaine dans un décor rétro-futuriste qui rappelle le XIXe siècle ».

    Comme vous pouvez le voir si vous essayez vous-même une telle requête, le résultat est banal. De plus, assez souvent, vous pourrez remarquer des imperfections dans les dessins.

    Par défaut, Dall.e 2 produit des images de piètre niveau. © OpenAI
    Par défaut, Dall.e 2 produit des images de piètre niveau. © OpenAI

    Couleur, ombre et lumière

    La première chose que l'on peut faire est d'ajouter des indications de couleurcouleur, d'ombre, de lumièrelumière. Nous avons aussi enrichi le prompt afin qu'il corresponde mieux à ce que souhaitons : « un répliquant de Blade Runner assiste à une soirée mondaine dans un décor rétro-futuriste qui rappelle le XIXe siècle, beaucoup d'invités habillés de façon extravagante, lumières tamisées couleurs pastel ».

    Que dire ? Nous obtenons une livraison plus prometteuse mais encore loin d'être satisfaisante, si l'on compare avec ce que nous obtiendrions sous Midjourney ou Stable Diffusion.

    Avec un prompt un peu plus long, des indications de couleur et de lumière, nous obtenons quelque chose de légèrement meilleur. La deuxième image a un peu d'allure. Toutefois nous sommes encore loin du compte. © OpenAI
    Avec un prompt un peu plus long, des indications de couleur et de lumière, nous obtenons quelque chose de légèrement meilleur. La deuxième image a un peu d'allure. Toutefois nous sommes encore loin du compte. © OpenAI

    Indiquer un style artistique

    La clé d'une image de qualité sous Dall.e 2 va consister à ajouter un style d'image.

    Dans le style d’un peintre ou d’un artiste graphique

    Une première option peut consister à demander que l'image soit produite dans le style d'un peintre ou d'un dessinateur célèbre. En voici un exemple : « un répliquant de Blade Runner assiste à une soirée mondaine dans un décor rétro-futuriste qui rappelle le XIXe siècle, beaucoup d'invités habillés de façon extravagante, style peinture Andy Warhol ». Pour simplifier, nous avons enlevé les indications de lumière et de couleurs.

    L'une des images représentées dans le style de Andy Warhol. Il y a là un peu plus de personnalité. © OpenAI
    L'une des images représentées dans le style de Andy Warhol. Il y a là un peu plus de personnalité. © OpenAI

    Art déco

    Ce mouvementmouvement artistique qui s'est épanoui durant les années 1920, privilégiait des formes géométriques élégantes. Tentons ce prompt : « un répliquant de Blade Runner assiste à une soirée mondaine dans un décor rétro-futuriste qui rappelle le XIXe siècle, beaucoup d'invités habillés de façon extravagante, style Art déco ».

    À présent, plusieurs des images ont semblé convenir plus ou moins à ce que nous pouvions rechercher.

    Les images avec l'ajout du style Art déco sont originales mais pas toujours exemptes d'imperfections. © OpenAI
    Les images avec l'ajout du style Art déco sont originales mais pas toujours exemptes d'imperfections. © OpenAI

    Gravure

    La technique de gravuregravure amène à tracer des lignes dans une plaque de métalmétal pour dessiner des formes. En demandant à Dall.e 2 d'appliquer ce style à l'image, nous obtenons des résultats qui s'avèrent tous intéressants. (À partir de maintenant, nous avons uniquement remplacé ce qui se trouvait après « style » dans le prompt.)

    Avec le style gravure, nous obtenons presque toujours des résultats fort intéressants. © OpenAI
    Avec le style gravure, nous obtenons presque toujours des résultats fort intéressants. © OpenAI

    Art vectoriel

    L'art vectoriel désigne l'art produit à partir d'un logiciel d'illustration vectorielle (mettant à profit des formules mathématiques) comme Adobe Illustrator. Habituellement, ce style produit des images nettes et colorées. Cette fois nous avons obtenu plusieurs images de qualité artistique.

    Avec le style art vectoriel, il est possible d’obtenir des rendus très artistiques. © OpenAI
    Avec le style art vectoriel, il est possible d’obtenir des rendus très artistiques. © OpenAI

    Vexel Art

    Le Vexel art est un art numérique dans lequel les images sont formées à partir de matrices de points colorés, et mis à profit pour certains jeux vidéo comme MinecraftMinecraft. Il produit habituellement des images riches en couleurs et détails.

    Avec le Vexel Art, nous obtenons des images de caractère, originales et stylées. Notons qu'il existe tout de même des incohérences ici : un pied de verre à champagne paraît suspendu dans le vide, le visage de la femme sur la droite est déformé... © OpenAI
    Avec le Vexel Art, nous obtenons des images de caractère, originales et stylées. Notons qu'il existe tout de même des incohérences ici : un pied de verre à champagne paraît suspendu dans le vide, le visage de la femme sur la droite est déformé... © OpenAI

    Ebru

    Ebru est une technique de peinture à la surface de l'eau. Il s'agit d'un art né en Turquie au XVe siècle. Quand on le met à profit dans Dall.e 2, les résultats sont presque toujours de qualité.

    Ebru produit des images très raffinées avec de riches dégradés de couleurs. © OpenAI
    Ebru produit des images très raffinées avec de riches dégradés de couleurs. © OpenAI

    D'autres styles ?

    Et voilà. Si une image vous séduit particulièrement, vous pouvez la télécharger, tout en sachant que le format de base est 1 024 x 1 024 px, ce qui pourra vous sembler insuffisant si vous souhaitez du matériel publiable. Ainsi, si vous souhaitez obtenir une définition plus élevée (et aussi une qualité d'image largement supérieure), il vaudrait mieux passer à MidJourney ou Stable Diffusion.

    Vous pouvez aussi essayer des styles comme le Pop art, le surréalisme, le Pop surréalisme qui est une combinaison des deux, le claymotion (comme dans Wallace & Gromit) et tout autre mouvement artistique qui vous interpelle.

    Vous pouvez aussi vous inspirer d'images réalisées par d'autres ; copier les prompts correspondants et les adapter à l'image que vous souhaitez obtenir.

    Sur la version accessible depuis le site de OpenAI, vous pouvez charger une image (upload image sur la page d'accueil) et générer des variations de celle-ci.