Ce n'est pas le plus doué des « text to image » mais il est désormais accessible depuis Bing et donc, un grand nombre d'utilisateurs de ce moteur de recherche vont découvrir ce type d'application avec Dall.e 2. Comment peut-on faire pour qu'il génère des images bluffantes ?
au sommaire
Trois applicationsapplications « text-to-image » (Générateur d'images IA) se sont imposées comme, a priori, les plus intéressantes du domaine.
- Dall.e 2, de OpenAI, qui a été la première à apparaître ;
- Midjourney, souvent considérée comme la meilleure en qualité d'image, même si sa prise en main n'est pas aisée. Nous lui avons d'ailleurs consacré un tutorial (ici)) ;
- Stable DiffusionDiffusion, dont l'interface est plus simple et qui rend donc aisé d'obtenir des visuels de qualité.
D'autres applications ont vu le jour, notamment celles-ci :
- Leonardo.ai qui se présente comme un sérieux concurrent à Midjourney ;
- Maze Guru, fort prometteur, mais là encore pas très aisé à prendre en main ;
- Adobe Firefly, simple d'usage, avec des visuels impressionnants.
Le souci, avec les applications précitées est qu'il faut habituellement s'inscrire en vue de demander un accès, qui n'est généralement attribué qu'au bout de quelques semaines.
Dall.e 2
Dall.e 2 est l'œuvre de OpenAI, soit le créateur de ChatGPT. Or, ce n'est pas l'application la plus brillante en la matièrematière. Toutefois, il est probable que de nombreux utilisateurs vont découvrir les « text to image » avec Dall.e 2 car cet outil a été intégré à Bing Image Creator de MicrosoftMicrosoft, accessible depuis Bing. Alors, autant savoir comment amener Dall.e 2 à produire de belles images. L'une des clés va résider dans l'ajout d'un stylestyle particulier. Nous allons en voir maints exemples ici.
Dall.e 2 est accessible depuis cette adresse. Cliquez sur Try DALL-E pour avoir accès à l'interface de frappe d'un texte.
Nous sommes partis de cette requête : « un répliquant de Blade Runner assiste à une soirée mondaine dans un décor rétro-futuriste qui rappelle le XIXe siècle ».
Comme vous pouvez le voir si vous essayez vous-même une telle requête, le résultat est banal. De plus, assez souvent, vous pourrez remarquer des imperfections dans les dessins.
Couleur, ombre et lumière
La première chose que l'on peut faire est d'ajouter des indications de couleurcouleur, d'ombre, de lumièrelumière. Nous avons aussi enrichi le prompt afin qu'il corresponde mieux à ce que souhaitons : « un répliquant de Blade Runner assiste à une soirée mondaine dans un décor rétro-futuriste qui rappelle le XIXe siècle, beaucoup d'invités habillés de façon extravagante, lumières tamisées couleurs pastel ».
Que dire ? Nous obtenons une livraison plus prometteuse mais encore loin d'être satisfaisante, si l'on compare avec ce que nous obtiendrions sous Midjourney ou Stable Diffusion.
Indiquer un style artistique
La clé d'une image de qualité sous Dall.e 2 va consister à ajouter un style d'image.
Dans le style d’un peintre ou d’un artiste graphique
Une première option peut consister à demander que l'image soit produite dans le style d'un peintre ou d'un dessinateur célèbre. En voici un exemple : « un répliquant de Blade Runner assiste à une soirée mondaine dans un décor rétro-futuriste qui rappelle le XIXe siècle, beaucoup d'invités habillés de façon extravagante, style peinture Andy Warhol ». Pour simplifier, nous avons enlevé les indications de lumière et de couleurs.
Art déco
Ce mouvementmouvement artistique qui s'est épanoui durant les années 1920, privilégiait des formes géométriques élégantes. Tentons ce prompt : « un répliquant de Blade Runner assiste à une soirée mondaine dans un décor rétro-futuriste qui rappelle le XIXe siècle, beaucoup d'invités habillés de façon extravagante, style Art déco ».
À présent, plusieurs des images ont semblé convenir plus ou moins à ce que nous pouvions rechercher.
Gravure
La technique de gravuregravure amène à tracer des lignes dans une plaque de métalmétal pour dessiner des formes. En demandant à Dall.e 2 d'appliquer ce style à l'image, nous obtenons des résultats qui s'avèrent tous intéressants. (À partir de maintenant, nous avons uniquement remplacé ce qui se trouvait après « style » dans le prompt.)
Art vectoriel
L'art vectoriel désigne l'art produit à partir d'un logiciel d'illustration vectorielle (mettant à profit des formules mathématiques) comme Adobe Illustrator. Habituellement, ce style produit des images nettes et colorées. Cette fois nous avons obtenu plusieurs images de qualité artistique.
Vexel Art
Le Vexel art est un art numérique dans lequel les images sont formées à partir de matrices de points colorés, et mis à profit pour certains jeux vidéo comme MinecraftMinecraft. Il produit habituellement des images riches en couleurs et détails.
Ebru
Ebru est une technique de peinture à la surface de l'eau. Il s'agit d'un art né en Turquie au XVe siècle. Quand on le met à profit dans Dall.e 2, les résultats sont presque toujours de qualité.
D'autres styles ?
Et voilà. Si une image vous séduit particulièrement, vous pouvez la télécharger, tout en sachant que le format de base est 1 024 x 1 024 px, ce qui pourra vous sembler insuffisant si vous souhaitez du matériel publiable. Ainsi, si vous souhaitez obtenir une définition plus élevée (et aussi une qualité d'image largement supérieure), il vaudrait mieux passer à MidJourney ou Stable Diffusion.
Vous pouvez aussi essayer des styles comme le Pop art, le surréalisme, le Pop surréalisme qui est une combinaison des deux, le claymotion (comme dans Wallace & Gromit) et tout autre mouvement artistique qui vous interpelle.
Vous pouvez aussi vous inspirer d'images réalisées par d'autres ; copier les prompts correspondants et les adapter à l'image que vous souhaitez obtenir.
Sur la version accessible depuis le site de OpenAI, vous pouvez charger une image (upload image sur la page d'accueil) et générer des variations de celle-ci.