Longtemps lanterne rouge des IA génératives d'images, la nouvelle formule de Dall.e de OpenAI accumule les superlatifs de la part des quelques privilégiés qui ont pu la tester.
au sommaire
S'il est un trône qui est vivement convoité, c'est celui de l'IAIA générative d'image (text-to-imagetext-to-image)) qui surpasse toutes les autres. Et depuis l'an dernier, un vainqueur s'est affirmé : Midjourney. Créé par un ingénieur de Floride, David Holz, Midjourney a révélé une qualité telle qu'il a été jusqu'à produire la couverture d’une édition du très sérieux magazine The Economist.
Le Top des IA génératives d’image
Toutefois, plusieurs concurrents sont en lice, dont une applicationapplication de OpenAI, le créateur de ChatGPTChatGPT : Dall.e. La version actuelle s'intitule Dall.e 2. Seulement voilà, Dall.e 2 est habituellement la lanterne rouge des IA génératives d'images.
Le top serait actuellement le suivant :
1. Midjourney ;
2. Stable DiffusionDiffusion XL ;
3. Leonardo.ai ;
4. Adobe Firefly ;
5. Dall.e 2.
Pourtant les jeux sont loin d'être faits. En réalité, la toute dernière version de Stable Diffusion XL fait jeu égal avec Midjourney sur de nombreux points.
Un défi à relever
Pour OpenAI, il y avait là un défi à relever. Pour le créateur de ChatGPT, être désigné comme le dernier de la classe n'est pas très honorable. Il semblerait donc que OpenAI ait mis les bouchées doubles pour remettre les pendules à l'heure.
400 testeurs triés sur le volet
Le nouveau Dall.e 3 s'apprête à dévoiler ses atouts. OpenAI a même déjà créé une page sur son site pour le présenter.
Plusieurs points ressortent :
- Dall.e 3 a l'airair très bien intégré à ChatGPT. On pose des questions et l'IA répond avec les dessins demandés, tout comme elle peut proposer une histoire ;
- Dall.e 3 semble à l'aise pour représenter des affiches avec un texte à l'intérieur - l'un des points faibles de Midjourney. Mais aussi pour intégrer du texte descriptif d'une image - une forme que nous n'avions pas vue jusqu'à présent ;
- La qualité des visuels présentée est très élevée, bien plus qu'avec Dall.e 2 et il en est de même pour le niveau de détail de certaines créations.
Seulement voilà. Pour en avoir le cœur net, c'est une autre affaire. OpenAI nous demande de patienter. Quelque 400 testeurs triés sur le volet ont été choisis et ils sont pour l'instant les seuls à pouvoir juger des potentiels de Dall.e 3.
Des capacités « démentielles »
Que dire ? Les réactions de ceux qui l'ont testé laissent à penser que OpenAI aurait préparé un véritable « Midjourney killer ». Pour ne citer qu'un exemple, le YoutubeurYoutubeur MattVidPro se montre peu avare en superlatifs, évoquant des capacités « démentielles » (insane, en anglais) qui selon lui, laisseraient Midjourney sur le carreau.
L'une des raisons pour lesquelles OpenAI prend son temps, c'est aussi pour installer tous les garde-fousgarde-fous à même de la protéger contre des attaques judiciaires. Ainsi, George R.R. Martin, le créateur de Games of Throne a récemment rejoint une liste de plaignants envers ChatGPT, une liste qui semble s'allonger de semaine en semaine.
Une IA générative pour les gouverner toutes
Cette frénésie rappelle les débuts du Web, lorsque GoogleGoogle a ravi la place de Yahoo! en l'espace d'une année ou deux, et AmazonAmazon s'est imposée comme la boutique de prédilection des internautes. Ainsi, nous pouvons être certains que Midjourney, Dreamstudio (Stable Diffusion) ou Leonardo préparent leur riposte. À suivre, donc.