Dall-E 3: vous pourrez bientôt générer des images sur ChatGPT

vous pourrez bientôt générer des images sur ChatGPT

Le créateur de ChatGPT a annoncé la troisième version de son intelligence artificielle générative d'images. Et pour concurrencer Midjourney et Stable Diffusion, OpenAI promet beaucoup d'améliorations.

Créer des images plus vraies que nature sera encore plus facile. OpenAI, l'entreprise qui a popularisé les intelligences artificielles génératives avec ChatGPT, a levé le voile sur Dall-E 3, la nouvelle version de son IA générative d'image. Vaut-elle le coup? Et quelle différence avec ses concurrents?

Dall-E 3 promet évidemment des images encore plus réalistes que son prédécesseur, et une meilleure compréhension des requêtes, détaille OpenAI dans son post de blog. Mais la principale promesse, c'est que cette version sera bien plus facile à utiliser que ses concurrents, notamment Midjourney et Stable Diffusion.

Accessible directement via ChatGPT

La raison? Si vous avez déjà joué avec Midjourney, vous savez que la formulation du "prompt" (la requête) est souvent compliquée. Pour avoir un résultat précis, il ne faut pas faire une phrase simple en langage naturel, mais rajouter des formulations techniques parfois obscures: qualité d'image ("4k uhd"), lumière ("golden hour"), format ("ar 3:2")...

Au contraire, Dall-E 3 sera utilisable directement via ChatGPT et pourra interpréter des phrases de manière très détaillée, selon les exemples proposés par OpenAI.

Un exemple d'image générée par Dall-E 3, avec les prompts associés © OpenAI

Mieux: vous pourrez continuer la conversation avec ChatGPT pour lui demander de changer quelques détails, ou de replacer les mêmes personnages dans un contexte différent, comme l'explique l'entreprise dans la vidéo ci-dessous.

L'entreprise assure également s'être améliorée dans la gestion des droits d'auteur – car les programmes comme Dall-E sont entraînés sur des millions d'images récupérées sur internet, la plupart du temps sans l'accord de leur créateur. Les artistes peuvent remplir un formulaire pour demander à OpenAI de ne pas être inclus dans les données d'entraînement de ses prochains générateurs d'images. Impossible, en revanche, de s'extraire des modèles déjà entraînés comme Dall-E 2 et 3.

Uniquement sur abonnement

OpenAI assure également que Dall-E 3 est conçu pour "rejeter les requêtes qui réclament des images dans le style d'un artiste vivant" – une phrase qui pourrait donc ne pas concerner les artistes décédés. Et l'IA aurait été entraînée pour éviter de reproduire les biais discriminatoires potentiellement présents dans ses données d'entraînement (par exemple, générer uniquement des images d'hommes avec le mot "médecin" et de femmes avec le mot "sage-femme").

La dernière différence est au niveau du prix: contrairement à Dall-E 2 (qui était accessible à tous avec un nombre limité d'utilisations), Dall-E 3 ne sera ouvert qu'aux abonnés à ChatGPT Plus, le service payant qui permet aussi d'utiliser GPT-4. Les entreprises pourront aussi en bénéficier via ChatGPT Enterprise, le tout à partir du mois d'octobre.

Source