Bien qu’il ait fait des progrès significatifs depuis sa sortie initiale, DALL-E est loin d’être parfait. L’outil de création artistique présente un certain nombre de problèmes à surmonter, dont beaucoup deviennent plus apparents avec une utilisation régulière. Les incohérences et les tailles incorrectes ne sont que quelques exemples.
1. Je n'arrive toujours pas à écrire le texte correctement
Bien que l'IA ne soit pas très douée pour écrire du texte dans des images, après avoir essayé des dizaines d'outils de création artistique d'IA, DALL-E est l'une des pires options à cet égard. Dans l'ensemble, vous réussirez avec des requêtes simples, mais comme vous pouvez le voir ci-dessous, le logiciel a toujours du mal à saisir les accents pour le mot « Café ».
Image d'un café créée dans DALL-E
Vous remarquerez également que DALL-E ne produit pas de texte lisible pour les panneaux de signalisation et objets similaires.
2. Ne redimensionnez pas les images lorsque cela est demandé
DALL-E comprend très bien la nécessité de créer des images, mais ne peut pas les redimensionner lorsque cela est nécessaire. Par exemple, l’auteur de l’article a demandé au logiciel de redimensionner les images plusieurs fois pour différents blogs ; Mais à chaque fois, DALL-E recrée simplement l’image.
Heureusement, recadrer et redimensionner les images est assez simple. De nombreux outils gratuits, comme Canva , vous permettent de le faire. Cependant, il serait bien que cela puisse être fait sans recourir à des logiciels tiers.
3. Impossible de créer des images réalistes
Le DALL-E n'a pas trop de problèmes avec la profondeur de champ, mais il est assez mauvais pour créer des images réalistes. Par exemple, l'auteur de l'article demande d'abord à l'IA de générer une image d'un golden retriever dans les montagnes en contrebas (sans préciser de quel type d'image il s'agit).
Image d'un chien sur une montagne créée avec DALL-E
Bien que belle, il est clair que la photo a été créée à l'aide de l'IA. L'auteur a donc demandé à DALL-E de le rendre plus photoréaliste. Cependant, le résultat semble encore plus faux (voire un peu effrayant).
Utiliser GPT pour personnaliser la photo réelle est utile, mais vous avez besoin d'un abonnement premium pour y accéder. Sinon, vous pouvez vous tourner vers de nombreux outils de création artistique IA qui produisent des résultats photoréalistes comme Adobe Firefly.
4. Le logiciel n'écoute pas lorsque vous lui dites de ne pas faire quelque chose
Une façon d'écrire de meilleurs rappels dans Midjourney , ChatGPT et d'autres outils d'IA est de dire ce que vous ne voulez pas que le logiciel fasse. Dans de nombreux cas, cela donnera de meilleurs résultats. Cependant, DALL-E est une exception.
Dans de nombreux cas, l’auteur a demandé à DALL-E de ne pas inclure certains éléments dans ses images. Cependant, malgré cela, l’outil les ajoute toujours. Parfois, la réimagerie fonctionnera, mais il est préférable de ne pas avoir à le faire.
Au contraire, vous rencontrerez rarement ce problème lorsque vous utiliserez Adobe Firefly.
5. Incohérence dans certains domaines
De nombreux outils de création artistique basés sur l’IA présentent des faiblesses ; Par exemple, lors du test de Photo AI, il s'est avéré particulièrement mauvais pour créer des mains. DALL-E est également bogué et présente des incohérences dans de nombreux domaines.
Bien que DALL-E soit excellent pour générer des images en général, il n'est pas toujours efficace pour générer des images de personnes tenant des objets. De plus, ce logiciel est médiocre pour créer des écrans d’ordinateur. Habituellement, il vous donne un ensemble aléatoire de formes. Demander au logiciel d’éteindre l’écran de l’ordinateur peut parfois aider.
6. Style d'image incohérent
DALL-E peut générer plusieurs types d’images ; Vous pouvez créer des œuvres d'art IA qui ressemblent à des peintures et pouvez également créer des images qui semblent plus 3D. Cependant, cette diversité dans la création d’images peut parfois conduire à des styles incohérents.
Lorsque vous demandez à DALL-E de créer une image, vous devez être précis sur ce que vous voulez. Sinon, vous risquez d’obtenir quelque chose d’aléatoire. Ce n’est pas un problème si vous testez simplement l’application, mais cela l’est si vous souhaitez un style cohérent.
7. Taille de l'artefact
Il est important de faire en sorte que les objets de votre photo paraissent proportionnels à leurs homologues réels si vous vous souciez de la précision de votre photo. Malheureusement, DALL-E ne donne parfois pas aux objets l'apparence souhaitée. Par exemple, si vous demandez au logiciel de générer une image d’une personne tenant un téléphone dans sa main, le téléphone sera parfois trop grand.
Bien que j'aie essayé de demander au logiciel d'élargir l'image pour résoudre le problème, cela a en fait aggravé le problème, donnant à l'image finale un aspect faux. Essayer différentes demandes d'édition DALL-E peut fonctionner, mais dans l'ensemble, il n'existe pas encore de solution de contournement à ce problème.
Image d'une personne tenant un téléphone créée dans DALL-E
8. DALL-E a des difficultés à créer des matériaux externes
À première vue, DALL-E semble être un excellent moyen de créer des calendriers personnels, des cartes d'anniversaire, des fonds d'écran de téléphone, etc. Cependant, vous découvrirez rapidement que le logiciel n'est pas performant dans ce domaine.
Par exemple, lorsqu'il essayait de créer une couverture de carte d'anniversaire à l'aide de DALL-E, l'auteur de cet article souhaitait créer une image dans l'application, puis la télécharger sur un service comme Moonpig. Malheureusement, le résultat est systématiquement un design avec une carte d'anniversaire sur la photo.
Erreurs de texte et de conception de la carte d'anniversaire dans DALL-E 3
Si vous souhaitez vraiment utiliser DALL-E pour ce type de conceptions, vous ne devriez pas dire que vous allez l'utiliser sur une carte d'anniversaire. Spécifiez plutôt ce que vous voulez que le programme fasse, puis ajustez la taille plus tard.
Remarque : il est préférable de simplement créer l’image dans DALL-E et d’ajouter le texte dans une autre application.
9. L'image ne montre pas toutes les exigences facultatives
Parfois, vous ne connaissez pas la conception d’IA spécifique que vous souhaitez utiliser. Dans ces cas, il peut être judicieux de faire appel à un générateur et de lui demander de créer plusieurs variantes d’images. Mais d'après mon expérience personnelle, DALL-E est souvent assez « paresseux » lorsque les utilisateurs demandent de nombreuses options.
Dans de nombreux cas, les photos que vous obtenez se ressemblent souvent beaucoup. Vous devez donc poser une question précise. Créer une image après l’autre est plus efficace que de nécessiter plusieurs variations.
Bien que de nombreuses personnes apprécient toujours d’utiliser DALL-E en général, le logiciel n’est pas parfait et vous rencontrerez éventuellement des problèmes. Par exemple, il n’est pas efficace pour créer des images photoréalistes sans GPT personnalisé. De plus, ce logiciel n’élimine souvent pas les éléments que vous ne souhaitez pas sur la photo. Cependant, vous devriez toujours essayer DALL-E pour voir par vous-même si vous rencontrez ces problèmes.