OpenAI annonce la sortie en octobre de DALL-E 3, la nouvelle version de son générateur d’images DALL-E. Cet outil aurait la capacité de générer des images précises, correspondant exactement au texte fourni. Il pourra être utilisé directement dans ChatGPT.
OpenAI, la startup à l’origine de ChatGPT, vient de présenter la nouvelle version de son générateur d’images DALL-E. Son PDG Sam Altman a publié une vidéo d’une minute sur les réseaux sociaux pour donner un aperçu des capacités de l’outil. On y voit un parent demander à l’intelligence artificielle de créer des représentations visuelles d’un personnage fictif, Larry le hérisson, imaginé par sa fille de cinq ans. Le dirigeant évoque un rendu exceptionnel, qui augure une révolution dans le domaine de la génération d’images par IA, où opèrent des entreprises comme Stability AI, Midjourney et DeviantArt.
Possibilité de demander des ajustements sur une image
DALL-E 3 produirait des images hyperréalistes à partir d’une simple description. Pour plus de précisions, l’auteur peut lui demander des ajustements sur une image spécifique. De plus, selon Sam Altman, l’outil n’ignorerait aucun mot ou descriptif comme les autres robots conversationnels le font malheureusement. L’IA évite ainsi d’employer un rédacteur de script et dispense d’apprendre le prompt engineering. « DALL-E 3 représente un bond en avant dans notre capacité à générer des images qui correspondent exactement au texte que vous fournissez », vante le patron d’OpenAI.
DALL-E 3 intégrée à ChatGPT
La nouvelle version de DALL-E sera directement intégrée au robot conversationnel ChatGPT, qui proposera automatiquement des images suivant les consignes de l’utilisateur. Cette intégration constitue une vraie valeur ajoutée car l’on n’aura plus besoin de naviguer d’une IA à une autre pour produire un article, par exemple. Il serait possible de générer le texte et les images sur la même plateforme. Plutôt pratique. D’après OpenAI, les images créées avec DALL-E 3 appartiennent à leur créateur et celui-ci n’a pas besoin de son autorisation pour les réimprimer et les vendre.
Lutter contre les violations de droits d’auteur
La startup américaine dit avoir également pris de nouvelles mesures préventives afin de lutter contre les violations de droits d’auteur. Elle a conçu DALL-E 3 de sorte que l’IA rejette des requêtes demandant une image dans le style d’un artiste vivant. Par précaution, OpenAI propose aux créateurs d’exclure eux-mêmes leurs œuvres de son processus de génération d’images via un formulaire dédié, disponible en ligne. Ces utilisateurs n’ont qu’à télécharger les documents en question directement dans le formulaire. L’entreprise précise toutefois qu’elle a accès à des bases de données pouvant contenir des œuvres d’artistes dont les droits ont été concédés à d’autres personnes.
Et contre la propagande et la désinformation
Par ailleurs, OpenAI va mieux lutter contre la désinformation et la propagande, en examinant avec plus d’attention les demandes de génération d’images concernant des personnes publiques. Ces derniers mois, plusieurs montages très réalistes ont été publiés sur Internet, trompant tout le monde. Ils peuvent entacher l’image d’une personnalité et avoir des conséquences désastreuses sur sa vie ou sa carrière. OpenAI croit important de sévir sur ce point à un an de l’élection présidentielle américaine. DALL-E 3 sera disponible début octobre, mais seulement pour les abonnés à ChatGPT Plus (version payante) et ChatGPT Enterprise. Les autres devront attendre.