Comparer l’hallucination visuelle entre ChatGPT et Gemini

Cette leçon explique comment ChatGPT et Gemini génèrent des images pour une couverture de magazine, mettant en évidence les phénomènes d'hallucination visuelle et les différences de qualité de leur production textuelle et graphique.

Détails de la leçon

Description de la leçon

Dans cette vidéo pédagogique, nous examinons le cas d'une hallucination visuelle potentielle lors de la génération d'une image de couverture pour le magazine « Nos Amis les Chats » à l'aide d'une IA. Le même prompt est envoyé simultanément à ChatGPT et à Gemini pour garantir l'objectivité de la comparaison. L’analyse commence par l'examen du résultat obtenu avec ChatGPT, qui parvient à générer une image photoréaliste représentant trois chatons stylisés. Non seulement la qualité visuelle est jugée réaliste, mais les titres et textes d'accroche, produits sans indication préalable, sont convaincants malgré quelques fautes d’orthographe mineures, simples à corriger.

En revanche, l’évaluation du résultat généré par Gemini révèle des limitations plus marquées. Les textes sur la couverture, également générés automatiquement, comportent non seulement des erreurs, mais aussi des mots inexistants en français, aboutissant à une hallucination textuelle manifeste. L'observation met en évidence des termes inventés, mélangeant parfois français et anglais, incompatibles avec la crédibilité d’un magazine réel. Cette comparaison illustre ainsi de façon concrète les risques liés à l'utilisation d’IA générative pour la production de contenus visuels contenant du texte, spécialement en langue française.

L'étude conclut sur l’importance de la relecture humaine et sur la nécessité de choisir l’outil adapté selon la qualité attendue pour la génération de textes ou d’images comportant du texte.

Objectifs de cette leçon

L'objectif est de comparer la capacité des IA à générer des images contenant du texte en français et de savoir identifier les cas d'hallucination visuelle ou textuelle en production automatique. L’approche vise également à sensibiliser aux limites actuelles des générateurs d’images et à la nécessité d’un contrôle humain.

Prérequis pour cette leçon

Une connaissance de base sur les IA génératives et la compréhension du concept d'hallucination en intelligence artificielle sont recommandées. Un intérêt pour la mise en page ou la conception graphique est un plus.

Métiers concernés

Ce sujet concerne principalement les concepteurs graphiques, éditeurs, formateurs en IA, communicants, ainsi que les chefs de projet numérique impliqués dans la génération de contenu automatisé.

Alternatives et ressources

Parmi les alternatives, on peut citer d'autres générateurs d'images IA comme DALL·E, Midjourney, ou Stable Diffusion. Des outils de retouche manuelle comme Photoshop peuvent aussi être utilisés pour corriger ou finaliser le rendu textuel.

Questions & Réponses

Gemini a généré du texte comportant non seulement des fautes d’orthographe mais aussi des mots complètement inventés ou mélangeant des langues, ce qui constitue une hallucination textuelle et visuelle marquée.
ChatGPT produit en général des textes pertinents avec quelques fautes faciles à corriger, alors que Gemini génère des termes qui n'existent pas en français, rendant le résultat inadapté à une publication réelle.
Parce que l’IA peut produire des erreurs ou halluciner du texte, une vérification humaine est essentielle pour garantir la cohérence, la qualité linguistique et la crédibilité d’une création visuelle destinée à un large public.