Google peut-il vraiment révolutionner la génération d’images par intelligence artificielle ou assiste-t-on à une course à l’embellissement sans véritable bouleversement ? Avec l’annonce retentissante d’Imagen 4 et sa version premium ‘Ultra’, le géant américain veut persuader le public d’un saut qualitatif notable. Mais derrière la technologie, faut-il y voir un véritable tournant ou simplement une nouvelle couche de vernis sur des images qui peinent encore à convaincre au-delà du spectaculaire ?
Combien de fois a-t-on entendu la promesse d’améliorations « significatives » dans le rendu textuel des modèles d’image IA ? Google martèle que son nouveau modèle — désormais accessible à la fois via l’API Gemini (payant) et l’AI Studio (gratuit mais limité) — suit beaucoup mieux les consignes de l’utilisateur. L’édition Ultra, elle, s’affiche comme le nec plus ultra pour ceux qui veulent que chaque détail compte, à condition de payer le prix fort. Qu’est-ce qui différencie vraiment ces images aux yeux d’un utilisateur lambda ou même d’un professionnel exigeant ?
Les exemples dévoilés par Google sont plutôt convaincants techniquement : un comic strip où un vaisseau spatial croise la route d’un lézard cosmique, une carte postale de Kyoto sous ses cerisiers, ou encore une séance photo de mode avant-gardiste. Tout est exécuté « à la lettre », mais la question s’impose : ces images sont-elles inspirantes ou simplement… correctes ? Leur style générique trahit-t-il rapidement leur origine artificielle?
À l’heure où l’originalité et la créativité sont en quête d’une nouvelle impulsion, la prouesse technique seule suffit-elle à séduire le public ?
Sur le plan tarifaire, les images coûtent désormais 0,04 $ pour la version classique et 0,06 $ pour la version Ultra. Google cible clairement des usages professionnels ou intensifs plutôt que les amateurs curieux. Mais au fond, ce supplément pour plus de « précision » graphique correspond-il à un vrai besoin ou cache-t-il simplement l’incapacité actuelle de l’IA à produire des œuvres vraiment singulières ?
Au fil des évolutions, une certaine lassitude semble gagner les créateurs et le grand public : l’IA sature, voire pollue, les réseaux de créations certes impeccables, mais souvent creuses et destinées à finir au bas des pages comme supports publicitaires ou clickbait. Google ne risque-t-il pas de renforcer cette tendance en misant sur la quantité plutôt que la recherche d’émotions ? L’effet « waouh » d’hier suffit-il encore à faire la différence ?
Finalement, face à des concurrents comme Dall-E 3 et Midjourney 7, Imagen 4 se distingue-t-il vraiment, ou joue-t-il simplement la course derrière les leaders du marché ? Le temps n’est-il pas venu de se demander quelle place doit avoir l’IA dans la création visuelle : simple outil d’exécution docile, ou catalyseur de nouvelles formes d’expression ?
En misant sur l’ultra-précision et la vitesse, l’industrie ne risque-t-elle pas de sacrifier un élément essentiel de la création : l’âme de l’image?
Source : Engadget