L'Uni-1 de Luma AI pourrait être le premier véritable concurrent à la domination de l'image Nano Banana de Google
🔬 Recherche

L'Uni-1 de Luma AI pourrait être le premier véritable concurrent à la domination de l'image Nano Banana de Google

The Decoder
Matthias Bastian·4 min·0 vues
En bref
1Luma AI lance Uni-1, un modèle qui allie compréhension et génération d'images dans une seule architecture.
2Uni-1 est conçu pour raisonner à travers des prompts tout en créant des images.
3Ce développement pourrait remettre en question la position de Google dans le domaine de l'intelligence artificielle visuelle.
💡Pourquoi c'est importantUni-1 pourrait redéfinir la concurrence dans le secteur de l'IA, offrant une alternative significative aux solutions dominantes actuelles.
📄
Article traduit en français

L'Uni-1 de Luma AI : Un Concurrent Sérieux à la Domination de Google

Mise à Jour du 23 Mars 2026

L'Uni-1 est désormais disponible. Selon Luma Labs, lors des tests de préférence humaine (évaluation Elo), Uni-1 se classe premier dans les catégories de génération globale, de style/édition et de génération basée sur des références. En ce qui concerne la génération d'images à partir de texte, il se classe deuxième derrière le Nano Banana de Google.

Le modèle répond parfaitement à mon prompt de référence, au même niveau que le Nano Banana Pro, voire mieux. C'est une nette amélioration par rapport au nouveau Midjourney v8, qui a eu des difficultés avec le même prompt. Une mise en garde : l'image générée a été traitée par un agent de génération d'images de Luma, donc les résultats pourraient légèrement différer de ceux de l'API à venir. Vous pouvez essayer Uni-1 gratuitement sur Luma Labs.

Prompt : Une photo DSLR hyper-réaliste. Un singe tenant une banane rose est assis sur un tigre au premier plan. En arrière-plan, un CHEVAL monte un ASTRONAUTE. L'astronaute est en dessous comme un "selle de cheval spatial" vivant, et le CHEVAL est clairement au-dessus, en contrôle, en tant que cavalier. Rendre cela 100 % sans ambiguïté : le CHEVAL est le cavalier et l'ASTRONAUTE est monté, et non l'inverse. Haute résolution, mise au point nette, éclairage réaliste. (Meilleure image sur trois tentatives, mais les trois étaient bonnes…)

Dans l'ensemble, Uni-1 se rapproche du modèle d'image phare de Google tout en étant moins cher à résolution comparable : à 2K, le coût moyen via l'API à venir est d'environ 0,09 $ par image, selon le nombre d'images de référence que vous lui fournissez.

  • Génération texte vers image (2048px)
  • Édition d'image / i2i (2048px)
  • Multi-références, 1 image (2048px)
  • Multi-références, 2 images (2048px)
  • Multi-références, 8 images (2048px)

Le Nano Banana 2 propose cependant des résolutions inférieures à des prix plus bas : une image 0,5K coûte environ 0,045 $, et une image 1K coûte environ 0,067 $.

Article Original du 8 Mars 2026

Luma AI présente Uni-1, son premier modèle à combiner compréhension d'image et génération d'image dans une seule architecture.

Comme le Nano Banana Pro de Google et le GPT Image 1.5, Uni-1 est construit sur un transformateur autoregressif, un modèle d'IA qui génère du contenu token par token en séquence, au lieu de tirer des images du bruit comme le font les modèles de diffusion traditionnels. Le texte et les images partagent le même pipeline de traitement.

Luma affirme que le modèle peut raisonner à travers les prompts avant et pendant la génération, décomposant des instructions complexes et planifiant des scènes. Cette approche conduit généralement à un suivi des prompts beaucoup plus précis, et Uni-1 ne fait pas exception. Il peut, par exemple, prendre plusieurs photos et les fusionner en une toute nouvelle composition.

Plusieurs photos ordinaires d'animaux de compagnie ont été combinées dans la scène ci-dessus. Prompt : "Combinez le chien noir et blanc à poils bouclés avec un bandana rose, le Boston Terrier en harnais à carreaux, et le chat noir et blanc dans une seule scène où ils sont habillés en tenue académique, se tenant devant un tableau blanc rempli de diagrammes scientifiques et de texte, avec le logo de Luma AI placé dans le coin supérieur gauche."

Au-delà de la génération de base, Luma indique qu'Uni-1 peut affiner les sujets à travers plusieurs échanges tout en maintenant le contexte intact, convertir des images en plus de 76 styles artistiques, accepter des croquis et des instructions visuelles comme entrée, et transférer des identités, poses et compositions dans de nouvelles images à partir de photos de référence. Dans une démonstration, le modèle a généré une séquence entière à partir d'une seule image de référence, vieillissant progressivement un pianiste de l'enfance à la vieillesse.

Selon Luma, Uni-1 obtient le meilleur score au test RISEBench pour le traitement d'image basé sur la logique, battant de justesse à la fois le Nano Banana 2 et le GPT Image 1.5. La capacité de génération d'images renforce également la compréhension visuelle du modèle. En reconnaissance d'objets, par exemple, il égalise presque le Gemini 3 Pro de Google. Le modèle prend en charge plusieurs langues.

Uni-1 se classe en tête du classement global RISEBench, juste devant le Nano Banana 2 et le GPT Image 1.5, le modèle d'image actuel alimentant ChatGPT.

Uni-1 sera bientôt disponible via Luma Agents, un nouvel assistant créatif lancé, et l'API Luma. Aucun prix n'a encore été annoncé.

Lire l'article original sur The Decoder

📧

Cet article vous a plu ?

Recevez les 7 meilleures actus IA chaque soir à 19h — résumées en 5 min.

Chaque soir à 19h

Gratuit · Pas de spam · Désabonnement en 1 clic

Commentaires