Brief IA

Google explique les différences entre ses trois modèles d'image Nano Banana

🎨 IA Créativevia The Decoder·Matthias Bastian·

Google explique les différences entre ses trois modèles d'image Nano Banana

Google explique les différences entre ses trois modèles d'image Nano Banana

⚡ Résumé en français par Brief IA

• Google présente trois modèles d'image Nano Banana et leurs usages spécifiques. • Le modèle Nano Banana 2 offre 95 % des capacités du Pro à un coût réduit. • Ce modèle peut également rechercher des images de référence sur le web avant de générer du contenu. 💡 Pourquoi c'est important : cette avancée permet aux utilisateurs d'accéder à des outils d'IA d'image plus performants et économiques.

📄 Article traduit en français

Google explique les différences entre ses trois modèles d'image Nano Banana

Google a détaillé les trois modèles de la famille Nano Banana dans un guide explicatif.

Nano Banana 2 : le choix recommandé

Le Nano Banana 2 (Gemini 3.1 Flash Image), qui offre environ 95 % des capacités du modèle plus coûteux Nano Banana Pro, devrait être le choix privilégié pour la plupart des projets.

La caractéristique principale de NB2 est le grounding d'image : le modèle peut rechercher sur le web des images spécifiques pour comprendre à quoi ressemblent réellement des objets du monde réel—comme des bâtiments particuliers ou des espèces animales—avant de les générer.

Comparaison des modèles

Google a publié un guide officiel pour ses modèles de génération d'images Nano Banana, expliquant les différences entre chacun et quand les utiliser. Avec trois modèles maintenant disponibles, le guide aide les développeurs et les créatifs à déterminer lequel convient le mieux à leur cas d'utilisation.

  • Nano Banana 2 gère la plupart des cas d'utilisation à une fraction du coût de Pro.
  • Le modèle Pro n'est justifié que pour des prompts très complexes ou des exigences logiques extrêmes où NB2 ne suffit pas. Cependant, il est clair que Nano Banana Pro reste le meilleur modèle d'image de la gamme.
  • Le modèle plus ancien Nano Banana 1 est toujours l'option la moins chère et la plus rapide, mais Google ne le recommande plus pour les nouveaux projets. Aucune migration forcée n'a eu lieu jusqu'à présent, donc les flux de travail existants continuent de fonctionner correctement. Si vous construisez de nouveaux pipelines et avez besoin de plus de nuances, d'un meilleur suivi des prompts ou des nouvelles fonctionnalités de grounding, Google recommande d'opter pour NB2. À une résolution de 512 pixels, NB2 coûte à peu près le même prix que NB1.

Fonctionnalité de grounding d'image

La nouvelle fonctionnalité exclusive de Nano Banana 2 est le grounding visuel avec Google Search. Alors que Nano Banana Pro pouvait déjà extraire des informations textuelles du web, NB2 va plus loin : il peut désormais rechercher des images réelles sur Internet pour comprendre à quoi ressemblent les objets avant de les générer.

Google indique que le grounding d'image fonctionne particulièrement bien pour des lieux spécifiques comme des églises, des ponts ou des places de ville, ainsi que pour des espèces animales et végétales précises. Le guide illustre cela avec une église à Voiron, France, et les différences visuelles entre deux espèces de papillons. La recherche d'images ne fonctionne pas pour les personnes.

Options de résolution et rapports d'aspect extrêmes

Nano Banana 2 peut également générer des images à une résolution de 512 pixels, ce qui accélère la génération et réduit les coûts au niveau de Nano Banana 1. Google recommande un flux de travail en plusieurs étapes : utiliser l'API par lot, qui offre une réduction de 50 %, pour générer d'abord des dizaines de variantes à 512px, puis augmenter la meilleure composition à 1K, 2K ou 4K.

NB2 prend également en charge des rapports d'aspect extrêmes de 1:8 et 1:4 en orientation verticale et horizontale. Google précise que ces formats conviennent bien aux bannières web, au contenu à défilement continu ou aux mises en page de bandes dessinées dans le style franco-belge.

Tableau comparatif des modèles

| Modèle | Max. Input tokens | Max. Output tokens | Text grounding | Image grounding | Références d'images | Statut janvier 2025 | |--------------------------|-------------------|--------------------|----------------|------------------|----------------------|---------------------| | Nano Banana 2 | 0.5K (512px), 1K, 2K, 4K | 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9, 1:4, 4:1, 1:8, 8:1 | Oui (recherche web) | Oui (recherche d'images) | Jusqu'à 14 images de référence (PNG, JPEG, WebP, HEIC, HEIF) | Recherche web en temps réel | | Nano Banana Pro | 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 | - | Oui (recherche web) | Non | Jusqu'à 14 images de référence (PNG, JPEG, WebP, HEIC, HEIF) | Recherche web en temps réel |

Google recommande également de garder le mode de réflexion désactivé par défaut pour Nano Banana, car cela ajoute principalement du temps et des coûts de calcul lors de la génération d'images normales. Il ne vaut la peine d'être activé que dans trois cas : lorsque le modèle produit des résultats absurdes, lors de la création d'infographies très complexes, ou lors de la combinaison du grounding d'image avec le raisonnement spatial.

TwitterLinkedIn

Brief IA — Veille IA en français

Toutes les innovations mondiales en IA, traduites et résumées automatiquement. Recevoir les meilleures actus IA chaque jour.