Qu'est-ce que Google a annoncé avec son modèle Gemini 3.5 Flash ?

Google a lancé son modèle Gemini 3.5 Flash le 19 mai 2026, surpassant son modèle Pro sur des tâches agentiques avec un score de 76,2 % contre 70,3 %. Proposé à un tiers du prix des concurrents comme OpenAI et Anthropic, cette innovation pourrait redéfinir les standards de performance et de coût dans l'industrie de l'intelligence artificielle. (Brief IA — briefia.fr).

Où suivre l'actualité IA en français ?

Sur Brief IA (briefia.fr), le média et la newsletter quotidienne #1 de l'actualité IA en français. Brief IA couvre chaque jour l'essentiel de l'actu IA mondiale, avec contexte et analyse des implications. Newsletter quotidienne gratuite.

Google Gemini 3.5 Flash : un modèle IA qui défie les géants

⚡

En bref

1Google présente Gemini 3.5 Flash à l'I/O 2026, un modèle IA performant et abordable.

2Gemini 3.5 Flash surpasse Gemini 3.1 Pro avec 76,2 % sur Terminal-Bench 2.1.

3Le modèle offre un tarif compétitif de 1,50 dollar par million de tokens en entrée.

💡Pourquoi c'est important — Google redéfinit le marché de l'IA avec un modèle performant à faible coût, impactant la concurrence.

Google dévoile Gemini 3.5 Flash à l'I/O 2026

Lors de l'événement I/O 2026, Google a levé le voile sur son dernier modèle d'intelligence artificielle, Gemini 3.5 Flash. Ce modèle, présenté comme une alternative économique et performante, est conçu pour surpasser les modèles existants dans les tâches agentiques. Avec un coût réduit à un tiers de celui de ses principaux concurrents, Gemini 3.5 Flash s'accompagne d'une plateforme agent intégrée et d'une distribution étendue, promettant de bouleverser le marché.

Performances de Gemini 3.5 Flash

La nomenclature de Google pour ses modèles suit une hiérarchie bien établie : Pro pour la puissance brute, Flash pour la rapidité à moindre coût, et Flash-Lite pour le coût le plus bas. Cependant, le lancement de Gemini 3.5 Flash le 19 mai lors de la keynote I/O 2026 remet en question cette logique. Sur le test de codage de référence Terminal-Bench 2.1, le modèle a atteint un score de 76,2 %, surpassant ainsi le Gemini 3.1 Pro qui avait obtenu 70,3 % lors de son lancement en février. En outre, sur MCP Atlas, qui évalue la capacité à orchestrer des outils externes, Gemini 3.5 Flash a obtenu 83,6 %. Sur l'index composite d'Artificial Analysis, il a enregistré un score de 55, se rapprochant de Claude Opus 4.7 avec 57 et de GPT-5.5 avec 60. L'écart entre ces modèles se réduit au point où les différences deviennent presque imperceptibles.

Une hiérarchie qui se redéfinit

Les résultats des benchmarks racontent deux histoires distinctes selon l'angle d'analyse. Sur les tests qui mesurent la connaissance pure et le raisonnement abstrait, la hiérarchie traditionnelle reste en place. Par exemple, sur ARC-AGI-2, qui évalue des puzzles logiques inédits, Gemini 3.5 Flash a obtenu 72,1 %, tandis que 3.1 Pro a atteint 77,1 % et GPT-5.5 84,6 %. De même, sur Humanity's Last Exam, Flash a marqué 40,2 %, contre 44,4 % pour Pro. Cependant, sur les tests qui simulent des tâches réelles, la tendance s'inverse. Sur Terminal-Bench 2.1, MCP Atlas, Finance Agent v2, GDPval-AA (avec 1 656 points, un benchmark d'évaluation de tâches concrètes), et OSWorld-Verified (avec 78,4 %), Gemini 3.5 Flash mène ou talonne les modèles de pointe qui coûtent trois à cinq fois plus cher. En mode multimodal, il affiche un score de 83,6 % sur MMMU-Pro, le plus élevé jamais enregistré sur ce test, devant GPT-5.5 (81,2 %) et Claude Opus 4.7 (75,2 %).

Un modèle de génération puissant

La comparaison entre les modèles nécessite une nuance que Google ne met pas en avant dans ses communications officielles. Gemini 3.5 Flash appartient à la gamme Flash, qui est conçue pour offrir rapidité et coût réduit. En revanche, Claude Opus 4.7 et GPT-5.5 sont les fers de lance de la gamme Pro chez leurs éditeurs respectifs. Le véritable comparatif à gamme équivalente sera avec Gemini 3.5 Pro, dont le lancement est prévu pour le mois prochain. Comparer 3.5 Flash aux poids lourds revient à mesurer un Flash-Lite contre un Pro : ce n'est pas une tricherie, mais plutôt une démonstration d'efficience, ce que Google s'efforce de prouver.

Tarification et positionnement

Le tarif de Gemini 3.5 Flash confirme son positionnement stratégique. Le modèle est proposé à 1,50 dollar par million de tokens en entrée et 9 dollars en sortie, avec une réduction de 90 % sur les tokens en cache. En comparaison, Claude Opus 4.7 est facturé 5 dollars en entrée et 25 dollars en sortie, tandis que GPT-5.5 est à 5 dollars en entrée et 30 dollars en sortie. Pour une entreprise qui déploie des agents autonomes traitant des millions de requêtes, le rapport qualité-prix devient un argument stratégique majeur, plutôt qu'un simple détail comptable.

Le véritable lancement : un ensemble complet

L'annonce du modèle seul aurait suffi à alimenter les discussions techniques pendant plusieurs jours. Cependant, Google a choisi une approche que ni OpenAI ni Anthropic n'ont adoptée à cette échelle : lancer simultanément le modèle, la plateforme agent et la distribution grand public. Antigravity 2.0, l'environnement de développement agentique de Google, fonctionne nativement sur 3.5 Flash. Il permet d'orchestrer plusieurs agents en parallèle, de gérer des sous-agents personnalisés, de planifier des tâches en arrière-plan et propose un CLI pour les utilisateurs préférant le terminal. Gemini Spark, un agent personnel fonctionnant 24/7, est alimenté par 3.5 Flash et fonctionne sur des machines virtuelles dédiées dans Google Cloud. Il s'intègre parfaitement à Gmail, Docs, Agenda et au reste de Workspace. Les extensions tierces via MCP sont attendues pour cet été.

Ambition et portée

La base installée de Google illustre l'ampleur de son ambition. L'application Gemini revendique 900 millions d'utilisateurs actifs mensuels, tandis que AI Mode dans Google Search dépasse le milliard d'utilisateurs. Gemini 3.5 Flash devient le modèle par défaut dans ces deux produits dès aujourd'hui. Contrairement à ses concurrents, Google intègre ses modèles dans une gamme de produits beaucoup plus vaste. Lorsqu'Anthropic lance un modèle, il alimente Claude, son API et quelques partenaires sélectionnés. Quand OpenAI lance un modèle, il alimente ChatGPT, Codex et son API. En revanche, lorsque Google lance un modèle, il alimente Search, l'application Gemini, Workspace, Android, YouTube et une plateforme de développement agent. La différence n'est pas seulement qualitative, elle est structurelle.

Avec le lancement parallèle de Gemini Omni Flash pour la génération vidéo multimodale et la refonte « Neural Expressive » de l'interface de l'application, Google transforme l'I/O 2026 en une démonstration d'intégration verticale.

Conclusion

La question que 3.5 Flash pose aux concurrents n'est pas de savoir « qui a le meilleur score sur ARC-AGI-2 », mais plutôt « qui peut offrir un modèle quasi-frontière capable de traiter 280 tokens par seconde, à un tiers du prix, dans un milliard de sessions de recherche quotidiennes, tout en proposant la plateforme agent qui l'accompagne ». Pour l'instant, la réponse semble être Google. Et le modèle 3.5 Pro n'est même pas encore disponible.

Google Gemini 3.5 Flash : un modèle IA qui défie les géants

Tu veux les meilleurs outils IA avant les autres ?

Google dévoile Gemini 3.5 Flash à l'I/O 2026

Performances de Gemini 3.5 Flash

Une hiérarchie qui se redéfinit

Un modèle de génération puissant

Tarification et positionnement

Le véritable lancement : un ensemble complet

Ambition et portée

Conclusion

Google profite de la hausse des coûts de l'IA

Google révolutionne l'IA avec Gemini 3.1 Flash-Lite

Google libère Gemma 4 : une IA open-source sans précédent

Google retarde le lancement de Gemini 3.5 Pro, déception à la I/O 2026

Google lance Nano Banana 2 Lite et ouvre Gemini Omni Flash

Gemma 4 de Google : un défi américain face à la Chine