Tu veux les meilleurs outils IA avant les autres ?
On teste et on décrypte les nouveaux outils IA chaque soir, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Google dévoile Gemini 3.5 Flash à l'I/O 2026
Lors de l'événement I/O 2026, Google a levé le voile sur son dernier modèle d'intelligence artificielle, Gemini 3.5 Flash. Ce modèle, présenté comme une alternative économique et performante, est conçu pour surpasser les modèles existants dans les tâches agentiques. Avec un coût réduit à un tiers de celui de ses principaux concurrents, Gemini 3.5 Flash s'accompagne d'une plateforme agent intégrée et d'une distribution étendue, promettant de bouleverser le marché.
Performances de Gemini 3.5 Flash
La nomenclature de Google pour ses modèles suit une hiérarchie bien établie : Pro pour la puissance brute, Flash pour la rapidité à moindre coût, et Flash-Lite pour le coût le plus bas. Cependant, le lancement de Gemini 3.5 Flash le 19 mai lors de la keynote I/O 2026 remet en question cette logique. Sur le test de codage de référence Terminal-Bench 2.1, le modèle a atteint un score de 76,2 %, surpassant ainsi le Gemini 3.1 Pro qui avait obtenu 70,3 % lors de son lancement en février. En outre, sur MCP Atlas, qui évalue la capacité à orchestrer des outils externes, Gemini 3.5 Flash a obtenu 83,6 %. Sur l'index composite d'Artificial Analysis, il a enregistré un score de 55, se rapprochant de Claude Opus 4.7 avec 57 et de GPT-5.5 avec 60. L'écart entre ces modèles se réduit au point où les différences deviennent presque imperceptibles.
Une hiérarchie qui se redéfinit
Les résultats des benchmarks racontent deux histoires distinctes selon l'angle d'analyse. Sur les tests qui mesurent la connaissance pure et le raisonnement abstrait, la hiérarchie traditionnelle reste en place. Par exemple, sur ARC-AGI-2, qui évalue des puzzles logiques inédits, Gemini 3.5 Flash a obtenu 72,1 %, tandis que 3.1 Pro a atteint 77,1 % et GPT-5.5 84,6 %. De même, sur Humanity's Last Exam, Flash a marqué 40,2 %, contre 44,4 % pour Pro. Cependant, sur les tests qui simulent des tâches réelles, la tendance s'inverse. Sur Terminal-Bench 2.1, MCP Atlas, Finance Agent v2, GDPval-AA (avec 1 656 points, un benchmark d'évaluation de tâches concrètes), et OSWorld-Verified (avec 78,4 %), Gemini 3.5 Flash mène ou talonne les modèles de pointe qui coûtent trois à cinq fois plus cher. En mode multimodal, il affiche un score de 83,6 % sur MMMU-Pro, le plus élevé jamais enregistré sur ce test, devant GPT-5.5 (81,2 %) et Claude Opus 4.7 (75,2 %).
Un modèle de génération puissant
La comparaison entre les modèles nécessite une nuance que Google ne met pas en avant dans ses communications officielles. Gemini 3.5 Flash appartient à la gamme Flash, qui est conçue pour offrir rapidité et coût réduit. En revanche, Claude Opus 4.7 et GPT-5.5 sont les fers de lance de la gamme Pro chez leurs éditeurs respectifs. Le véritable comparatif à gamme équivalente sera avec Gemini 3.5 Pro, dont le lancement est prévu pour le mois prochain. Comparer 3.5 Flash aux poids lourds revient à mesurer un Flash-Lite contre un Pro : ce n'est pas une tricherie, mais plutôt une démonstration d'efficience, ce que Google s'efforce de prouver.
Tarification et positionnement
Le tarif de Gemini 3.5 Flash confirme son positionnement stratégique. Le modèle est proposé à 1,50 dollar par million de tokens en entrée et 9 dollars en sortie, avec une réduction de 90 % sur les tokens en cache. En comparaison, Claude Opus 4.7 est facturé 5 dollars en entrée et 25 dollars en sortie, tandis que GPT-5.5 est à 5 dollars en entrée et 30 dollars en sortie. Pour une entreprise qui déploie des agents autonomes traitant des millions de requêtes, le rapport qualité-prix devient un argument stratégique majeur, plutôt qu'un simple détail comptable.
Le véritable lancement : un ensemble complet
L'annonce du modèle seul aurait suffi à alimenter les discussions techniques pendant plusieurs jours. Cependant, Google a choisi une approche que ni OpenAI ni Anthropic n'ont adoptée à cette échelle : lancer simultanément le modèle, la plateforme agent et la distribution grand public. Antigravity 2.0, l'environnement de développement agentique de Google, fonctionne nativement sur 3.5 Flash. Il permet d'orchestrer plusieurs agents en parallèle, de gérer des sous-agents personnalisés, de planifier des tâches en arrière-plan et propose un CLI pour les utilisateurs préférant le terminal. Gemini Spark, un agent personnel fonctionnant 24/7, est alimenté par 3.5 Flash et fonctionne sur des machines virtuelles dédiées dans Google Cloud. Il s'intègre parfaitement à Gmail, Docs, Agenda et au reste de Workspace. Les extensions tierces via MCP sont attendues pour cet été.
Ambition et portée
La base installée de Google illustre l'ampleur de son ambition. L'application Gemini revendique 900 millions d'utilisateurs actifs mensuels, tandis que AI Mode dans Google Search dépasse le milliard d'utilisateurs. Gemini 3.5 Flash devient le modèle par défaut dans ces deux produits dès aujourd'hui. Contrairement à ses concurrents, Google intègre ses modèles dans une gamme de produits beaucoup plus vaste. Lorsqu'Anthropic lance un modèle, il alimente Claude, son API et quelques partenaires sélectionnés. Quand OpenAI lance un modèle, il alimente ChatGPT, Codex et son API. En revanche, lorsque Google lance un modèle, il alimente Search, l'application Gemini, Workspace, Android, YouTube et une plateforme de développement agent. La différence n'est pas seulement qualitative, elle est structurelle.
Avec le lancement parallèle de Gemini Omni Flash pour la génération vidéo multimodale et la refonte « Neural Expressive » de l'interface de l'application, Google transforme l'I/O 2026 en une démonstration d'intégration verticale.
Conclusion
La question que 3.5 Flash pose aux concurrents n'est pas de savoir « qui a le meilleur score sur ARC-AGI-2 », mais plutôt « qui peut offrir un modèle quasi-frontière capable de traiter 280 tokens par seconde, à un tiers du prix, dans un milliard de sessions de recherche quotidiennes, tout en proposant la plateforme agent qui l'accompagne ». Pour l'instant, la réponse semble être Google. Et le modèle 3.5 Pro n'est même pas encore disponible.

