Brief IA : OpenAI dévoile GPT-5.6 : une avancée qui surpasse Mythos 5 ?

OpenAI dévoile GPT-5.6 : une avancée qui surpasse Mythos 5 ?

Brief IA
Tom Levy·3 min·1 vues

Le 26 juin, OpenAI a officiellement présenté GPT-5.6, avec des modèles nommés Sol, Terra et Luna. GPT-5.6 Sol se distingue par ses avancées en développement logiciel, cybersécurité et biologie quantitative. Les benchmarks montrent que Sol Ultra atteint 91,9 % sur TerminalBench 2.1, surpassant Mythos 5 d'Anthropic.

En bref
1Le 26 juin, OpenAI a officiellement présenté GPT-5.6, avec des modèles nommés Sol, Terra et Luna.
2GPT-5.6 Sol se distingue par ses avancées en développement logiciel, cybersécurité et biologie quantitative.
3Les benchmarks montrent que Sol Ultra atteint 91,9 % sur TerminalBench 2.1, surpassant Mythos 5 d'Anthropic.
💡Pourquoi c'est importantGPT-5.6 pourrait redéfinir les standards de performance et de sécurité dans l'IA, impactant divers secteurs technologiques.
Le brief IA que lisent les pros

Tu suis la course aux modèles IA ?

Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

OpenAI dévoile GPT-5.6 : une avancée qui surpasse Mythos 5 ?

Le vendredi 26 juin, OpenAI a levé le voile sur sa dernière innovation, GPT-5.6. Ce lancement, très attendu, confirme les rumeurs qui circulaient ces dernières semaines et présente une gamme de modèles qui impressionne par ses capacités.

La série GPT-5.6 se compose de trois modèles distincts, chacun portant un nom inspiré par notre système solaire : Sol, Terra et Luna. Ces modèles sont conçus pour exceller dans plusieurs domaines clés tels que le raisonnement, l'exécution autonome de tâches complexes, la création d'interfaces et l'efficacité énergétique.

En outre, OpenAI introduit un mode innovant appelé « Ultra ». Ce mode permet de répartir les tâches entre plusieurs sous-agents, optimisant ainsi les performances pour les missions les plus exigeantes.

Actuellement, l'accès à la gamme GPT-5.6 est limité à quelques partenaires sélectionnés, validés par le gouvernement américain.

Que promettent les GPT-5.6 ?

Le modèle GPT-5.6 Sol est présenté par OpenAI comme le plus performant jamais créé par l'entreprise. Il se distingue par ses avancées significatives dans plusieurs domaines, notamment :

  • le développement logiciel
  • les workflows complexes
  • la biologie quantitative
  • la cybersécurité

OpenAI souligne que Sol est également le modèle le plus sécurisé qu'ils aient développé à ce jour. L'entreprise a renforcé les mécanismes de sécurité en temps réel pour réduire les risques de cyberattaques et d'usages malveillants.

Pour garantir cette sécurité, OpenAI a investi plusieurs semaines dans des tests intensifs. Ces tests incluent des exercices de piratage menés par des équipes spécialisées et plus de 700 000 heures de tests automatisés, équivalant à l'utilisation continue d'un GPU A100 pendant cette période.

Quant à Terra, il est conçu pour offrir un équilibre entre performance et coût, tandis que Luna est optimisé pour la rapidité et la réduction des dépenses.

Que disent les benchmarks ?

Résultat GPT 5.6 sur TerminalBench 2.1

Les benchmarks publiés par OpenAI montrent que Sol se distingue dans plusieurs évaluations. Sur TerminalBench 2.1, qui évalue les performances dans des tâches complexes en ligne de commande, GPT-5.6 Sol atteint un score impressionnant de 88,8 %.

Le modèle Sol Ultra va encore plus loin avec un score de 91,9 %. En comparaison, Claude Mythos 5, le modèle le plus avancé d'Anthropic, atteint 88 %. Sur le même benchmark, Terra obtient 84,3 %, dépassant GPT-5.5 qui se situe à 83,4 %, tandis que Luna atteint 82,5 %.

Les améliorations apportées par GPT-5.6 ne se limitent pas à la programmation. Sur GeneBench v1, qui se concentre sur les workflows en génomique et biologie quantitative, OpenAI affirme que GPT-5.6 Sol surpasse GPT-5.5 tout en consommant moins de tokens. Une tendance similaire est observée sur ExploitBench, un benchmark dédié à la cybersécurité, où Sol rivalise avec Mythos Preview tout en générant environ trois fois moins de tokens.

Résultat GPT 5.6 sur ExploitBench

De son côté, GPT-5.6 Terra offre des performances comparables à GPT-5.5 tout en réduisant son coût de moitié.

Sur GeneBench v1, GPT-5.6 Luna atteint un score d'environ 14 à 15 % pour un coût inférieur à un dollar via l'API. À titre de comparaison, GPT-5.5 se situe autour de 23 % pour près de 1,2 dollar.

Terra atteint environ 28 % pour un coût proche de 1,7 dollar, tandis que Sol atteint environ 31 % pour un coût d'environ 1,9 dollar.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires