Qu'est-ce que GPT-5.4 et quelles sont ses caractéristiques ?

OpenAI a lancé GPT-5.4, son modèle de pointe, le jeudi, avec des versions Pro et Thinking. Ce modèle offre une fenêtre de contexte allant jusqu'à 1 million de tokens et présente des scores record dans divers benchmarks, dont 83 % au test GDPval et la première place au benchmark APEX-Agents pour les compétences professionnelles en droit et en finance. (Brief IA — briefia.fr).

Où suivre l'actualité IA en français ?

Sur Brief IA (briefia.fr), le média et la newsletter quotidienne #1 de l'actualité IA en français. Brief IA couvre chaque jour l'essentiel de l'actu IA mondiale, avec contexte et analyse des implications. Newsletter quotidienne gratuite.

OpenAI dévoile GPT-5.4 : des avancées majeures pour les professionnels

Brief IA

Tom Levy·5 mars 2026·3 min·2 vues

⚡

En bref

1OpenAI a lancé GPT-5.4, un modèle avancé avec des versions Pro et Thinking, ciblant les professionnels.

2GPT-5.4 offre une fenêtre de contexte de 1 million de tokens, la plus grande jamais proposée par OpenAI.

3Le modèle améliore la précision avec 33 % moins d'erreurs individuelles par rapport à GPT 5.2.

💡Pourquoi c'est important — Ces innovations renforcent la position d'OpenAI dans l'IA professionnelle, optimisant efficacité et précision pour les utilisateurs experts.

OpenAI présente GPT-5.4 avec des versions Pro et Thinking

Jeudi, OpenAI a annoncé le lancement de GPT-5.4, un modèle de langage de pointe conçu pour offrir des performances exceptionnelles dans le cadre professionnel. Ce modèle se décline en plusieurs versions, dont une version standard, une version axée sur le raisonnement appelée GPT-5.4 Thinking, et une version optimisée pour des performances élevées, nommée GPT-5.4 Pro.

Une des caractéristiques marquantes de GPT-5.4 est sa capacité à gérer des fenêtres de contexte allant jusqu'à 1 million de tokens. Cette avancée représente la plus grande fenêtre de contexte jamais proposée par OpenAI, permettant ainsi une gestion plus efficace et fluide des tâches complexes qui nécessitent une grande quantité d'informations.

En outre, OpenAI a mis en avant l'efficacité améliorée des tokens dans GPT-5.4. Le modèle est capable de résoudre les mêmes problèmes avec un nombre significativement réduit de tokens par rapport à son prédécesseur, ce qui représente un gain d'efficacité notable.

Performances et benchmarks améliorés

GPT-5.4 a démontré des performances remarquables dans divers benchmarks, obtenant des scores record dans les évaluations OSWorld-Verified et WebArena Verified. Ces résultats soulignent la capacité du modèle à exceller dans des tâches informatiques complexes et variées.

Le modèle a également obtenu un score impressionnant de 83 % au test GDPval d'OpenAI, qui évalue les capacités cognitives du modèle dans des tâches de travail intellectuel. Ce score reflète l'amélioration continue des capacités de raisonnement et de traitement de l'information par GPT-5.4.

De plus, GPT-5.4 a pris la tête du benchmark APEX-Agents de Mercor, un test conçu pour évaluer les compétences professionnelles en droit et en finance. Selon Brendan Foody, PDG de Mercor, GPT-5.4 excelle dans la création de livrables à long terme, tels que des présentations, des modèles financiers et des analyses juridiques. Il a souligné que le modèle offre des performances de premier ordre tout en étant plus rapide et moins coûteux que les modèles concurrents de pointe.

GPT-5.4 poursuit également les efforts d'OpenAI pour réduire les hallucinations et les erreurs factuelles. Le modèle est 33 % moins susceptible de commettre des erreurs dans des affirmations individuelles par rapport à GPT 5.2, et les réponses globales sont 18 % moins susceptibles de contenir des erreurs. Ces améliorations sont cruciales pour garantir la fiabilité et la précision des informations fournies par le modèle.

Innovations dans l'API

Dans le cadre du lancement de GPT-5.4, OpenAI a introduit des innovations significatives dans la gestion des appels d'outils au sein de l'API. Un nouveau système, appelé Tool Search, a été mis en place pour améliorer l'efficacité des appels d'outils. Auparavant, les invites système devaient définir toutes les définitions des outils disponibles lors de l'appel du modèle, un processus qui consommait beaucoup de tokens à mesure que le nombre d'outils augmentait. Désormais, le système permet aux modèles de rechercher les définitions des outils uniquement lorsque cela est nécessaire, ce qui se traduit par des demandes plus rapides et moins coûteuses, surtout dans les systèmes où de nombreux outils sont disponibles.

OpenAI a également intégré une nouvelle évaluation de sécurité pour tester la chaîne de pensée des modèles. Cette évaluation vise à vérifier le commentaire continu fourni par les modèles pour montrer leur processus de réflexion à travers des tâches multi-étapes. Les chercheurs en sécurité de l'IA ont exprimé des préoccupations de longue date concernant la possibilité que les modèles de raisonnement puissent mal représenter leur chaîne de pensée. Les tests montrent que cela peut se produire dans certaines circonstances, mais la nouvelle évaluation d'OpenAI indique que la tromperie est moins probable dans la version Thinking de GPT-5.4. Cela suggère que le modèle n'a pas la capacité de cacher son raisonnement, et que la surveillance de la chaîne de pensée reste un outil de sécurité efficace.

OpenAI dévoile GPT-5.4 : des avancées majeures pour les professionnels

Tu suis la course aux modèles IA ?

OpenAI présente GPT-5.4 avec des versions Pro et Thinking

Performances et benchmarks améliorés

Innovations dans l'API

GPT-5.4 : OpenAI redéfinit les standards IA professionnels

GPT-5.4 d'OpenAI : le modèle qui redéfinit l'intelligence artificielle

OpenAI dévoile GPT-5.5 : une avancée vers la superapp d'IA

GPT-5.4 et GPT-5.4-Pro : OpenAI redéfinit la performance IA

OpenAI lance GPT-5.5 : l'IA agentique franchit un cap décisif

OpenAI révolutionne avec GPT-5.4 : vers des agents IA autonomes