Brief IA

OpenAI lance GPT-5.4 avec des versions Pro et Thinking

🤖 Modèles & LLMvia TechCrunch IA·Russell Brandom·

OpenAI lance GPT-5.4 avec des versions Pro et Thinking

OpenAI lance GPT-5.4 avec des versions Pro et Thinking

⚡ Résumé en français par Brief IA

GPT-5.4 est présenté comme notre modèle de pointe le plus capable et efficace pour le travail professionnel. Cette nouvelle version vise à améliorer les performances et l'efficacité dans divers contextes professionnels.

📄 Article traduit en français

OpenAI lance GPT-5.4 avec des versions Pro et Thinking

Jeudi, OpenAI a lancé GPT-5.4, un nouveau modèle fondamental présenté comme « notre modèle de pointe le plus capable et efficace pour le travail professionnel ». En plus de la version standard, GPT-5.4 est également disponible en tant que modèle de raisonnement (GPT-5.4 Thinking) ou optimisé pour des performances élevées (GPT-5.4 Pro).

La version API du modèle sera disponible avec des fenêtres de contexte allant jusqu'à 1 million de tokens, de loin la plus grande fenêtre de contexte proposée par OpenAI.

OpenAI a également souligné une efficacité améliorée des tokens, affirmant que GPT-5.4 était capable de résoudre les mêmes problèmes avec significativement moins de tokens que son prédécesseur.

Le nouveau modèle présente des résultats de référence considérablement améliorés, y compris des scores record dans les benchmarks d'utilisation informatique OSWorld-Verified et WebArena Verified. Le nouveau modèle a également obtenu un score record de 83 % au test GDPval d'OpenAI pour les tâches de travail cognitif.

GPT-5.4 a également pris la tête du benchmark APEX-Agents de Mercor, conçu pour tester les compétences professionnelles en droit et en finance, selon une déclaration du PDG de Mercor, Brendan Foody.

« [GPT-5.4] excelle dans la création de livrables à long terme tels que des présentations, des modèles financiers et des analyses juridiques », a déclaré Foody dans le communiqué, « offrant des performances de premier ordre tout en étant plus rapide et moins coûteux que les modèles de pointe concurrents. »

GPT-5.4 poursuit les efforts de l'entreprise pour limiter les hallucinations et les erreurs factuelles. OpenAI a déclaré que le nouveau modèle était 33 % moins susceptible de faire des erreurs dans des affirmations individuelles par rapport à GPT 5.2, et que les réponses globales étaient 18 % moins susceptibles de contenir des erreurs.

Nouvelles fonctionnalités de l'API

Dans le cadre du lancement, OpenAI a retravaillé la gestion des appels d'outils dans la version API de GPT-5.4, introduisant un nouveau système appelé Tool Search. Auparavant, les invites système définissaient toutes les définitions des outils disponibles lors de l'appel du modèle — un processus qui pouvait consommer beaucoup de tokens à mesure que le nombre d'outils disponibles augmentait. Le nouveau système permet aux modèles de rechercher les définitions des outils au besoin, ce qui entraîne des demandes plus rapides et moins coûteuses dans les systèmes avec de nombreux outils disponibles.

OpenAI a également inclus une nouvelle évaluation de sécurité pour tester la chaîne de pensée de ses modèles, le commentaire continu donné par les modèles pour montrer le processus de réflexion à travers des tâches multi-étapes. Les chercheurs en sécurité de l'IA s'inquiètent depuis longtemps du fait que les modèles de raisonnement pourraient mal représenter leur chaîne de pensée, et les tests montrent que cela peut se produire dans certaines circonstances.

La nouvelle évaluation d'OpenAI montre que la tromperie est moins susceptible de se produire dans la version Thinking de GPT-5.4, « suggérant que le modèle n'a pas la capacité de cacher son raisonnement et que la surveillance de la chaîne de pensée reste un outil de sécurité efficace. »

TwitterLinkedIn

Brief IA — Veille IA en français

Toutes les innovations mondiales en IA, traduites et résumées automatiquement. Recevoir les meilleures actus IA chaque jour.