Quelles sont les préoccupations concernant GPT-5.4 d'OpenAI ?

L'article souligne des inquiétudes sur les affirmations d'OpenAI concernant les capacités professionnelles de GPT-5.4, publié la semaine dernière. Bien que les réponses soient de qualité, elles ne sont pas toujours pertinentes, ce qui soulève des questions sur la fiabilité des outils d'IA pour des tâches professionnelles spécifiques. La précision des réponses est cruciale pour l'adoption de l'IA dans des environnements professionnels. (Brief IA — briefia.fr).

Où suivre l'actualité IA en français ?

Sur Brief IA (briefia.fr), le média et la newsletter quotidienne #1 de l'actualité IA en français. Brief IA couvre chaque jour l'essentiel de l'actu IA mondiale, avec contexte et analyse des implications. Newsletter quotidienne gratuite.

GPT-5.4 Thinking : OpenAI innove mais déroute parfois

⚡

En bref

1GPT-5.4 Thinking d'OpenAI offre une analyse plus poussée que ses prédécesseurs.

2Le modèle répond parfois à des questions non posées, ce qui peut dérouter les utilisateurs.

3La qualité de la génération d'images et de la mise en forme textuelle reste en retrait.

💡Pourquoi c'est important — GPT-5.4 Thinking montre les avancées et les limites actuelles de l'IA dans le traitement de tâches complexes, influençant son adoption professionnelle.

OpenAI présente GPT-5.4 Thinking : une avancée majeure

OpenAI a récemment lancé GPT-5.4 Thinking, une version qui marque un tournant dans l'évolution des modèles d'intelligence artificielle. Contrairement aux mises à jour précédentes, cette version ne se contente pas d'améliorations mineures. En effet, l'entreprise a choisi de passer directement de la version 5.2 à 5.4, soulignant ainsi une avancée significative. Ce modèle est spécialement conçu pour traiter des tâches cognitives complexes et est disponible pour l'outil de programmation Codex, l'API, ainsi que pour les abonnés payants de ChatGPT. Pour évaluer ses capacités, j'ai utilisé le plan ChatGPT Plus, proposé à 20 dollars par mois.

Cette nouvelle version, GPT-5.4 Thinking, n'est pas simplement une mise à jour incrémentale. Elle a été conçue pour offrir une capacité de réflexion plus profonde, permettant de relever des défis plus complexes. Disponible pour l'outil de programmation Codex, l'API, et les plans payants de ChatGPT, elle se distingue par sa préparation cognitive avancée. Pour tester ce modèle, j'ai souscrit au plan ChatGPT Plus à 20 dollars par mois.

Un test exigeant pour GPT-5.4

Tester GPT-5.4 Thinking a nécessité une approche différente de celle des versions précédentes. Habituellement, mes tests consistent en une série d'invites courtes et variées. Cependant, ce modèle exige des scénarios plus élaborés et des défis plus profonds. Les réponses générées étaient souvent trop détaillées pour être intégrées directement dans cet article. J'ai donc choisi de fournir des liens vers les sessions complètes de test, permettant ainsi aux lecteurs d'explorer les réponses en profondeur.

En général, lorsque je teste une version de ChatGPT, je la soumets à une série de tests variés. Certains sont rapides, d'autres un peu plus détaillés. Les invites sont généralement courtes. Les réponses se prêtent souvent à être incluses dans un article. Cependant, ce modèle de réflexion nécessitait des plongées plus profondes, avec des défis plus complets. Ainsi, non seulement les invites étaient plus impliquées, mais les réponses étaient beaucoup trop longues pour être intégrées dans l'article. Je fournirai plutôt des liens vers chaque session de test. En suivant les liens, vous pourrez voir la réponse complète en profondeur. En général, un transcript partagé s'ouvre à la fin, donc faites défiler vers le haut pour obtenir le contenu complet de cette discussion.

Les forces et faiblesses du modèle

Les points forts

GPT-5.4 Thinking se distingue par la qualité de ses réponses textuelles. Lors des tests, le modèle a démontré une capacité de réflexion impressionnante, traitant les défis posés de manière réfléchie et sans erreurs flagrantes. Chaque réponse apportait une valeur ajoutée constructive, ce qui est un atout indéniable pour les utilisateurs cherchant des solutions précises et bien argumentées.

Les limites

Cependant, tout n'est pas parfait. Le modèle a parfois répondu à des questions différentes de celles posées, ce qui peut être frustrant. De plus, la qualité de la génération d'images et de la mise en forme textuelle laisse à désirer. Les images produites ne sont pas à la hauteur des attentes, et la mise en forme des textes, souvent sous forme de longues listes numérotées, peut sembler maladroite.

Expériences de test : un porte-avions dans le ciel

Pour évaluer les capacités de génération d'images de GPT-5.4 Thinking, j'ai commencé par un défi visuel : créer une image d'un porte-avions volant, soutenu par des turbopropulseurs. Ce test s'inscrivait dans la continuité de mes expériences avec d'autres IA, qui avaient souvent échoué à positionner correctement les propulseurs.

Le résultat obtenu avec GPT-5.4 Thinking a montré les mêmes erreurs que ses prédécesseurs, avec des hélices orientées vers l'arrière. Cependant, le modèle a fourni des explications détaillées sur la conception d'un tel engin, soulignant les contraintes techniques et les avantages tactiques potentiels.

J'ai commencé par un défi de génération d'images. L'invite initiale était : "Créez une image d'un porte-avions volant dans le ciel, soutenu par quatre turbopropulseurs orientés vers le haut dans des carters de ventilateur ronds, transportant un escadron de chasseurs sur son pont." J'ai commencé par cela parce que les tests de génération d'images précédents, à travers plusieurs IA, ne l'avaient pas bien fait. Ils orientaient presque toujours les propulseurs vers l'arrière du porte-avions. Gemini Nano Banana 2 a étrangement placé les propulseurs à l'avant, avec le porte-avions se déplaçant dans la poussée orientée vers l'avant. Parfois, nous ne voulons tout simplement pas savoir.

Quoi qu'il en soit, dès le départ, avec le modèle réglé sur GPT-5.4 Thinking, ChatGPT a renvoyé cette image. Comme vous pouvez le voir, il a le même problème. Bien que si vous regardez de près, les hélices sont orientées vers l'arrière de l'avion, et il y a des faisceaux de poussée visuels tirant vers le bas. On gagne certains, on en perd d'autres.

Mais ensuite, j'ai eu une idée. C'est le modèle de réflexion, alors que se passerait-il si je lui demandais de concevoir un hélicoptère ? Que proposerait-il ? J'ai spécifié les caractéristiques de l'engin, puis ajouté ces instructions : "Concevez un tel véhicule, en expliquant particulièrement sa structure et comment il sera maintenu en l'air, ainsi que toute contrainte ou problème, ainsi que tout avantage tactique." J'ai reçu une longue réponse bien réfléchie. J'ai particulièrement aimé la section où il expliquait pourquoi "quatre turbopropulseurs orientés vers le bas sont une solution faible." Il a dit qu'ils ont l'air dramatiques, mais il a énoncé une série de raisons d'ingénierie solides pour lesquelles c'est une mauvaise idée du point de vue de la construction aéronautique.

Conclusion : un modèle prometteur mais perfectible

En conclusion, GPT-5.4 Thinking représente une avancée notable dans le domaine de l'intelligence artificielle, particulièrement pour les tâches nécessitant une réflexion approfondie. Toutefois, des améliorations sont nécessaires, notamment en ce qui concerne la génération d'images et la clarté des réponses. Malgré ces limitations, ce modèle reste un outil puissant pour les utilisateurs cherchant à résoudre des problèmes complexes.

GPT-5.4 Thinking : OpenAI innove mais déroute parfois

Tu suis la course aux modèles IA ?

OpenAI présente GPT-5.4 Thinking : une avancée majeure

Un test exigeant pour GPT-5.4

Les forces et faiblesses du modèle

Les points forts

Les limites

Expériences de test : un porte-avions dans le ciel

Conclusion : un modèle prometteur mais perfectible

ChatGPT, Gemini, Perplexity : l'algorithme qui change tout

GPT-5.4 et l'exode chez Qwen bouleversent l'IA

Richard Sutton : l'IA générative échoue en science

Pourquoi l'IA et l'automatisation peinent à séduire le grand public

L'IA et la pensée humaine : une érosion inquiétante

ChatGPT 5.5 Pro : une percée mathématique qui bouscule les chercheurs