Brief IA

J'ai testé GPT-5.4, et les réponses étaient vraiment bonnes - juste pas toujours ce que j'ai demandé

🤖 Modèles & LLMvia ZDNet IA·

J'ai testé GPT-5.4, et les réponses étaient vraiment bonnes - juste pas toujours ce que j'ai demandé

J'ai testé GPT-5.4, et les réponses étaient vraiment bonnes - juste pas toujours ce que j'ai demandé

⚡ Résumé en français par Brief IA

• L'article exprime des préoccupations concernant les affirmations d'OpenAI sur les capacités professionnelles de GPT-5.4. • L'auteur a noté que les réponses de GPT-5.4 étaient de qualité, mais pas toujours pertinentes. • Cela soulève des questions sur la fiabilité des outils d'IA pour des tâches professionnelles spécifiques. 💡 Pourquoi c'est important : la précision des réponses d'IA est cruciale pour l'adoption dans des environnements professionnels.

📄 Article traduit en français

J'ai testé GPT-5.4, et les réponses étaient vraiment bonnes - juste pas toujours ce que j'ai demandé

Je suis un peu inquiet des affirmations d'OpenAI selon lesquelles GPT-5.4 peut réaliser des tâches professionnelles. Voici pourquoi.

Points clés de ZDNET

  • GPT-5.4 Thinking offre une analyse plus approfondie que les modèles ChatGPT précédents.
  • Il possède un raisonnement solide, mais répond parfois à des questions que vous n'avez pas posées.
  • La qualité de la mise en forme et de la génération d'images est en deçà de celle du texte.

C'est un nouveau mois, et un nouveau numéro de version d'IA. Il s'appelle GPT-5.4 Thinking. Cette dernière version, publiée par OpenAI la semaine dernière, n'est pas une simple mise à jour incrémentale de ChatGPT.

De plus, au lieu de passer de 5.2 à 5.3, l'entreprise a fait un saut jusqu'à 5.4. Et au lieu de proposer une version à usage général, elle a lancé GPT-5.4 Thinking, un modèle plus préparé cognitivement, conçu pour des pensées et des défis plus importants. GPT-5.4 Thinking est disponible pour l'outil de programmation Codex, l'API et pour les plans payants de ChatGPT. Pour cet article, j'ai utilisé le plan ChatGPT Plus à 20 $ par mois pour le tester.

Cela m'a posé un petit défi. Normalement, lorsque je teste une version de ChatGPT, je la soumets à une série de tests variés. Certains sont rapides, d'autres un peu plus détaillés. Les invites sont généralement courtes. Les réponses se prêtent souvent à être incluses dans un article.

Cependant, ce modèle de réflexion nécessitait des plongées plus profondes, avec des défis plus complets. Ainsi, non seulement les invites étaient plus impliquées, mais les réponses étaient beaucoup trop longues pour être intégrées dans l'article. Je fournirai plutôt des liens vers chaque session de test. En suivant les liens, vous pourrez voir la réponse complète en profondeur. En général, un transcript partagé s'ouvre à la fin, donc faites défiler vers le haut pour obtenir le contenu complet de cette discussion.

Avant de plonger dans les quatre défis que j'ai présentés à GPT-5.4 Thinking, je vais vous donner un rapide TL;DR sur mon expérience. Il y a du bon et du mauvais, mais surtout du bon.

Le bon et le mauvais

  • Le bon : Les réponses textuelles sont vraiment bonnes. La plupart des défis que je lui ai posés ont été traités de manière réfléchie. Je ne l'ai pas surpris en train d'halluciner. J'ai obtenu une valeur constructive de chaque réponse.

  • Le mauvais : Malheureusement, parfois il a répondu à des questions qui différaient de celles que j'avais posées. Les images et la mise en forme laissaient beaucoup à désirer. En ce qui concerne la génération d'images, il est clair que l'IA n'a pas utilisé un modèle avancé. Vous verrez ce que je veux dire, mais en gros, c'est comme si le modèle n'écoutait tout simplement pas. La mise en forme était étrange. Il aime les listes numérotées très longues. Vous pouvez les voir dans les transcriptions de chat.

Dans l'ensemble, je recommanderais définitivement d'utiliser le modèle GPT-5.4 Thinking pour des défis et des questions plus importants. J'ai été assez impressionné, bien que je n'aie pas du tout aimé la mise en forme. Il nécessite également une gestion continue pour le garder sur la bonne voie.

Test 1 : Porte-avions dans le ciel

J'ai commencé par un défi de génération d'images. L'invite initiale était : "Créez une image d'un porte-avions volant dans le ciel, soutenu par quatre turbopropulseurs orientés vers le haut dans des carters de ventilateur ronds, transportant un escadron de chasseurs sur son pont."

J'ai commencé par cela parce que les tests de génération d'images précédents, à travers plusieurs IA, ne l'avaient pas bien fait. Ils orientaient presque toujours les propulseurs vers l'arrière du porte-avions. Gemini Nano Banana 2 a étrangement placé les propulseurs à l'avant, avec le porte-avions se déplaçant dans la poussée orientée vers l'avant. Parfois, nous ne voulons tout simplement pas savoir.

Quoi qu'il en soit, dès le départ, avec le modèle réglé sur GPT-5.4 Thinking, ChatGPT a renvoyé cette image.

Image générée par GPT-5.4

Comme vous pouvez le voir, il a le même problème. Bien que si vous regardez de près, les hélices sont orientées vers l'arrière de l'avion, et il y a des faisceaux de poussée visuels tirant vers le bas. On gagne certains, on en perd d'autres.

Mais ensuite, j'ai eu une idée. C'est le modèle de réflexion, alors que se passerait-il si je lui demandais de concevoir un hélicoptère ? Que proposerait-il ? J'ai spécifié les caractéristiques de l'engin, puis ajouté ces instructions : "Concevez un tel véhicule, en expliquant particulièrement sa structure et comment il sera maintenu en l'air, ainsi que toute contrainte ou problème, ainsi que tout avantage tactique."

J'ai reçu une longue réponse bien réfléchie. J'ai particulièrement aimé la section où il expliquait pourquoi "quatre turbopropulseurs orientés vers le bas sont une solution faible." Il a dit qu'ils ont l'air dramatiques, mais il a énoncé une série de raisons d'ingénierie solides pour lesquelles c'est une mauvaise idée du point de vue de la construction aéronautique.

TwitterLinkedIn

Brief IA — Veille IA en français

Toutes les innovations mondiales en IA, traduites et résumées automatiquement. Recevoir les meilleures actus IA chaque jour.