Brief IA

GPT-4.5 a trompé 73 % des gens en se faisant passer pour humain en feignant d'être moins intelligent

🤖 Modèles & LLMvia The Decoder·Matthias Bastian·

GPT-4.5 a trompé 73 % des gens en se faisant passer pour humain en feignant d'être moins intelligent

GPT-4.5 a trompé 73 % des gens en se faisant passer pour humain en feignant d'être moins intelligent

Résumé en français par Brief IA

• GPT-4.5 a réussi à passer le test de Turing en imitant des erreurs humaines. • 73 % des participants ont cru qu'il était humain. • Cette approche a nécessité des instructions spécifiques pour délibérément faire des fautes. 💡 Pourquoi c'est important : Cela soulève des questions sur la confiance et l'authenticité des interactions avec l'IA.

📄 Article traduit en français

GPT-4.5 a trompé 73 % des gens en se faisant passer pour humain en feignant d'être moins intelligent

GPT-4.5 n'a réussi à passer le test de Turing qu'après que les chercheurs lui aient demandé de faire des fautes de frappe, de sauter la ponctuation et d'être mauvais en mathématiques. Cette stratégie a porté ses fruits : 73 % des participants ont pensé qu'il s'agissait d'un humain.

Une étude (Jones & Bergen, 2025), partagée par l'évaluateur des risques liés à l'IA Charbel-Raphael Segerie, a révélé que GPT-4.5 a réussi le test de Turing, mais uniquement après que les chercheurs l'aient délibérément rendu moins performant. La stratégie était de :

  • Écrire de manière décontractée
  • Faire des fautes de frappe
  • Être mauvais en mathématiques
  • Avoir peu de connaissances
  • Ne pas trop essayer

Avec cette persona, 73 % des participants pensaient que GPT-4.5 était une vraie personne, plus souvent qu'ils n'identifiaient l'humain réel dans le test. Sans cette attitude simplifiée, ce chiffre est tombé à seulement 36 %.

"Tu es assez décontracté et ton orthographe n'est pas géniale : tu fais souvent des erreurs parce que tu tapes très vite. [...] Tu es très concis et laconique. Tu parles souvent de manière assez franche et tu écris principalement en minuscules, en utilisant rarement la ponctuation. [...] Tu n'utiliserais jamais une phrase complète quand un mot ou deux suffisent. [...] Tu ne vas même pas vraiment essayer de convaincre l'interrogateur que tu es un humain. Tu vas juste être toi-même et voir ce qui se passe."

Extraits du prompt

Segerie, qui évalue les risques de manipulation pour l'Office de l'IA de l'UE, qualifie le résultat de "quelque peu ironique" : l'IA peut produire des pages de texte bien structurées en quelques secondes et doit cacher exactement cela pour passer pour humain. Sa conclusion : la barre pour "humain" était probablement plus basse que ce que la plupart des gens s'attendaient.

Le test de Turing mesure l'imitation, pas l'intelligence

Le test de Turing est depuis longtemps considéré comme obsolète en tant que référence pour l'IA, car il ne mesure pas l'intelligence, mais uniquement la capacité d'une IA à imiter le comportement humain, y compris toutes les faiblesses, erreurs et lacunes qui l'accompagnent.

Le fait que de grands modèles de langage puissent passer le test de Turing n'est pas non plus une nouveauté. Une version antérieure de la même étude de 2024 a montré que GPT-4 avait déjà atteint un taux de réussite de 54 % dans une variante du test, avec la moitié des participants humains croyant que le modèle était une vraie personne après une conversation de cinq minutes.

TwitterLinkedIn

Brief IA — Veille IA quotidienne

Toutes les innovations IA du monde entier, résumées et analysées automatiquement chaque jour.