
La moitié du code écrit par l'IA qui réussit un test industriel serait rejetée par de vrais développeurs, selon une nouvelle étude
Une étude de METR révèle que 50 % du code IA réussi au test SWE-bench serait rejeté par des développeurs. Cela souligne un décalage entre les performances des IA et les attentes des professionnels du développement logiciel.
Cette situation émerge alors que l'adoption des outils d'IA dans le développement logiciel s'accélère, poussée par la recherche d'efficacité et de réduction des coûts.
Les développeurs doivent désormais évaluer plus rigoureusement le code généré par l'IA avant son intégration, augmentant ainsi le besoin de compétences en validation et en vérification.
“50 % du code IA réussi est rejeté par des développeurs humains.”
👥 Pour : CTO, lead dev, responsables qualité, chercheurs en IA.
Lire l'article complet