Tu suis la course aux modèles IA ?
Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Epoch AI a introduit MirrorCode, un benchmark pour tester les modèles d'IA sur leur capacité à recréer des programmes sans accès au code source original. Claude Opus 4.7 a atteint un taux de réussite de 56 %, reconstruisant 16 000 lignes de code en 14 heures.
Cependant, malgré une exécution ininterrompue pendant 19 jours, coûtant 2 600 $, tous les modèles testés échouent sur les tâches les plus complexes, révélant les limites actuelles de l'IA.



