Le brief IA que les pros lisent chaque soir
Les 7 actus IA du jour, décryptées en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Modèles de langage
J'ai eu l'occasion de tester le modèle Claude Fable 5, une version sécurisée du modèle Claude Mythos, qui a été disponible pendant une période de 72 heures avant d'être suspendu par une décision du gouvernement américain. Pendant cette fenêtre de disponibilité, j'ai utilisé le modèle de manière intensive, jour et nuit, afin d'évaluer ses capacités et ses limites. Bien que le modèle soit actuellement inaccessible, j'espère qu'il sera à nouveau disponible dans un avenir proche. Je suis également convaincu que d'autres modèles aux capacités similaires verront le jour dans les mois à venir.
De nombreux articles ont été publiés sur Claude Fable et ses capacités. Cet article est particulièrement pertinent car j'utilise quotidiennement Claude Code depuis le début de l'année 2026. Dès le lancement de Claude Fable, j'ai immédiatement testé le modèle dans toute sa capacité. J'avais une série de tâches que Opus n'était pas capable de réaliser facilement, que j'ai testées avec Claude Fable pour vraiment évaluer ses performances.
Pourquoi se soucier de Claude Fable 5
Il est crucial de comprendre pourquoi Claude Fable 5 suscite tant d'intérêt. Ce modèle de langage est peut-être le plus attendu, ayant fait l'objet de beaucoup de battage médiatique avant son lancement. Anthropic a consacré beaucoup de temps à promouvoir le modèle, en parlant de ses capacités et des dangers qu'il pourrait représenter entre de mauvaises mains.
Beaucoup de gens étaient donc impatients de voir le modèle lancé, qui a finalement été mis à disposition la semaine dernière pour tous les abonnés Claude Pro ou Max. Personnellement, je n'ai rencontré aucun problème lors de son utilisation jusqu'à samedi matin, heure norvégienne. Bien que le modèle n'ait pas été disponible longtemps (environ 72 heures), j'ai pu le tester de manière approfondie et me faire une bonne opinion sur ses avantages, ses inconvénients et ses capacités globales.
Ce que Claude Fable fait bien
Tout d'abord, je souhaite aborder les points forts de Claude Fable. Mon impression générale est qu'il est nettement meilleur que Claude Opus 4.8. J'ai vu d'autres personnes en ligne affirmer que les capacités de Claude Fable n'étaient pas beaucoup plus avancées que celles de Claude Opus 4.8. À mon avis, cela n'est clairement pas vrai. Je pense que ceux qui rapportent cela n'ont pas testé Claude Fable sur des tâches suffisamment complexes.
Bien sûr, si vous testez Claude Fable sur une tâche déjà facile que Claude Opus peut réaliser, vous ne verrez pas ses capacités complètes. Là où Claude Fable brille vraiment, c'est lorsqu'il est appliqué à des tâches de codage super complexes.
Réalisation de tâches complexes de bout en bout
J'avais plusieurs tâches sur lesquelles je travaillais et pour lesquelles j'avais passé du temps avec Claude Opus 4.8 pour les mettre en œuvre. Opus était capable de le faire, mais ce n'était pas une mise en œuvre en une seule fois, et j'ai dû guider manuellement Claude Opus à travers certaines des implémentations.
Ces tâches comprenaient, par exemple :
- Une mise en œuvre de fonctionnalité où je devais modifier du code dans plusieurs dépôts
- La correction d'un problème/bogue rencontré par un client, où je devais améliorer les capacités d'extraction d'informations d'un LLM
Malheureusement, je ne peux pas entrer dans plus de détails sur ces problèmes car il s'agit de travail dans une base de code fermée. Pour comparer Claude Opus à Claude Fable, j'avais précédemment appliqué Claude Opus à ces problèmes et les avais résolus avec pas mal de direction manuelle. Ensuite, j'ai appliqué Claude Fable, et il a pu résoudre les problèmes en une seule fois. Un signe clair que Fable est un modèle plus puissant que Opus.
En termes plus généraux sur les capacités de Fable, je dirais que :
- Claude Fable est plus capable de réaliser des tâches de bout en bout, avec une meilleure compréhension des ambiguïtés et des intentions de l'utilisateur, une meilleure mise en œuvre de la solution prévue, et une meilleure vérification de la solution pour s'assurer qu'elle est correcte en naviguant sur l'ordinateur ou en exécutant des tests d'intégration.
J'ai simplement constaté que Claude Fable était capable de fonctionner plus longtemps, en réalisant des tâches plus complexes sans abandonner ni rencontrer de problèmes récurrents. J'ai eu l'impression que les tâches étaient désormais effectuées de manière plus autonome, et je n'avais pas besoin de donner autant de directives pour m'assurer que le modèle était aligné avec mes intentions.
Découverte de problèmes dans les bases de code
Une autre capacité incroyable que j'ai remarquée dans Claude Fable était qu'il était beaucoup meilleur que Claude Opus pour découvrir des problèmes dans les bases de code, que ce soit pour trouver des bogues ou rechercher des opportunités de refactorisation ou des problèmes potentiels futurs.
Je lance constamment une invite similaire à celle ci-dessous pour découvrir des problèmes dans ma base de code :
- Analyser en profondeur la base de code pour identifier tout bogue potentiel, problème ou opportunité de refactorisation, et revenir vers moi avec un rapport HTML des problèmes classés par ordre de gravité.
Avec Claude Opus, j'ai utilisé cette même invite et je n'ai pas obtenu de bons résultats. Claude Opus n'était pas capable de découvrir davantage d'opportunités de refactorisation ou de bogues, ou les problèmes qu'il a découverts n'étaient pas vraiment pertinents. (Bien sûr, notez que cela était le cas après que j'avais déjà effectué beaucoup de refactorisation et de détection de bogues avec Claude Opus dans un dépôt spécifique.)
Cependant, lorsque j'ai ensuite appliqué Claude Fable avec exactement la même invite, il a commencé à trouver de nombreux problèmes graves, tant sur le plan de la sécurité que des bogues réels, et a également identifié de nombreuses bonnes opportunités de refactorisation que Claude Opus n'avait pas pu voir.
J'ai immédiatement commencé à parcourir tous les dépôts avec Claude Fable exécutant cette invite et à corriger tous les problèmes. J'ai poussé beaucoup de code qui a considérablement amélioré la qualité de mes bases de code.
Je pense que c'est probablement le signe le plus clair que Fable est un modèle plus puissant que Opus. Vous pourriez exécuter exactement la même invite dans la même base de code où Fable est capable de détecter un tas de problèmes que Claude Opus n'a pas pu détecter.
Je suis juste heureux d'avoir pu effectuer cette refactorisation, détection de bogues et correction de nombreux problèmes avant que le modèle ne soit malheureusement suspendu.
Ce que Claude Fable ne fait pas bien
Dans la section précédente, j'ai abordé ce que Claude Fable fait très bien. Il est également important de mettre en avant certains inconvénients de Claude Fable, car ce n'est pas un modèle parfait.
Claude Fable est sans aucun doute le modèle de codage le plus puissant que j'ai jamais utilisé. Cependant, l'un des principaux problèmes est le nombre de tokens qu'il utilise pour accomplir des tâches.
Naturellement, ce n'est pas un problème avec le modèle lui-même. C'est plutôt un problème avec les limites de taux que vous avez avec Anthropic. En utilisant Claude Fable avec un abonnement, j'ai commencé à atteindre la limite d'abonnement beaucoup plus rapidement.
C'est définitivement une limitation, car vous ne pouvez plus simplement exécuter le modèle indéfiniment. De plus, je dirais que le prix de l'abonnement à Claude Fable est très prohibitif pour presque toutes les entreprises. Exécuter un modèle qui coûte 10 $ par million en entrée et 50 $ par million en sortie n'est pas faisable pour pratiquement personne, sauf pour les plus grandes entreprises.
Bien sûr, on pourrait dire que vous pouvez utiliser Claude Fable uniquement pour la planification et la détection de bogues, puis utiliser Claude Opus pour les mises en œuvre réelles. Je suis d'accord que cela pourrait probablement être fait, et vous tireriez toujours la plupart des avantages de Claude Fable ; cependant, passer beaucoup de temps à optimiser quel modèle utiliser dans quelles situations est très chronophage et quelque chose que vous voulez éviter si vous souhaitez être aussi productif et efficace que possible.
C'est l'un des principaux inconvénients, à mon avis, les limites de taux et la quantité d'utilisation du modèle/le coût du modèle si vous utilisez la tarification API.
Parfois, le modèle est trop enthousiaste
Un autre petit inconvénient que je voudrais également aborder avec Claude Fable est que le modèle est parfois trop enthousiaste pour trouver des problèmes ou effectuer des mises en œuvre. Parfois, j'ai constaté que le modèle mettait en œuvre des choses de manière trop complexe. Par exemple, il modifiait beaucoup plus de lignes de code que nécessaire, ou trouvait plus de problèmes dans une base de code où beaucoup de problèmes n'étaient pas vraiment si graves.
Je trouve cela légèrement agaçant parfois, mais je crois aussi que c'est un compromis qu'Anthropic a accepté. Vous voulez bien sûr que le modèle cherche toujours des problèmes et essaie constamment de les corriger, et vous voulez que la correction fonctionne immédiatement, bien sûr. Il est difficile de trouver un équilibre entre cette envie et le fait d'éviter que le modèle ne devienne trop enthousiaste à l'idée de trouver des problèmes et de les corriger.
Dans l'ensemble, cependant, c'est un inconvénient assez mineur. C'est juste un petit détail que j'ai remarqué en utilisant Claude Fable. De loin, le plus gros inconvénient est le prix prohibitif du modèle.
Dans cet article, j'ai partagé mes réflexions sur Claude Fable. Je l'ai comparé au précédent modèle de pointe d'Anthropic, qui était Claude Opus 4.8. Le modèle Claude Fable 5 est incroyable, mais présente également certains inconvénients :
- L'un d'eux étant qu'il est trop enthousiaste, ce que je considère comme un inconvénient mineur.
- Le prix. Le prix est, bien sûr, un inconvénient important. Cependant, ce n'est pas un problème avec le modèle lui-même, et les meilleurs modèles coûteront toujours cher. Les gens peuvent faire leur propre évaluation pour savoir si le modèle vaut ce qu'ils doivent payer pour l'utiliser.
Dans l'ensemble, c'est un modèle très puissant. J'espère qu'il redeviendra disponible bientôt.



