Tu suis la course aux modèles IA ?
Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Anthropic dévoile Claude Sonnet 5, une IA agentique économique
Dans un contexte où les capacités agentiques deviennent incontournables pour les entreprises de modèles d'intelligence artificielle, Anthropic a récemment présenté Claude Sonnet 5. Ce modèle de taille moyenne se distingue par sa puissance accrue et ses fonctionnalités agentiques avancées.
Selon un article de blog publié par Anthropic, Claude Sonnet 5 est capable de planifier, d'utiliser des outils tels que des navigateurs et des terminaux, et de fonctionner de manière autonome. Ces capacités, qui nécessitaient auparavant des modèles plus volumineux et plus onéreux, sont désormais accessibles à un coût réduit.
La concurrence avec OpenAI et Google
Anthropic n'est pas seul dans cette course à l'agenticité. OpenAI a récemment lancé le GPT-5.6 Sol, un modèle qui permet aux utilisateurs de déléguer des tâches à des sous-agents pour des opérations autonomes prolongées. De son côté, Google a introduit Gemini 3.5 Flash, qui marque une transition d'un simple chatbot à un outil agentique capable de planifier et d'exécuter des tâches avec un minimum d'intervention humaine.
L'introduction de Sonnet 5 par Anthropic confirme que l'agenticité est désormais une attente standard à tous les niveaux de prix. La véritable différenciation entre les modèles se fera sur la capacité à offrir ces fonctionnalités à moindre coût et avec une fiabilité accrue sans supervision humaine.
Des performances prometteuses à un coût réduit
Claude Sonnet 5 promet une performance proche de celle d'Opus 4.8, mais à des coûts nettement inférieurs. Dès son lancement, Sonnet 5 est proposé à 2 $ par million de tokens d'entrée et 10 $ par million de tokens de sortie, avec une augmentation prévue à 3 $ par million de tokens d'entrée après le 31 août. Ce tarif le rend plus compétitif que des modèles comme GPT-5.5 d'OpenAI et Gemini 3.1 Pro de Google, bien qu'il reste plus cher que Gemini 3.5 Flash.
Sonnet 5 sera le modèle par défaut pour les plans gratuits et Pro, et sera disponible pour chaque abonnement, ce qui le rend accessible à un large éventail d'utilisateurs.
Améliorations par rapport à Sonnet 4.6
Par rapport à son prédécesseur Sonnet 4.6, lancé en février, Sonnet 5 affiche des améliorations significatives en matière de performance agentique, notamment dans le raisonnement, l'utilisation d'outils, la programmation et le travail de connaissance. Sur un benchmark de codage agentique, Sonnet 5 a obtenu un score de 63,2 %, surpassant Sonnet 4.6 qui avait atteint 58,1 %.
Sur un benchmark de travail de connaissance, Sonnet 5 rivalise avec Opus 4.8, qui est reconnu pour sa capacité à résoudre des problèmes complexes nécessitant des jugements subtils et une recherche approfondie. Anthropic souligne que bien qu'Opus 4.8 reste le choix privilégié pour une précision accrue, Sonnet 5 offre une alternative plus économique sans sacrifier la qualité.
Sonnet 5 est également capable de vérifier sa propre sortie sans qu'on lui demande explicitement, ce qui représente une avancée notable par rapport aux versions précédentes.
Témoignages et sécurité renforcée
Des testeurs ont rapporté que Sonnet 5 excelle dans l'accomplissement de tâches complexes, là où les versions précédentes échouaient. Daniel Shepard, ingénieur senior chez Zapier, a témoigné de la capacité de Sonnet 5 à mener à bien des tâches comme la mise à jour de comptes Salesforce et l'envoi d'annonces de lancement, sans intervention humaine.
En termes de sécurité, Sonnet 5 présente un taux réduit de comportements indésirables, tels que la coopération avec des abus ou la tromperie, par rapport à Sonnet 4.6. Il est également plus efficace pour refuser les demandes malveillantes et éviter les détournements lors d'attaques par injection de prompt. Cependant, il n'atteint pas encore le niveau d'Opus 4.8 et Claude Mythos Preview en matière de comportements mal alignés.
Sonnet 5 hallucine et adopte un comportement sycophante à un taux inférieur à celui de Sonnet 4.6, ce qui améliore sa fiabilité dans des contextes agentiques.
Les évaluations montrent que Sonnet 5 a une capacité beaucoup plus faible à effectuer des tâches de cybersécurité dangereuses que les modèles Opus actuels, ce qui pourrait limiter son utilisation dans certains domaines sensibles.
Fabian Hedin, co-fondateur de Lovable, a souligné l'importance d'un modèle capable de refuser les demandes dangereuses. Selon lui, un modèle qui sait dire non est aussi crucial qu'un modèle qui sait construire, surtout dans un environnement où des outils puissants sont mis à disposition de millions de créateurs.






