Anthropic surclasse la WebDevArena, Google et OpenAI distancés
Le brief IA que les pros lisent chaque soir
Les 7 actus IA du jour, décryptées en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Anthropic continue de dominer la WebDevArena
En mai 2026, Anthropic maintient sa position dominante dans la WebDevArena, un classement de LMArena qui évalue les performances des modèles d'IA sur les tâches de développement web front-end. Ces tâches incluent des workflows de codage agentique nécessitant un raisonnement en plusieurs étapes et l'utilisation d'outils. Anthropic place six de ses modèles dans le top 10, occupant notamment quatre des cinq premières positions grâce aux versions Claude Opus 4.6 et 4.7.
Claude Opus 4.7 en tête du classement
Les versions standard et "thinking" de Claude Opus 4.7, déployées le 16 avril, prennent logiquement les deux premières places du classement, succédant à leurs prédécesseurs. Ce lancement a également pour effet d'éjecter GLM-5.1, développé par l'entreprise chinoise Z.ai, du podium. En avril, GLM-5.1 était devenu le premier modèle open source à atteindre le podium de la WebDevArena.
Recul de Google et OpenAI
Google subit un revers avec la disparition de Gemini 3.1 Pro de la première partie du tableau. Bien que Google n'ait jamais dominé ce classement, il occupait régulièrement les places d'honneur aux côtés d'OpenAI. Cette dernière, dirigée par Sam Altman, recule également, avec GPT-5.5 "High" qui se retrouve désormais à la dixième position. Ce modèle est devancé par Muse Spark de Meta, qui fait une entrée remarquée en huitième position.
Classement des modèles IA en mai 2026
Voici le classement des dix meilleurs modèles pour le développement web :
- Claude Opus 4.7 Thinking (Anthropic) : 1 568
- Claude Opus 4.7 (Anthropic) : 1 562
- Claude Opus 4.6 (Anthropic) : 1 549
- Claude Opus 4.6 (Anthropic) : 1 544
- GLM-5.1 (Z.ai) : 1 532
- Claude Sonnet 4.6 (Anthropic) : 1 526
- Kimi-k2.6 (Moonshot) : 1 525
- Muse Spark (Meta) : 1 509
- Claude Opus 4.5 (Anthropic) : 1 491
- GPT-5.5 High (OpenAI) : 1 490
Le fonctionnement du classement WebDevArena
La WebDevArena, comme les autres classements de LMArena, anciennement connue sous le nom de Chatbot Arena, utilise un système de duels à l'aveugle. Les utilisateurs de la plateforme départagent deux modèles ayant répondu à une même requête. Chaque modèle dispose d'un score Elo, qui évolue au fil des rencontres. Battre un modèle mieux classé rapporte de l'Elo, tandis que perdre face à un modèle moins bien classé pénalise le score. Un modèle en tête peut continuer de progresser en remportant des duels contre des adversaires théoriquement plus faibles, mais son score évolue plus lentement.
Brief IA — L'actualité IA en français
L'essentiel de l'actualité de l'intelligence artificielle, décrypté et expliqué chaque jour.