Anthropic surclasse la WebDevArena, Google et OpenAI distancés

⚡

Key Takeaways

1Anthropic domine la WebDevArena en mai 2026 avec six modèles dans le top 10, confirmant sa suprématie.

2Les modèles Claude Opus 4.6 et 4.7 d'Anthropic occupent quatre des cinq premières places du classement.

3Google et OpenAI reculent, avec GPT-5.5 d'OpenAI tombant à la dixième position, derrière Meta et son Muse Spark.

💡Why it matters — La domination d'Anthropic souligne un changement de leadership dans les modèles IA pour le développement web, impactant la concurrence.

Anthropic continue de dominer la WebDevArena

En mai 2026, Anthropic maintient sa position dominante dans la WebDevArena, un classement de LMArena qui évalue les performances des modèles d'IA sur les tâches de développement web front-end. Ces tâches incluent des workflows de codage agentique nécessitant un raisonnement en plusieurs étapes et l'utilisation d'outils. Anthropic place six de ses modèles dans le top 10, occupant notamment quatre des cinq premières positions grâce aux versions Claude Opus 4.6 et 4.7.

Claude Opus 4.7 en tête du classement

Les versions standard et "thinking" de Claude Opus 4.7, déployées le 16 avril, prennent logiquement les deux premières places du classement, succédant à leurs prédécesseurs. Ce lancement a également pour effet d'éjecter GLM-5.1, développé par l'entreprise chinoise Z.ai, du podium. En avril, GLM-5.1 était devenu le premier modèle open source à atteindre le podium de la WebDevArena.

Recul de Google et OpenAI

Google subit un revers avec la disparition de Gemini 3.1 Pro de la première partie du tableau. Bien que Google n'ait jamais dominé ce classement, il occupait régulièrement les places d'honneur aux côtés d'OpenAI. Cette dernière, dirigée par Sam Altman, recule également, avec GPT-5.5 "High" qui se retrouve désormais à la dixième position. Ce modèle est devancé par Muse Spark de Meta, qui fait une entrée remarquée en huitième position.

Classement des modèles IA en mai 2026

Voici le classement des dix meilleurs modèles pour le développement web :

Claude Opus 4.7 Thinking (Anthropic) : 1 568
Claude Opus 4.7 (Anthropic) : 1 562
Claude Opus 4.6 (Anthropic) : 1 549
Claude Opus 4.6 (Anthropic) : 1 544
GLM-5.1 (Z.ai) : 1 532
Claude Sonnet 4.6 (Anthropic) : 1 526
Kimi-k2.6 (Moonshot) : 1 525
Muse Spark (Meta) : 1 509
Claude Opus 4.5 (Anthropic) : 1 491
GPT-5.5 High (OpenAI) : 1 490

Le fonctionnement du classement WebDevArena

La WebDevArena, comme les autres classements de LMArena, anciennement connue sous le nom de Chatbot Arena, utilise un système de duels à l'aveugle. Les utilisateurs de la plateforme départagent deux modèles ayant répondu à une même requête. Chaque modèle dispose d'un score Elo, qui évolue au fil des rencontres. Battre un modèle mieux classé rapporte de l'Elo, tandis que perdre face à un modèle moins bien classé pénalise le score. Un modèle en tête peut continuer de progresser en remportant des duels contre des adversaires théoriquement plus faibles, mais son score évolue plus lentement.