Cursor défie OpenAI et Anthropic avec Composer 2
Avec Composer 2, Cursor a lancé son propre modèle d'IA pour le développement logiciel à 0,50 $ par million de tokens d'entrée et 1,50 $ par million de tokens de sortie, ce qui est nettement moins cher que Claude Opus 4.6 (5,00 $ / 25,00 $) et GPT-5.4 (2,50 $ / 15,00 $).
Le modèle spécialisé dans le code obtient un score de 61,3 sur le CursorBench interne de Cursor, une amélioration significative par rapport à son prédécesseur Composer 1.5 (44,2) et compétitif par rapport à Claude Opus 4.6 (58,2) et GPT-5.4 Thinking (63,9).
Construire son propre modèle est une nécessité stratégique pour Cursor : l'entreprise concurrence directement Anthropic et OpenAI tout en dépendant de leurs modèles, ce qui lui laisse peu de flexibilité tarifaire, les deux fournisseurs proposant des plans à tarif fixe à bas coût.
Détails de Composer 2
Le modèle est désormais disponible dans Cursor et dans l'alpha précoce de la nouvelle interface "Glass". Les tarifs commencent à 0,50 $ par million de tokens d'entrée et 2,50 $ par million de tokens de sortie. Une variante plus rapide, que Cursor affirme offrir une intelligence identique, coûte 1,50 $ et 7,50 $ par million de tokens respectivement, et est livrée par défaut.
Tarifs par million de tokens
- 0,50 $ / 2,50 $ : Version standard
- 1,50 $ / 7,50 $ : Version plus rapide avec la même intelligence selon Cursor
- 5,00 $ / 25,00 $ : Prix API selon Anthropic, valable pour toute longueur de contexte
- 2,50 $ / 15,00 $ : Contexte court ; 5,00 $ / 22,50 $ : Contexte long selon OpenAI
Sur la base des tarifs API purs, Composer 2 est bien en dessous de Claude Opus 4.6 et GPT-5.4. Même la variante plus rapide reste largement moins chère que ses concurrents en termes de coûts par token.
Améliorations de qualité grâce à l'apprentissage par renforcement
Selon Cursor, les améliorations de qualité par rapport à son prédécesseur sont dues à un premier passage de préentraînement continu plus solide, qui fournit une meilleure base pour l'apprentissage par renforcement qui suit. Les sessions d'entraînement se concentrent sur des tâches de codage à long terme, des défis de programmation nécessitant des centaines d'actions individuelles pour être complétés.
Les chiffres publiés par Cursor montrent un bond majeur, surtout par rapport aux versions précédentes de Composer. Sur CursorBench, le benchmark interne de l'entreprise pour les tâches de codage, Composer 2 passe de 44,2 (Composer 1.5) à 61,3. Le modèle affiche également des gains sur Terminal Bench 2.0, un benchmark pour les tâches basées sur des agents dans le terminal, et sur SWE-bench Multilingual, qui teste les tâches d'ingénierie logicielle à travers plusieurs langages de programmation.
Benchmarks
- Terminal Bench 2.0
- Terminal Bench 2.0 optimisé
- SWE-bench Multilingual
Les scores de Terminal Bench 2.0 ne sont pas directement comparables, car les résultats dépendent également de l'agent, du harnais et des paramètres. Pour Claude Opus 4.6, 58,0 est la valeur Claude Code ; 65,4 est une valeur optimisée supplémentaire publiée par Anthropic. Pour GPT-5.4 Thinking, seule une valeur publiée de Terminal Bench est disponible.
Construire son propre modèle pour survivre
Cursor concurrence directement Anthropic et OpenAI, qui expédient des modèles d'IA de plus en plus puissants pour le développement logiciel. Selon Bloomberg, Cursor compte désormais plus d'un million d'utilisateurs quotidiens et environ 50 000 clients entreprises. L'entreprise est également en pourparlers pour un nouveau tour de financement à une valorisation d'environ 50 milliards de dollars.
En même temps, Cursor fait face à un dilemme structurel. La plateforme prend encore en charge les modèles d'OpenAI et d'Anthropic, ce qui signifie qu'elle concurrence les mêmes fournisseurs dont elle dépendait. Tant que Cursor achète des modèles tiers, ses prix, performances et marges dépendent tous d'entreprises qui vendent directement aux mêmes clients.
Anthropic, en particulier, fait des mouvements agressifs sur le marché du codage avec Claude Code. Cursor estime qu'un abonnement unique à Claude Code à 200 $ par mois peut engendrer environ 5 000 $ de coûts réels de calcul. Cela met en évidence le problème structurel : lorsque vous vous appuyez sur le modèle de quelqu'un d'autre, vous payez le prix fort pour un calcul que le fournisseur de modèle peut fortement subventionner dans son propre produit.
Cela ne laisse pas beaucoup de place à Cursor. Selon le rapport, les abonnements consommateurs fonctionnent déjà à des marges négatives, les contrats d'entreprise soutenant l'activité. Et le risque à long terme pourrait être encore plus grand : à mesure que les agents de codage IA deviennent plus capables, les utilisateurs pourraient sauter complètement l'IDE et travailler directement avec ces systèmes depuis le fournisseur de modèles.
📧
Cet article vous a plu ?
Recevez les 7 meilleures actus IA chaque soir à 19h — résumées en 5 min.
