Brief IA : Cursor défie OpenAI avec Composer 2, un modèle IA abordable
💻 Code & Dev

Cursor défie OpenAI avec Composer 2, un modèle IA abordable

Brief IA
Tom Levy·4 min·1 vues

Cursor a lancé Composer 2, un modèle d'IA pour le développement logiciel, à des tarifs de **0,50 $** par million de tokens d'entrée et **1,50 $** par million de tokens de sortie. Ce modèle obtient un score de **61,3** sur le CursorBench, surpassant son prédécesseur Composer 1.5 et se rapprochant des performances de Claude Opus 4.6 et GPT-5.4.

En bref
1Cursor lance Composer 2, un modèle IA pour développeurs, à 0,50 $ par million de tokens d'entrée.
2Composer 2 surpasse son prédécesseur avec un score de 61,3 sur CursorBench, rivalisant avec Claude Opus 4.6.
3Le modèle est disponible dans l'interface Glass, avec des tarifs compétitifs face à OpenAI et Anthropic.
💡Pourquoi c'est importantCursor s'affirme sur le marché des IA de codage, offrant une alternative économique aux géants établis.
Le brief IA que lisent les pros

Le brief IA que les pros lisent chaque soir

Les 7 actus IA du jour, décryptées en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Composer 2 : un modèle IA économique pour le développement logiciel

Cursor a récemment dévoilé Composer 2, son modèle d'intelligence artificielle dédié au développement logiciel, avec des tarifs très compétitifs. Le coût est fixé à 0,50 $ par million de tokens d'entrée et 1,50 $ par million de tokens de sortie, ce qui représente une économie substantielle par rapport aux tarifs de Claude Opus 4.6, qui s'élèvent à 5,00 $ et 25,00 $ respectivement, et ceux de GPT-5.4, à 2,50 $ et 15,00 $.

Le modèle se distingue par sa spécialisation dans le code, obtenant un score de 61,3 sur le CursorBench, un benchmark interne de Cursor. Cette performance marque une nette amélioration par rapport à Composer 1.5, qui avait obtenu un score de 44,2. Composer 2 se positionne ainsi comme un concurrent sérieux face à Claude Opus 4.6, qui a un score de 58,2, et GPT-5.4 Thinking, avec 63,9.

Stratégie de Cursor : indépendance et compétitivité

La création de son propre modèle est une décision stratégique pour Cursor, qui cherche à s'émanciper de sa dépendance vis-à-vis d'Anthropic et OpenAI. Ces derniers proposent des modèles à des tarifs fixes, limitant la flexibilité tarifaire de Cursor. En développant Composer 2, Cursor vise à offrir une alternative plus abordable tout en restant compétitif sur le marché.

Détails et tarifs de Composer 2

Composer 2 est intégré à la plateforme Cursor et est également disponible dans la version alpha de la nouvelle interface "Glass". Les tarifs débutent à 0,50 $ par million de tokens d'entrée et 2,50 $ par million de tokens de sortie. Une version plus rapide est proposée, avec des coûts de 1,50 $ et 7,50 $ par million de tokens, tout en maintenant le même niveau d'intelligence, selon Cursor.

Comparaison des tarifs par million de tokens

  • 0,50 $ / 2,50 $ : Version standard de Composer 2
  • 1,50 $ / 7,50 $ : Version accélérée
  • 5,00 $ / 25,00 $ : Tarifs API d'Anthropic pour toutes les longueurs de contexte
  • 2,50 $ / 15,00 $ : Tarifs OpenAI pour contexte court ; 5,00 $ / 22,50 $ pour contexte long

En termes de coûts par token, Composer 2 se révèle être une option plus économique que Claude Opus 4.6 et GPT-5.4, même dans sa version accélérée.

Améliorations par l'apprentissage par renforcement

Cursor attribue les améliorations de Composer 2 à un préentraînement continu renforcé, qui sert de base à l'apprentissage par renforcement. Ce processus se concentre sur des tâches de codage complexes nécessitant de nombreuses actions individuelles.

Les résultats montrent une progression notable sur le CursorBench, où Composer 2 atteint 61,3, contre 44,2 pour Composer 1.5. Le modèle affiche également des performances accrues sur Terminal Bench 2.0, un benchmark pour les tâches basées sur des agents dans le terminal, ainsi que sur SWE-bench Multilingual, qui évalue les compétences en ingénierie logicielle dans plusieurs langages de programmation.

Résultats des benchmarks

  • Terminal Bench 2.0
  • Terminal Bench 2.0 optimisé
  • SWE-bench Multilingual

Les scores de Terminal Bench 2.0 varient en fonction de l'agent et des paramètres utilisés. Pour Claude Opus 4.6, un score de 58,0 est rapporté, avec une version optimisée atteignant 65,4. GPT-5.4 Thinking n'a qu'une seule valeur publiée pour Terminal Bench.

Défis et perspectives pour Cursor

Cursor se positionne directement face à Anthropic et OpenAI, qui continuent de développer des modèles d'IA de plus en plus sophistiqués pour le développement logiciel. Selon Bloomberg, Cursor compte plus d'un million d'utilisateurs quotidiens et environ 50 000 clients entreprises. L'entreprise envisage également un nouveau tour de financement, espérant atteindre une valorisation de 50 milliards de dollars.

Cependant, Cursor doit naviguer dans un contexte complexe. Bien qu'elle développe son propre modèle, la plateforme continue de prendre en charge les modèles d'OpenAI et d'Anthropic, ce qui signifie qu'elle est en concurrence avec ses propres fournisseurs. Cette dépendance limite ses marges de manœuvre en termes de prix et de performances.

Anthropic, avec son modèle Claude Code, adopte une stratégie agressive sur le marché du codage. Cursor estime qu'un abonnement Claude Code à 200 $ par mois pourrait entraîner des coûts de calcul réels d'environ 5 000 $. Cela souligne le défi structurel auquel Cursor est confronté : en s'appuyant sur des modèles tiers, elle doit payer des coûts de calcul que les fournisseurs peuvent subventionner pour leurs propres produits.

Ce contexte laisse peu de marge de manœuvre à Cursor. Les abonnements consommateurs sont déjà à des marges négatives, soutenus par les contrats d'entreprise. Le risque à long terme est que, à mesure que les agents de codage IA deviennent plus performants, les utilisateurs pourraient se détourner des IDE pour interagir directement avec les systèmes des fournisseurs de modèles.

Commentaires