Brief IA : Devin Desktop : Cognition fusionne Windsurf pour défier Codex

Devin Desktop : Cognition fusionne Windsurf pour défier Codex

Brief IA
Tom Levy·8 min·1 vues

Cognition a fusionné Windsurf et Devin pour créer Devin Desktop, une interface permettant de gérer plusieurs agents de code autonomes, disponible sur Mac, Windows et Linux depuis juin 2023. Cette plateforme vise à améliorer la productivité des développeurs en rivalisant avec des outils établis comme Claude Code et Codex. Le JDN souligne son potentiel, mais aussi les défis posés par la concurrence sur le marché.

En bref
1Cognition a intégré Windsurf et Devin dans une interface unique, Devin Desktop, pour gérer plusieurs agents de code.
2Cette nouvelle plateforme promet une autonomie accrue pour les développeurs, mais doit rivaliser avec des outils établis comme Claude Code et Codex.
3Le JDN a testé Devin Desktop, soulignant son potentiel mais aussi les défis posés par la concurrence.
💡Pourquoi c'est importantDevin Desktop pourrait transformer la gestion des agents de code, influençant la productivité des développeurs face à des solutions concurrentes bien établies.
Le brief IA que lisent les pros

Tu codes avec l’IA ?

Outils, agents et nouveautés dev IA décryptés, chaque soir en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Devin Desktop : Cognition fusionne Windsurf pour défier Codex

Cognition a fusionné Windsurf et Devin dans une nouvelle interface pensée pour piloter plusieurs agents de code à la fois. Le JDN a testé cette promesse d'autonomie, séduisante mais sérieusement concurrencée.

Windsurf est mort, vive Devin Desktop. Depuis le début du mois de juin, Windsurf, l'IDE de code agentique développé par Cognition, a été fusionné avec Devin sous le nom Devin Desktop. L'application, disponible sur Mac, Windows et Linux, permet de créer et gérer des agents de code autonomes depuis une interface kanban. Nous avions déjà testé l'IA Devin en avril : elle se positionnait comme une alternative encore plus autonome aux agents de code CLI classiques du marché ("/goal" n'existait pas encore) que sont Claude Code, Codex et Gemini CLI. Cette nouvelle mouture de Windsurf intègre-t-elle ces capacités ? Autonomie, expérience utilisateur, prix… Le JDN a testé pour vous.

La vraie différence de Devin Desktop

La vraie différence de Devin Desktop ne réside pas dans ses capacités de génération de code, désormais assez proches de celles des meilleurs agents du marché, mais dans la manière de les piloter. L’application remplace le traditionnel panneau de conversation par un véritable centre de commandement organisé sous la forme d’un tableau kanban. Chaque tâche confiée à un agent apparaît dans une colonne selon son état :

  • en cours (running)
  • bloquée (blocked)
  • terminé (ready)

Il est ainsi possible de lancer plusieurs travaux en parallèle, suivre leur progression et intervenir uniquement lorsqu’une validation humaine est nécessaire.

Cognition pousse cette logique un cran plus loin avec l’Agent Client Protocol ou ACP. Le protocole ouvert permet des échanges entre Devin Desktop et les agents de code. Concrètement, le centre de commandement des agents n’est pas réservé à Devin : il peut également accueillir Codex CLI, Claude, Gemini CLI, OpenCode ou encore votre propre agent. Tous peuvent alors être lancés et supervisés depuis la même interface. Devin Desktop se rapproche presque davantage d’un orchestrateur d’agents de code universel que d’un IDE véritable.

Par défaut, l'application permet de sélectionner trois agents de code différents :

  • Cascade : l'ancien agent de code de Windsurf, toujours intégré dans l'IDE. Il fonctionne avec une fenêtre de contexte unique et de manière séquentielle. Il est possible de choisir parmi la liste des modèles supportés par Devin pour faire fonctionner l'agent. Il sera très certainement supprimé dans les prochains mois.

  • Devin Local : le nouvel agent par défaut de Devin Desktop. Contrairement à Cascade, cet agent peut lancer des sous-agents et son harness est beaucoup mieux optimisé pour les tâches exigeant une grande autonomie. L'agent est sandboxé en local sur votre ordinateur.

  • Devin Cloud : l'agent le plus autonome. Il sélectionne le meilleur modèle disponible à chaque tour et conçoit votre application dans un environnement virtualisé (Ubuntu ou Windows) dans le cloud, en toute autonomie. Le code est hébergé sur un repo GitHub. C'est l'agent le plus autonome et le plus adapté aux tâches de software engineering, selon nous.

Test de Devin Cloud

Pour tester rapidement les capacités de Devin, nous allons lui demander de créer un chatbot météo, connecté en temps réel à l'ensemble des données des stations météo actuelles et futures. Le but : pouvoir interroger le chatbot sur n'importe quelle question météo et qu'il soit capable de répondre avec la plus grande précision, en fonction des modèles bruts de Météo-France (Arome, Arpège notamment). Nous utiliserons pour ce projet Devin Cloud, pour ses capacités d'autonomie.

Nous donnons ainsi tout simplement le prompt suivant à Devin Cloud :

Construis une application web de chatbot "météorologue IA" en français.

Critère central : le bot ne doit JAMAIS se limiter à restituer une prévision brute ("demain 22°C, risque de pluie"). Il doit raisonner comme un prévisionniste professionnel : croiser plusieurs modèles numériques, évaluer leur accord ou leur divergence, intégrer les observations en temps réel, expliquer la situation synoptique sous-jacente, et toujours assortir sa réponse d'un niveau de confiance. Si deux modèles divergent, il doit le dire et expliquer pourquoi.

  • Backend : Python + FastAPI.
  • Frontend : interface de chat web simple et propre (une seule page suffit).
  • LLM : API OpenAI, clé fournie via la variable d'environnement OPENAI_API_KEY.
  • Modèle à utiliser : GPT-5.5. Ne hardcode jamais la clé, lis-la dans l'environnement.

Sources de données

  1. Prévisions — Open-Meteo, endpoint Météo-France (modèles AROME et ARPEGE).

    • Utilise au minimum arome_france_hd (haute résolution ~1.3 km, courte échéance) ET arpege_europe (moyenne échéance).
    • Récupère par échéance horaire : température 2m, précipitations + probabilité, vent et rafales 10m, couverture nuageuse, pression au niveau mer, humidité relative, CAPE si exposé.
    • Pas de clé requise.
    • Géocodage ville -> lat/lon via l'API geocoding gratuite d'Open-Meteo.
  2. Observations — Infoclimat, réseau de stations temps réel.

    • Lis la doc pour le format exact et la gestion du token. Si un token est nécessaire, expose-le aussi en variable d'environnement.
    • Sert au nowcasting et à confronter les modèles à la réalité observée.

Cœur du produit : la couche "météorologue"

Le pipeline pour chaque question utilisateur :

  1. Identifier la localisation et l'échéance demandées.
  2. Récupérer en parallèle AROME, ARPEGE (prévisions) et Infoclimat (obs récentes).
  3. Construire un bloc de données structuré (JSON) que tu passes au LLM.
  4. Le system prompt du LLM doit imposer le rôle de prévisionniste et exiger :
    • comparaison explicite AROME vs ARPEGE (accord = confiance haute ; divergence = signaler l'incertitude et la fourchette) ;
    • prise en compte des observations Infoclimat pour caler le point de départ ;
    • explication du "pourquoi" météo (flux, front, anticyclone, instabilité…) quand c'est pertinent ;
    • rappel des limites des modèles (AROME pertinent surtout à courte échéance, ARPEGE au-delà ; fiabilité décroissante avec l'échéance) ;
    • niveau de confiance explicite (élevé / modéré / faible) ;
    • interdiction stricte d'inventer une donnée : si une donnée manque, le dire.

Critères d'acceptation

  • "Va-t-il pleuvoir demain après-midi à Serris ?" -> réponse nuancée citant les deux modèles et un niveau de confiance.
  • "Risque d'orage cette semaine sur l'Île-de-France ?" -> exploite CAPE et signale l'incertitude liée à l'échéance.
  • "Quel temps fait-il là maintenant à Lille ?" -> s'appuie sur l'observation Infoclimat, pas sur la prévision.
  • "AROME et ARPEGE sont-ils d'accord pour Lyon demain ?" -> comparaison directe.

Repo GitHub avec README : installation, variables d'environnement attendues (OPENAI_API_KEY, token Infoclimat si requis), commande de lancement. L'app doit tourner en local sans modification de code après avoir renseigné les clés.

L'agent travaille environ 30 minutes au total et livre une interface production ready. Bien que très minimaliste, celle-ci est pleinement fonctionnelle. Les données remontées sont fiables et permettent d'établir une prévision météo précise. La session a consommé environ 46 de notre quota journalier de l'offre Pro. Une consommation considérable qui ne permet pas de travailler sereinement sur un projet pendant plusieurs heures. Pour une utilisation au-delà de la découverte, les plans supérieurs sont inévitables.

Pour les plus curieux, le code est disponible sur GitHub : https://github.com/BenjaminPolge/meteorologue-ia

Un pricing attractif, exit les ACU

Sur le papier, Devin Desktop affiche un tarif particulièrement attractif. L'offre Pro démarre à seulement 20 dollars par mois et donne accès aux modèles les plus avancés d'OpenAI, Anthropic et Google, ainsi qu'à Devin Cloud. Cognition a surtout abandonné les ACU, ces unités de calcul opaques et difficiles à anticiper que nous critiquions lors de notre précédent test. Le fonctionnement par quota journalier et hebdomadaire est nettement plus lisible : l'utilisateur visualise immédiatement la part de son enveloppe consommée, sans avoir à convertir chaque action en crédits abstraits.

Cette apparente accessibilité doit toutefois être relativisée. Notre seul test, achevé en une trentaine de minutes, a consommé près de la moitié du quota journalier de l’offre Pro. À 20 dollars par mois, Devin Desktop conviendra donc surtout à des projets personnels ponctuels, par exemple pour développer rapidement une petite application durant un week-end. Pour travailler quotidiennement avec plusieurs agents, corriger un produit existant ou mener des sessions de plusieurs heures, la limite sera atteinte beaucoup trop rapidement. Un véritable usage professionnel individuel nécessite, selon nous, de passer directement à l’offre Max facturée 200 dollars par mois.

Devin Desktop n’en reste pas moins un excellent agent de code, capable de livrer rapidement des applications fonctionnelles avec très peu d’interventions humaines. Toutefois, le terrain de prédilection historique de Devin commence sérieusement à se réduire. Avec l’arrivée des boucles d’autonomie avancée comme /goal chez Codex et Claude Code, Devin Cloud se distingue beaucoup moins nettement qu’il y a encore quelques mois. Son interface kanban et son approche multi-agents restent séduisantes, mais elles ne suffisent plus à justifier seules son positionnement et son prix. Il faudra désormais observer comment Cognition fera évoluer le produit pour recréer un véritable avantage concurrentiel. La fusion entre Windsurf et Devin ne date après tout que de quelques semaines.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires