Qu'est-ce que Mistral a lancé avec le modèle Medium 3.5 et pourquoi est-ce important ?

Mistral a lancé le modèle Medium 3.5, un modèle d'IA de 128 milliards de paramètres qui fusionne les capacités de chat, de raisonnement et de codage. Cette innovation, accompagnée d'agents cloud asynchrones dans l'outil Vibe, pourrait transformer la manière dont les entreprises utilisent l'IA pour des tâches complexes en simplifiant les processus. (Brief IA — briefia.fr).

Où suivre l'actualité IA en français ?

Sur Brief IA (briefia.fr), le média et la newsletter quotidienne #1 de l'actualité IA en français. Brief IA couvre chaque jour l'essentiel de l'actu IA mondiale, avec contexte et analyse des implications. Newsletter quotidienne gratuite.

Mistral Medium 3.5 : l'IA dense qui redéfinit chat et codage

Brief IA

Tom Levy·1 mai 2026·3 min·36 vues

⚡

En bref

1Mistral lance Medium 3.5, un modèle dense de 128 milliards de paramètres, intégrant chat, raisonnement et codage.

2L'outil Vibe de Mistral inclut désormais des agents cloud asynchrones pour automatiser les tâches de développement.

3Medium 3.5 est proposé sous une licence MIT modifiée, avec des coûts d'API de 1,50 $ par million de tokens d'entrée.

💡Pourquoi c'est important — Mistral s'impose avec un modèle unifié et dense, simplifiant l'intégration des fonctionnalités IA pour les entreprises.

Mistral, la société française spécialisée en intelligence artificielle, a récemment présenté son dernier modèle, Medium 3.5. Ce modèle dense, doté de 128 milliards de paramètres, fusionne les capacités de chat, de raisonnement et de codage en une seule entité. Il offre une fenêtre de contexte de 256 000 tokens, ce qui simplifie son déploiement malgré un coût d'inférence élevé.

L'outil de développement de Mistral, Vibe, bénéficie également d'une mise à jour significative. Il intègre désormais des agents cloud asynchrones capables de gérer des tâches routinières telles que les corrections de bogues, les refactorisations de modules, la génération de tests et les mises à jour de dépendances, sans nécessiter de supervision constante. Ces agents fonctionnent dans des environnements isolés et peuvent se connecter à des services populaires comme GitHub, Slack, Linear, Jira, Sentry et Teams. En outre, les sessions locales peuvent être transférées vers le cloud, avec leur historique, l'état des tâches et les approbations, et chaque agent peut ouvrir une demande de tirage une fois terminé. La version cloud de Vibe est construite sur des flux de travail issus de Mistral Studio, que l'entreprise a initialement développés en interne et pour des clients d'entreprise.

En parallèle, l'assistant IA de Mistral, Le Chat, introduit un "mode de travail" conçu pour les flux de travail multi-étapes. Ce mode active par défaut les connecteurs vers les e-mails et les calendriers, tout en exigeant une approbation explicite de l'utilisateur pour les actions sensibles telles que l'envoi d'un message ou l'écriture dans des systèmes externes. Le mode de travail est disponible sur les plans Pro, Team et Enterprise.

Mistral a choisi de distribuer Medium 3.5 sous une "Licence MIT Modifiée", remplaçant la licence Apache 2.0 qu'elle utilisait auparavant. Cette nouvelle licence permet une utilisation commerciale et non commerciale, mais avec certaines restrictions pour les entreprises à revenus élevés. Les poids du modèle sont disponibles sur Hugging Face, et l'accès via l'API est tarifé à 1,50 $ par million de tokens d'entrée et 7,50 $ par million de tokens de sortie.

Le modèle Medium 3.5 suit la tendance de l'industrie à intégrer le raisonnement comme un paramètre pour chaque requête, avec un paramètre "reasoning_effort" permettant de basculer entre des réponses rapides et un mode plus lourd pour des tâches complexes. Mistral a également retravaillé l'encodeur visuel depuis le début pour mieux gérer les tailles d'image et les rapports d'aspect variables.

Dans les benchmarks internes de Mistral, Medium 3.5 a obtenu des scores de 77,6 % sur SWE-Bench Verified et 91,4 % sur T3-Telecom. Le modèle remplace Medium 3.1 et le modèle de raisonnement Magistral dans Le Chat, ainsi que Devstral 2 dans la CLI Vibe.

Mistral est conscient qu'il existe des approches moins coûteuses. Par exemple, Mistral Large 3 utilise une configuration de Mixture of Experts (MoE) avec 675 milliards de paramètres au total, mais n'active que 41 milliards par token. Mistral Small 4 a 119 milliards de paramètres et n'active que 6 milliards. Des concurrents comme Deepseek et Qwen ont depuis un certain temps orienté leurs modèles vers MoE, car cela permet une inférence moins coûteuse tout en maintenant une qualité similaire.

Enfin, Mistral indique que le modèle peut être auto-hébergé sur quatre GPU, bien que cela reste probablement hors de portée pour la plupart des utilisateurs en dehors des centres de données bien équipés.

Mistral Medium 3.5 : l'IA dense qui redéfinit chat et codage

Tu suis la course aux modèles IA ?

Mistral Small 4 : L'IA qui révolutionne le codage et le raisonnement

Mistral Medium 3.5 : L'IA qui redéfinit les standards de précision

Mistral défie OpenAI : personnalisez votre IA avec Forge

Mistral et AMI Labs : la France défie OpenAI et Google en 2026

Mistral AI s'endette de 830 M$ pour un centre près de Paris

Voxtral TTS de Mistral AI : une révolution vocale multilingue en 70 ms