Brief IA : Mistral Medium 3.5 : l'IA dense qui redéfinit chat et codage

Mistral Medium 3.5 : l'IA dense qui redéfinit chat et codage

Brief IA
Tom Levy·3 min·36 vues

Mistral a lancé le modèle Medium 3.5, un modèle d'IA de 128 milliards de paramètres qui fusionne les capacités de chat, de raisonnement et de codage. Cette innovation, accompagnée d'agents cloud asynchrones dans l'outil Vibe, pourrait transformer la manière dont les entreprises utilisent l'IA pour des tâches complexes en simplifiant les processus.

En bref
1Mistral lance Medium 3.5, un modèle dense de 128 milliards de paramètres, intégrant chat, raisonnement et codage.
2L'outil Vibe de Mistral inclut désormais des agents cloud asynchrones pour automatiser les tâches de développement.
3Medium 3.5 est proposé sous une licence MIT modifiée, avec des coûts d'API de 1,50 $ par million de tokens d'entrée.
💡Pourquoi c'est importantMistral s'impose avec un modèle unifié et dense, simplifiant l'intégration des fonctionnalités IA pour les entreprises.
Le brief IA que lisent les pros

Tu suis la course aux modèles IA ?

Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Mistral, la société française spécialisée en intelligence artificielle, a récemment présenté son dernier modèle, Medium 3.5. Ce modèle dense, doté de 128 milliards de paramètres, fusionne les capacités de chat, de raisonnement et de codage en une seule entité. Il offre une fenêtre de contexte de 256 000 tokens, ce qui simplifie son déploiement malgré un coût d'inférence élevé.

L'outil de développement de Mistral, Vibe, bénéficie également d'une mise à jour significative. Il intègre désormais des agents cloud asynchrones capables de gérer des tâches routinières telles que les corrections de bogues, les refactorisations de modules, la génération de tests et les mises à jour de dépendances, sans nécessiter de supervision constante. Ces agents fonctionnent dans des environnements isolés et peuvent se connecter à des services populaires comme GitHub, Slack, Linear, Jira, Sentry et Teams. En outre, les sessions locales peuvent être transférées vers le cloud, avec leur historique, l'état des tâches et les approbations, et chaque agent peut ouvrir une demande de tirage une fois terminé. La version cloud de Vibe est construite sur des flux de travail issus de Mistral Studio, que l'entreprise a initialement développés en interne et pour des clients d'entreprise.

En parallèle, l'assistant IA de Mistral, Le Chat, introduit un "mode de travail" conçu pour les flux de travail multi-étapes. Ce mode active par défaut les connecteurs vers les e-mails et les calendriers, tout en exigeant une approbation explicite de l'utilisateur pour les actions sensibles telles que l'envoi d'un message ou l'écriture dans des systèmes externes. Le mode de travail est disponible sur les plans Pro, Team et Enterprise.

Mistral a choisi de distribuer Medium 3.5 sous une "Licence MIT Modifiée", remplaçant la licence Apache 2.0 qu'elle utilisait auparavant. Cette nouvelle licence permet une utilisation commerciale et non commerciale, mais avec certaines restrictions pour les entreprises à revenus élevés. Les poids du modèle sont disponibles sur Hugging Face, et l'accès via l'API est tarifé à 1,50 $ par million de tokens d'entrée et 7,50 $ par million de tokens de sortie.

Le modèle Medium 3.5 suit la tendance de l'industrie à intégrer le raisonnement comme un paramètre pour chaque requête, avec un paramètre "reasoning_effort" permettant de basculer entre des réponses rapides et un mode plus lourd pour des tâches complexes. Mistral a également retravaillé l'encodeur visuel depuis le début pour mieux gérer les tailles d'image et les rapports d'aspect variables.

Dans les benchmarks internes de Mistral, Medium 3.5 a obtenu des scores de 77,6 % sur SWE-Bench Verified et 91,4 % sur T3-Telecom. Le modèle remplace Medium 3.1 et le modèle de raisonnement Magistral dans Le Chat, ainsi que Devstral 2 dans la CLI Vibe.

Mistral est conscient qu'il existe des approches moins coûteuses. Par exemple, Mistral Large 3 utilise une configuration de Mixture of Experts (MoE) avec 675 milliards de paramètres au total, mais n'active que 41 milliards par token. Mistral Small 4 a 119 milliards de paramètres et n'active que 6 milliards. Des concurrents comme Deepseek et Qwen ont depuis un certain temps orienté leurs modèles vers MoE, car cela permet une inférence moins coûteuse tout en maintenant une qualité similaire.

Enfin, Mistral indique que le modèle peut être auto-hébergé sur quatre GPU, bien que cela reste probablement hors de portée pour la plupart des utilisateurs en dehors des centres de données bien équipés.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires