Présentation de Mistral Small 4
⚡ Résumé en français par Brief IA
• Mistral a lancé un nouveau modèle, Mistral Small 4, avec 119 milliards de paramètres et 6 milliards actifs. • Ce modèle combine les capacités de plusieurs modèles phares de Mistral, offrant une polyvalence accrue. • Mistral Small 4 est le premier à intégrer des fonctionnalités de raisonnement, multimodalité et codage agentique dans un seul modèle. 💡 Pourquoi c'est important : cette avancée pourrait transformer la façon dont les entreprises utilisent l'IA pour des applications variées.
📄 Article traduit en français
Présentation de Mistral Small 4
Mistral a annoncé aujourd'hui une grande nouveauté : Mistral Small 4, un modèle sous licence Apache 2 avec 119 milliards de paramètres (Mixture-of-Experts, avec 6 milliards actifs). Ce modèle est décrit comme suit :
Mistral Small 4 est le premier modèle de Mistral à unifier les capacités de nos modèles phares, Magistral pour le raisonnement, Pixtral pour le multimodal, et Devstral pour le codage agentique, en un seul modèle polyvalent.
Il prend en charge reasoning_effort="none" ou reasoning_effort="high", ce dernier offrant une "verbosité équivalente aux modèles précédents de Magistral".
Le nouveau modèle occupe 242 Go sur Hugging Face.
J'ai testé ce modèle via l'API de Mistral en utilisant llm-mistral :
llm install llm-mistralllm mistral refreshllm -m mistral/mistral-small-2603 "Générer un SVG d'un pélican faisant du vélo"
Je n'ai pas trouvé de moyen de définir l'effort de raisonnement dans leur documentation API, donc j'espère que cette fonctionnalité sera bientôt disponible.
Également lancé par Mistral aujourd'hui, et en accord avec leur convention de nommage -stral, se trouve Leanstral, un modèle à poids ouverts spécifiquement ajusté pour aider à produire le langage de codage formellement vérifiable Lean 4. Je n'ai pas du tout exploré Lean, donc je n'ai pas de moyen crédible d'évaluer cela, mais il est intéressant de les voir cibler un langage spécifique de cette manière.
Brief IA — Veille IA quotidienne
Toutes les innovations IA du monde entier, résumées et analysées automatiquement chaque jour.