DeepSeek V4 : la riposte chinoise face à GPT-5.5 et Claude
Le brief IA que les pros lisent chaque soir
Les 7 actus IA du jour, décryptées en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
DeepSeek V4 : une nouvelle ère pour l'IA chinoise
Un an et demi après avoir secoué le secteur de l'intelligence artificielle, DeepSeek, la startup basée à Hangzhou, revient avec une nouvelle version de son modèle, DeepSeek V4. En début d'année 2025, la société avait déjà surpris le monde avec des modèles performants à des coûts de développement bien inférieurs à ceux de leurs homologues américains. Depuis lors, DeepSeek s'était fait discret, mais le 24 avril, elle a annoncé la sortie de DeepSeek V4 en pré-version open source, promettant de rivaliser avec le tout récent GPT-5.5.
Deux versions distinctes pour des besoins variés
DeepSeek V4 se décline en deux versions, chacune avec une architecture propre :
-
DeepSeek V4-Pro : Ce modèle impressionnant compte 1 600 milliards de paramètres, dont 49 milliards sont actifs. Il est conçu pour des applications avancées, avec des capacités agentiques supérieures à celles de la version précédente. DeepSeek l'utilise déjà pour ses processus internes de codage agentique et l'a intégré à des outils tels que Claude Code et OpenCode.
-
DeepSeek V4-Flash : Avec 284 milliards de paramètres et 13 milliards actifs, cette version est optimisée pour des usages rapides et économiques. Bien que moins puissant que le V4-Pro, il offre des performances comparables pour des tâches agentiques simples.
Les deux modèles supportent un contexte d'un million de tokens, une capacité parmi les plus compétitives du marché. DeepSeek a atteint cette performance grâce à une architecture d'attention innovante, incluant une compression des tokens et le mécanisme DSA (DeepSeek Sparse Attention), réduisant ainsi les coûts de calcul et de mémoire.
Les avancées concrètes de DeepSeek V4
DeepSeek met en avant trois domaines clés où le V4-Pro excelle par rapport à son prédécesseur V3 :
-
Capacités agentiques : Sur la plateforme Codeforces, V4-Pro dépasse GPT-5.4 et Gemini-3.1-Pro. En ce qui concerne SWE Verified, qui évalue la résolution autonome de tickets logiciels, les trois modèles atteignent presque 80 % de réussite.
-
Raisonnement mathématique et scientifique : DeepSeek affirme que V4-Pro surpasse les modèles open source actuels en mathématiques, STEM et codage, rivalisant avec les meilleurs modèles propriétaires. Sur Apex Shortlist, il obtient un score de 90,2, surpassant Claude Opus 4.6 et GPT-5.4.
-
Connaissance générale : V4-Pro surpasse Claude Opus 4.6 et GPT-5.4 sur SimpleQA Verified, bien qu'il soit encore derrière Gemini-3.1-Pro sur ce critère.
Un rapport technique détaillé est disponible sur la page Hugging Face du modèle pour ceux qui souhaitent approfondir.
Disponibilité immédiate et gratuite de DeepSeek V4
DeepSeek V4 est accessible gratuitement dès aujourd'hui via plusieurs canaux :
-
Sur l'interface chat.deepseek.com, les utilisateurs peuvent choisir entre le Mode Expert (V4-Pro) et le Mode Instantané (V4-Flash).
-
L'API DeepSeek est également disponible, avec les identifiants de modèle deepseek-v4-pro et deepseek-v4-flash. Elle est compatible avec les API OpenAI ChatCompletions et Anthropic.
Il est à noter que les anciens modèles deepseek-chat et deepseek-reasoner seront retirés définitivement le 24 juillet 2026.
Brief IA — L'actualité IA en français
L'essentiel de l'actualité de l'intelligence artificielle, décrypté et expliqué chaque jour.