Brief IA : Qwen 3.5 : Alibaba défie ChatGPT avec une IA open source puissante
🤖 Modèles & LLM

Qwen 3.5 : Alibaba défie ChatGPT avec une IA open source puissante

Brief IA
Tom Levy·4 min·3 vues

Qwen 3.5 est une intelligence artificielle chinoise open source, lancée en février 2023, qui fonctionne sur PC de bureau et surpasse GPT-5 Nano dans de nombreux benchmarks. Avec des modèles allant jusqu'à 397 milliards de paramètres, elle offre une alternative gratuite à ChatGPT, illustrant la montée en puissance des laboratoires chinois dans le domaine de l'IA.

En bref
1Alibaba a lancé Qwen 3.5, un modèle IA open source surpassant GPT-5 Nano sur plusieurs benchmarks.
2Qwen 3.5 est disponible en versions allant de 0.8B à 397B paramètres, adaptées à l'exécution locale sur PC.
3Le modèle excelle en compréhension multimodale et textuelle, mais reste en retrait pour le code complexe.
💡Pourquoi c'est importantQwen 3.5 pourrait redistribuer les cartes dans le secteur de l'IA, offrant une alternative gratuite et performante aux solutions américaines.
Le brief IA que lisent les pros

Le brief IA que les pros lisent chaque soir

Les 7 actus IA du jour, décryptées en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Qwen 3.5 : Une avancée significative dans l'IA open source

Alibaba, le géant technologique chinois, a récemment introduit Qwen 3.5, un modèle d'intelligence artificielle qui se présente comme une alternative sérieuse à ChatGPT. Ce modèle, entièrement open source, est conçu pour fonctionner localement sur un PC de bureau, surpassant même GPT-5 Nano sur de nombreux benchmarks. Cette initiative s'inscrit dans une stratégie plus large des laboratoires chinois, tels que Moonshot, MiniMax, et DeepSeek, qui visent à concurrencer les modèles propriétaires américains en développant des solutions open source de haute performance.

Une stratégie open source ambitieuse

La version 3.5 de Qwen, annoncée en février, offre une gamme de modèles allant de 397 milliards de paramètres dans sa version la plus massive à une version plus légère de 27 milliards. Entre ces extrêmes, on trouve des modèles intermédiaires à 122 et 35 milliards de paramètres. La version à 35 milliards, construite sur une architecture MoE, nécessite plus de 22 Go de VRAM, ce qui la rend déjà exigeante en termes de ressources. En mars, Alibaba a élargi cette gamme avec quatre nouveaux modèles : 9B, 4B, 2B, et 0.8B, conçus pour fonctionner sur des configurations matérielles plus modestes tout en rivalisant avec des modèles propriétaires récents.

Une conception pour l'exécution locale

Le 2 mars, Qwen 3.5 a été enrichi de ces quatre nouveaux modèles. Ces versions intègrent un système d'attention hybride, combinant attention linéaire et classique pour optimiser les ressources sans sacrifier la qualité des réponses. Concrètement, sur quatre étapes de traitement consécutives, trois utilisent une attention linéaire, moins gourmande en calcul, tandis qu'une seule fait appel à l'attention classique, plus précise mais plus coûteuse en ressources. Cette approche permet de réduire significativement les ressources nécessaires à l'exécution du modèle sans compromettre la qualité des réponses.

L'ensemble des versions publiées est également nativement multimodal. Contrairement à d'autres modèles qui ajoutent un encodeur de vision après coup, Qwen 3.5 intègre la compréhension visuelle dès sa conception. Cela signifie que texte, images et vidéos sont traités au sein du même réseau neuronal, sans distinction. Le modèle ne produit en revanche que du texte en sortie. En termes de capacité de contexte, Qwen 3.5 revendique une fenêtre de 262 000 tokens nativement, soit l'équivalent d'un roman de 500 pages traité d'un seul coup. Il est même possible de pousser cette limite jusqu'à un million de tokens (environ 2 heures de vidéo) moyennant une légère perte de précision, via YaRN, une technique d'ajustement mathématique de la taille de contexte.

Des performances impressionnantes

Qwen 3.5-9B se distingue particulièrement dans les benchmarks de vision et de raisonnement multimodal, surpassant GPT-5 Nano d'OpenAI et Gemini 2.5 Flash-Lite de Google. En compréhension de documents, il obtient un score de 87,7 contre 55,9 pour OpenAI. Il surpasse également GPT-OSS-120B d'OpenAI dans plusieurs tâches textuelles malgré sa taille plus modeste. Par exemple, en raisonnement scientifique, Qwen 3.5-9B obtient un score de 81,7 contre 80,1 pour GPT-OSS-120B. En connaissances générales, il atteint 82,5 contre 80,8, et en compréhension de contextes longs, il affiche 55,2 contre 48,2.

Cependant, le modèle montre des limites en programmation, avec un score de 65,6 sur LiveCodeBench, inférieur à celui de GPT-OSS-120B. Les tâches mathématiques avancées révèlent également un écart en faveur des modèles plus volumineux, avec un score de 83,2 contre 90,0 pour le modèle d'OpenAI. En clair, pour les usages classiques, analyse de documents, raisonnement visuel, compréhension multilingue, agents, Qwen 3.5-9B joue dans la cour des grands. Mais pour le code de haut niveau et les mathématiques de compétition, les modèles plus lourds conservent une longueur d'avance.

Une accessibilité accrue

Distribué sous licence Apache 2.0, Qwen 3.5 est entièrement gratuit et utilisable à des fins commerciales. Cette accessibilité pourrait bouleverser le marché de l'IA, offrant une alternative performante et sans coût aux solutions américaines dominantes. En proposant un modèle aussi performant sans frais, Alibaba pourrait bien redéfinir les standards de l'IA open source.

Commentaires