Le brief IA que les pros lisent chaque soir
Les 7 actus IA du jour, décryptées en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Un lancement marquant pour Z.ai avec GLM-5.2
Le 13 juin, le laboratoire chinois Z.ai a dévoilé son dernier modèle de langage, GLM-5.2, à ses abonnés du plan de codage. Quelques jours plus tard, le 16 juin, le modèle a été rendu accessible au public sous une licence MIT, permettant une utilisation plus large. Ce modèle se distingue par ses 753 milliards de paramètres et une base de données de 1,51 téraoctet, tout en intégrant 40 paramètres actifs grâce à la méthode Mixture of Experts. Contrairement à d'autres modèles de la famille Z.ai, GLM-5.2 est exclusivement textuel, tandis que la gamme GLM-5V-Turbo se concentre sur la vision, mais reste fermée. Une des avancées majeures de GLM-5.2 est sa capacité à gérer une fenêtre de contexte de 1 million de tokens, une amélioration significative par rapport aux 200 000 tokens de son prédécesseur, GLM-5.1.
Une reconnaissance rapide sur les benchmarks
L'arrivée de GLM-5.2 a suscité un vif intérêt, notamment de la part d'Artificial Analysis, une organisation réputée pour ses benchmarks indépendants. GLM-5.2 s'est rapidement imposé comme le modèle de référence sur l'Artificial Analysis Intelligence Index. Avec un score impressionnant de 51, il surpasse des modèles concurrents tels que MiniMax-M3 et DeepSeek V4 Pro, qui ont chacun obtenu un score de 44, et Kimi K2.6 avec 43.
Une consommation de tokens notable
Malgré ses performances, GLM-5.2 se distingue par une consommation de tokens plus élevée que ses concurrents. Lors des tests sur l'Intelligence Index, il a été observé que GLM-5.2 utilise en moyenne 43 000 tokens de sortie par tâche. En comparaison, GLM-5.1 en utilise 26 000, tandis que MiniMax-M3, Kimi K2.6, et DeepSeek V4 Pro consomment respectivement 24 000, 35 000, et 37 000 tokens.
Performances dans le développement web
Sur le tableau de classement Code Arena WebDev, GLM-5.2 a réussi à se hisser à la deuxième place, juste derrière Claude Fable 5. Ce classement évalue les capacités des modèles à gérer des tâches de développement web front-end, y compris les flux de travail de codage agentique. Cette performance est d'autant plus remarquable que GLM-5.2 ne traite pas d'images, un élément souvent jugé essentiel pour les modèles de codage front-end.
Expérience utilisateur et coût
J'ai eu l'occasion de tester GLM-5.2 via OpenRouter, qui le propose à travers 9 fournisseurs différents. La tarification est relativement compétitive, avec un coût de 1,40 $ par million de tokens pour l'entrée et 4,40 $ par million pour la sortie. À titre de comparaison, GPT-5.5 est proposé à 5 $/30 $ et Claude Opus 4.5-4.8 à 5 $/25 $.
Des résultats variés en génération graphique
Lors de l'utilisation de GLM-5.1, j'avais été impressionné par la qualité des SVG générés, notamment un pélican et un opossum, où le modèle avait même ajouté des animations CSS dans un document HTML. Avec GLM-5.2, j'ai tenté de générer un SVG d'un pélican à vélo. Le résultat était un SVG animé de manière autonome, sans défauts dans les animations, offrant une illustration vectorielle de grande qualité.
Cependant, la génération d'un SVG d'un opossum sur un e-scooter n'a pas été à la hauteur. Contrairement à GLM-5.1, GLM-5.2 n'a pas réussi à animer l'opossum, marquant une régression notable dans ce cas précis.

