LWiAI Podcast #238 - GPT 5.4 mini, OpenAI Pivot, Mamba 3, Attention Residuals
LWiAI Podcast #238 - GPT 5.4 mini, OpenAI en mutation, Mamba 3, Résidus d'Attention
Résumé de l'épisode
Notre 238e épisode présente un résumé et une discussion des grandes nouvelles de l'IA de la semaine dernière !
Enregistré le 18 mars 2026, animé par Andrey Kurenkov et Jeremie Harris.
N'hésitez pas à nous envoyer vos questions et retours à andreyvkurenkov@gmail.com et/ou hello@gladstone.ai.
Points abordés dans cet épisode :
-
OpenAI a lancé GPT-5.4 mini et nano avec des fenêtres de contexte de 400 000 tokens, des prix par token plus élevés, mais des gains d'efficacité des tokens revendiqués dans Codex ; la version nano est uniquement disponible via API et est destinée à la classification à volume élevé/extraction de données malgré une augmentation de prix majeure.
-
Mistral a open-sourcé la famille de modèles Small 4 (MoE, 119 milliards au total / 6 milliards actifs) combinant des capacités de raisonnement, multimodales et d'agent de codage, et a annoncé Forge pour aider les entreprises à former ou à post-entraîner des modèles personnalisés.
-
La compétition autour des systèmes d'exploitation pour agents s'est intensifiée avec le lancement par Meta de Manus, un agent local pour Mac, Nvidia annonçant NeMo/Open Shell, un environnement d'exécution d'agent sandboxé, et Nvidia dévoilant également DLSS 5 ainsi que des prévisions matérielles majeures, y compris l'intégration de Groq LPU.
-
Les mises à jour concernant les affaires et la sécurité incluent le changement de focus d'OpenAI vers la productivité/l'entreprise face à la concurrence, la réorganisation des efforts de Copilot et des modèles de pointe par Microsoft, le retard du prochain modèle de Meta, le déploiement par ByteDance de grands clusters Nvidia à l'étranger, et de nouveaux travaux de sécurité sur la stéganographie, la fidélité de la chaîne de pensée, les défenses de fine-tuning, les évaluations des cyberattaques, et la conformité aux spécifications.
Remerciements
Un merci à nos sponsors actuels :
-
Box - visitez Box.com/AI pour en savoir plus.
-
ODSC AI - rendez-vous sur odsc.ai/east et utilisez le code promo LWAI pour obtenir une réduction supplémentaire de 15% sur votre pass pour ODSC AI East 2026.
-
Factor - rendez-vous sur factormeals.com/lwai50off et utilisez le code lwai50off pour obtenir 50% de réduction et un petit déjeuner gratuit pendant un an.
Horodatages :
-
(00:00:10) Intro / Discussions
-
(00:01:56) Aperçu des nouvelles
-
(00:02:39) OpenAI lance GPT-5.4 mini et nano, plus rapide et plus capable mais jusqu'à 4x plus cher
-
(00:08:04) Le nouveau modèle Small 4 de Mistral surpasse ses concurrents avec 128 modules experts
-
(00:14:03) Le Manus de Meta lance ‘My Computer’ pour transformer votre Mac en agent IA
-
(00:17:57) NVIDIA annonce NemoClaw pour la communauté OpenClaw | Salle de presse NVIDIA + Nvidia renforce le travail de connaissance avec la plateforme de développement d'agents ouverts
-
(00:24:09) DLSS 5 ressemble à un filtre IA génératif en temps réel pour les jeux vidéo
-
(00:26:36) OpenAI lancera le mode ‘Adult’ de ChatGPT malgré les avertissements de ses propres conseillers
-
(00:33:46) OpenAI se concentre apparemment uniquement sur les affaires et la productivité
-
(00:41:25) Nvidia GTC 2026 : Le PDG Jensen Huang prévoit 1 trillion de dollars de commandes pour Blackwell et Vera Rubin jusqu'en 2027
-
(00:45:44) Mistral lance Forge pour aider les entreprises à construire leurs propres modèles IA
-
(00:54:17) ByteDance de Chine accède aux meilleurs puces IA de Nvidia, rapporte le WSJ
-
(00:57:57) Meta retarde le déploiement de son nouveau modèle IA après des préoccupations de performance
-
(01:02:50) Microsoft réorganise sa division IA alors que Copilot accuse un retard sur Google et OpenAI
Politique & Sécurité
-
(01:07:26) Une formalisation décisionnelle de la stéganographie avec des applications au suivi des LLM
-
(01:13:09) Théâtre du raisonnement : Démêler les croyances du modèle de la chaîne de pensée
-
(01:18:29) Défenses en formation contre les désalignements émergents dans les modèles de langage
-
(01:23:07) Comment les agents IA de pointe se comportent dans des scénarios de cyberattaques à étapes multiples ?
-
(01:25:20) Conscience d'évaluation dans la performance BrowseComp de Claude Opus 4.6
-
(01:29:49) Présentation de Bloom : un outil open source pour des évaluations comportementales automatisées
-
(01:32:26) Dans quelle mesure les modèles respectent-ils leurs constitutions ?
-
(01:37:11) La licence H200 de Nvidia suscite des inquiétudes en matière de sécurité parmi les principaux démocrates
Recherche & Avancées
-
(01:40:50) [2603.15031] Résidus d'attention
-
(01:47:11) Mamba-3 : Amélioration de la modélisation des séquences en utilisant des principes d'espace d'état
Brief IA — Veille IA quotidienne
Toutes les innovations IA du monde entier, résumées et analysées automatiquement chaque jour.