Tu codes avec l’IA ?
Outils, agents et nouveautés dev IA décryptés, chaque soir en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Ornith-1.0 : Un modèle prometteur de DeepReinforce
Ornith-1.0 marque une avancée significative dans le domaine des modèles de langage à grande échelle (LLMs) avec sa licence ouverte MIT. C'est la première publication de DeepReinforce, une entreprise qui reste encore discrète sur ses activités.
Le modèle se décline en plusieurs variantes : 9B Dense, 31B Dense, 35B MoE, et 397B MoE. Ces variantes s'appuient sur les modèles préentraînés Gemma 4 et Qwen 3.5, qui sont tous deux sous licence Apache 2.0. Cette compatibilité de licence permet une utilisation flexible et sans contraintes supplémentaires, contrairement à certains modèles antérieurs de Gemma.
Ornith-1.0 atteint des performances de pointe parmi les modèles open-source de taille comparable sur des benchmarks de codage, ce qui en fait un outil puissant pour les développeurs.
Performances et tests
Ornith-1.0 a été testé avec le fichier ornith-1.0-35b-Q4_K_M.gguf (20 Go) via LM Studio, connecté à Pi. Les résultats initiaux sont prometteurs, le modèle exécutant efficacement des cadres d'agents sur divers appels d'outils.
Lors d'une session, le modèle a été capable de localiser le code pour décoder un cookie d'acteur et d'ouvrir une boîte de dialogue d'insertion sur un checkout de Datasette. Ces tâches ont été réalisées avec aisance, démontrant la capacité du modèle à gérer des opérations complexes.
En outre, Ornith-1.0 a dessiné un pélican à une vitesse de 103 tokens/seconde. Bien que le dessin soit légèrement déformé, le pélican reste reconnaissable.
DeepReinforce : Une entreprise discrète
Peu d'informations sont disponibles sur DeepReinforce. Le premier article notable de l'entreprise, intitulé CUDA-L1 : Improving CUDA Optimization via Contrastive Reinforcement Learning, date de juin 2025. Cela laisse entrevoir un potentiel d'innovation continue dans le domaine de l'apprentissage par renforcement.






