Ornith-1.0 : DeepReinforce et ses LLMs ouverts performants

⚡

Key Takeaways

1Ornith-1.0, un modèle à poids ouverts sous licence MIT, est la première publication de DeepReinforce.

2Les variantes incluent 9B Dense, 31B Dense, 35B MoE et 397B MoE, basées sur Gemma 4 et Qwen 3.5.

3Le modèle a été testé avec succès sur Datasette, démontrant une exécution efficace des cadres d'agents.

💡Why it matters — Ornith-1.0 pourrait transformer le développement logiciel open-source avec ses capacités avancées et sa licence permissive.

Ornith-1.0 : Un modèle prometteur de DeepReinforce

Ornith-1.0 marque une avancée significative dans le domaine des modèles de langage à grande échelle (LLMs) avec sa licence ouverte MIT. C'est la première publication de DeepReinforce, une entreprise qui reste encore discrète sur ses activités.

Le modèle se décline en plusieurs variantes : 9B Dense, 31B Dense, 35B MoE, et 397B MoE. Ces variantes s'appuient sur les modèles préentraînés Gemma 4 et Qwen 3.5, qui sont tous deux sous licence Apache 2.0. Cette compatibilité de licence permet une utilisation flexible et sans contraintes supplémentaires, contrairement à certains modèles antérieurs de Gemma.

Ornith-1.0 atteint des performances de pointe parmi les modèles open-source de taille comparable sur des benchmarks de codage, ce qui en fait un outil puissant pour les développeurs.

Performances et tests

Ornith-1.0 a été testé avec le fichier ornith-1.0-35b-Q4_K_M.gguf (20 Go) via LM Studio, connecté à Pi. Les résultats initiaux sont prometteurs, le modèle exécutant efficacement des cadres d'agents sur divers appels d'outils.

Lors d'une session, le modèle a été capable de localiser le code pour décoder un cookie d'acteur et d'ouvrir une boîte de dialogue d'insertion sur un checkout de Datasette. Ces tâches ont été réalisées avec aisance, démontrant la capacité du modèle à gérer des opérations complexes.

En outre, Ornith-1.0 a dessiné un pélican à une vitesse de 103 tokens/seconde. Bien que le dessin soit légèrement déformé, le pélican reste reconnaissable.

DeepReinforce : Une entreprise discrète

Peu d'informations sont disponibles sur DeepReinforce. Le premier article notable de l'entreprise, intitulé CUDA-L1 : Improving CUDA Optimization via Contrastive Reinforcement Learning, date de juin 2025. Cela laisse entrevoir un potentiel d'innovation continue dans le domaine de l'apprentissage par renforcement.

Ornith-1.0 : DeepReinforce et ses LLMs ouverts performants

Le brief IA que les pros lisent chaque soir

Ornith-1.0 : Un modèle prometteur de DeepReinforce

Performances et tests

DeepReinforce : Une entreprise discrète

Brief IA — L'actualité IA en français