Brief IA : Ornith-1.0 : DeepReinforce et ses LLMs ouverts performants

Ornith-1.0 : DeepReinforce et ses LLMs ouverts performants

Brief IA
Tom Levy·2 min·1 vues

Ornith-1.0, un modèle à poids ouverts sous licence MIT, est la première publication de DeepReinforce. Les variantes incluent 9B Dense, 31B Dense, 35B MoE et 397B MoE, basées sur Gemma 4 et Qwen 3.5. Le modèle a été testé avec succès sur Datasette, démontrant une exécution efficace des cadres d'agents.

En bref
1Ornith-1.0, un modèle à poids ouverts sous licence MIT, est la première publication de DeepReinforce.
2Les variantes incluent 9B Dense, 31B Dense, 35B MoE et 397B MoE, basées sur Gemma 4 et Qwen 3.5.
3Le modèle a été testé avec succès sur Datasette, démontrant une exécution efficace des cadres d'agents.
💡Pourquoi c'est importantOrnith-1.0 pourrait transformer le développement logiciel open-source avec ses capacités avancées et sa licence permissive.
Le brief IA que lisent les pros

Tu codes avec l’IA ?

Outils, agents et nouveautés dev IA décryptés, chaque soir en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Ornith-1.0 : Un modèle prometteur de DeepReinforce

Ornith-1.0 marque une avancée significative dans le domaine des modèles de langage à grande échelle (LLMs) avec sa licence ouverte MIT. C'est la première publication de DeepReinforce, une entreprise qui reste encore discrète sur ses activités.

Le modèle se décline en plusieurs variantes : 9B Dense, 31B Dense, 35B MoE, et 397B MoE. Ces variantes s'appuient sur les modèles préentraînés Gemma 4 et Qwen 3.5, qui sont tous deux sous licence Apache 2.0. Cette compatibilité de licence permet une utilisation flexible et sans contraintes supplémentaires, contrairement à certains modèles antérieurs de Gemma.

Ornith-1.0 atteint des performances de pointe parmi les modèles open-source de taille comparable sur des benchmarks de codage, ce qui en fait un outil puissant pour les développeurs.

Performances et tests

Ornith-1.0 a été testé avec le fichier ornith-1.0-35b-Q4_K_M.gguf (20 Go) via LM Studio, connecté à Pi. Les résultats initiaux sont prometteurs, le modèle exécutant efficacement des cadres d'agents sur divers appels d'outils.

Lors d'une session, le modèle a été capable de localiser le code pour décoder un cookie d'acteur et d'ouvrir une boîte de dialogue d'insertion sur un checkout de Datasette. Ces tâches ont été réalisées avec aisance, démontrant la capacité du modèle à gérer des opérations complexes.

En outre, Ornith-1.0 a dessiné un pélican à une vitesse de 103 tokens/seconde. Bien que le dessin soit légèrement déformé, le pélican reste reconnaissable.

DeepReinforce : Une entreprise discrète

Peu d'informations sont disponibles sur DeepReinforce. Le premier article notable de l'entreprise, intitulé CUDA-L1 : Improving CUDA Optimization via Contrastive Reinforcement Learning, date de juin 2025. Cela laisse entrevoir un potentiel d'innovation continue dans le domaine de l'apprentissage par renforcement.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires