Google ouvre enfin son IA la plus puissante : Gemma 4, open-source et prête à l’emploi
Google vient de lancer Gemma 4, sa quatrième génération de modèles d'IA ouverts, sous licence Apache 2.0. Quatre tailles sont disponibles, allant du smartphone au serveur, et pour la première fois dans l'histoire de la gamme, un accès vraiment libre, sans condition d'utilisation maison.
La licence Apache 2.0, standard dans l'industrie du logiciel libre, permet désormais à quiconque de télécharger, modifier, redistribuer et commercialiser Gemma 4. Depuis le lancement de la première génération Gemma en 2024, les développeurs ont téléchargé ces modèles plus de 400 millions de fois et généré plus de 100 000 variantes communautaires. Auparavant, Google n'avait pas proposé de véritable licence open source, les versions précédentes étant soumises à des conditions d'utilisation propriétaires, permettant à Google de révoquer l'accès d'un utilisateur à tout moment.
Avec Gemma 4, la situation change radicalement. La licence Apache 2.0 autorise le téléchargement, la modification, la redistribution et la commercialisation du modèle sans redevance ni clause cachée. La seule obligation est de mentionner l'attribution.
Gemma 4, un modèle pensé pour tourner sans Internet
Gemma 4 fonctionne entièrement hors ligne, sur le matériel de l'utilisateur, sans envoyer de données vers les serveurs de Google. Ce modèle se décline en quatre tailles :
- E2B
- E4B
- 26B MoE (Mixture of Experts)
- 31B Dense
Les deux premières tailles sont conçues pour les appareils mobiles et embarqués, tels que les smartphones Android, Raspberry Pi et NVIDIA Jetson, avec une consommation mémoire réduite et, selon Google, une latence quasi nulle. Les deux plus grands modèles visent les stations de travail et les serveurs locaux. Le 31B Dense fonctionne sur un seul GPU NVIDIA H100 de 80 Go, et en version quantifiée sur des cartes grand public. Le 26B MoE n'active que 3,8 milliards de ses paramètres lors de l'inférence, ce qui lui confère une vitesse de génération supérieure à celle d'un modèle dense équivalent.
Sur le classement Arena AI, le 31B Dense se classe troisième mondialement pour le traitement de texte, tandis que le 26B MoE occupe la sixième place. Ces positions sont inattendues pour des modèles de cette taille, face à des systèmes vingt fois plus lourds.
Fonctionnalités avancées
Côté fonctionnalités, Gemma 4 traite nativement vidéo, images, et pour les variantes E2B et E4B, l'audio en entrée. La fenêtre de contexte atteint 256 000 tokens pour les grands modèles, permettant d'ingérer un référentiel de code entier en une seule requête. Le modèle gère plus de 140 langues et supporte nativement les appels de fonctions ainsi que la sortie JSON structurée, deux éléments indispensables aux pipelines d'agents autonomes.
La fin d'une licence qui bridait les entreprises
Ce changement débloque véritablement le potentiel commercial de Gemma. Auparavant, les conditions d'utilisation de Google interdisaient certains usages et permettaient une résiliation unilatérale, ce qui suffisait à dissuader toute entreprise souhaitant intégrer un modèle d'IA pour ses produits critiques ou ses infrastructures sensibles.
Avec la transition vers Apache 2.0, il n'y a plus de risque que Google coupe l'accès rétroactivement. Clément Delangue, cofondateur et directeur général de Hugging Face, a salué ce geste de Google : « La sortie de Gemma 4 sous licence Apache 2.0 est une étape majeure. Nous sommes ravis de soutenir la famille Gemma 4 sur Hugging Face dès le premier jour ».
Google souhaite également répondre directement aux modèles chinois open weights. Moonshot AI, Alibaba et Z.AI ont récemment lancé des modèles ouverts qui rivalisent avec GPT-5 ou Claude.
Si vous souhaitez tester Gemma 4, elle est accessible dès maintenant via Google AI Studio, Hugging Face, Kaggle ou Ollama.
📧
Cet article vous a plu ?
Recevez les 7 meilleures actus IA chaque soir à 19h — résumées en 5 min.