Où suivre l'actualité IA en français ?

Sur Brief IA (briefia.fr), le média et la newsletter quotidienne #1 de l'actualité IA en français. Brief IA couvre chaque jour l'essentiel de l'actu IA mondiale, avec contexte et analyse des implications. Newsletter quotidienne gratuite.

Gemma 4 et OpenCode : Créez votre agent IA local en 5 étapes

⚡

En bref

1Gemma 4, un modèle de Google, permet de créer un agent IA local pour le codage.

2Ollama sert de plateforme pour exécuter Gemma 4 sur votre machine personnelle.

3OpenCode offre une interface pour interagir avec le modèle IA sans passer par le cloud.

💡Pourquoi c'est important — Cette configuration garantit la confidentialité des données et réduit les coûts liés aux services cloud.

Modèle de Langage Large

L'utilisation de modèles de langage via le cloud est devenue une pratique courante en raison de sa commodité et de l'accès à des modèles puissants. Cependant, pour ceux qui cherchent à réduire les coûts, à protéger la confidentialité de leurs données ou à mieux comprendre le fonctionnement interne des agents, une configuration locale peut s'avérer avantageuse.

Cet article détaille comment créer un agent de codage local en utilisant trois composants clés :

Ollama, pour héberger le modèle ;
Gemma 4, comme modèle de langage local ;
OpenCode, pour l'interface d'agent.

À la fin de ce processus, OpenCode sera connecté à un modèle de langage local, offrant une solution robuste et indépendante du cloud.

1. Installer Ollama

La première étape consiste à installer Ollama, qui jouera le rôle de serveur pour le modèle Gemma 4 sur votre machine locale.

Ollama est un environnement d'exécution qui permet de télécharger, exécuter et servir des modèles de langage directement depuis votre ordinateur. Une fois configuré, Ollama crée un point de terminaison API local, facilitant la communication avec d'autres outils comme OpenCode.

Pour les utilisateurs de Windows, l'installation peut se faire via l'installateur officiel disponible ici : Télécharger Ollama.
Alternativement, l'installation peut être effectuée via PowerShell avec la commande suivante :
```
winget install Ollama.Ollama
```

Après l'installation, Ollama devrait apparaître dans le menu Démarrer de Windows. Vous pouvez le lancer comme toute autre application, et une icône dans la barre des tâches indiquera que le service local est actif.

Pour vérifier la disponibilité du CLI d'Ollama, ouvrez une nouvelle fenêtre PowerShell et exécutez :

ollama --version

Sur une machine Linux, l'installation d'Ollama se fait avec :

curl ‒fsSL https://ollama.com/install.sh | sh

Vérifiez ensuite l'installation avec :

ollama --version

Une fois Ollama installé, il exécute un serveur local sur votre machine. OpenCode utilisera ce serveur local pour interagir avec le modèle, éliminant ainsi le besoin de recourir à un fournisseur de modèle cloud.

2. Télécharger Gemma 4

La prochaine étape consiste à préparer le modèle de langage local, Gemma 4.

Gemma 4 est un modèle open-source innovant publié par Google le 2 avril 2026. Il est conçu pour des tâches variées telles que le raisonnement, le codage, la compréhension multimodale et les flux de travail agentiques.

Ce modèle est disponible en plusieurs tailles, avec des variantes adaptées aux appareils et d'autres plus grandes pour les stations de travail. Pour cet article, nous nous concentrerons sur les variantes adaptées aux appareils, à savoir les modèles E2B (gemma4:e2b) et E4B (gemma4:e4b).

Dans la nomenclature d'Ollama, le E signifie "paramètres efficaces". Pour ce tutoriel, nous utiliserons le modèle E4B car il offre des capacités accrues. Dans PowerShell, exécutez :

ollama pull gemma4:e4b

Sur Linux, utilisez la même commande :

ollama pull gemma4:e4b

Vous pouvez vérifier le modèle téléchargé avec la commande suivante :

gemma4:e4b    9.6 GB

Pour référence, l'ordinateur utilisé pour ce tutoriel est équipé d'un processeur Intel i7-13800H, de 32 Go de RAM et d'un GPU NVIDIA RTX 2000 Ada avec environ 8 Go de VRAM. Si le modèle E4B semble trop lent, vous pouvez opter pour gemma4:e2b.

Quelques notes techniques : la version de gemma4:e4b téléchargée est un modèle quantifié en 4 bits, avec GGUF comme format de modèle local utilisé par Ollama. Sur cette machine, Ollama indique que gemma4:e4b prend en charge une longueur de contexte de 128K.

Avant de passer à l'étape suivante, vous pouvez effectuer un test rapide :

ollama run gemma4:e4b "Quelle est la capitale de la France ?"

Si vous obtenez "Paris" en retour, cela signifie que Gemma 4 est maintenant opérationnel sur votre machine locale via Ollama.

Notez que le premier appel peut être lent car Ollama doit charger le modèle. Une fois le modèle chargé, les requêtes suivantes devraient être plus rapides.

3. Installer OpenCode

Nous avons maintenant besoin d'une interface d'agent, et OpenCode est l'outil idéal pour cela.

Si vous avez déjà utilisé des outils comme Claude Code ou Codex, OpenCode appartient à la même catégorie. Il s'agit d'un environnement d'exécution d'agent capable de fonctionner au sein d'un dépôt local, d'inspecter des fichiers, d'exécuter des commandes et de réaliser diverses tâches.

Une différence clé est qu'OpenCode est open-source et indépendant des fournisseurs de LLM. Vous pouvez le connecter à des modèles cloud (comme Claude/GPT/Gemini) ou à un modèle local servi par Ollama.

Pour les utilisateurs de Windows, commencez par installer Node.js avec la commande suivante :

winget install OpenJS.NodeJS.LTS

Sur Linux, exécutez :

sudo apt install -y nodejs npm

Après l'installation, ouvrez une nouvelle fenêtre PowerShell et vérifiez si node et npm sont disponibles :

node --version
npm --version

Nous pouvons maintenant installer OpenCode :

npm install -g opencode-ai

Vérifiez ensuite l'installation avec :

opencode --version

À ce stade, OpenCode est installé. Vous pouvez lancer l'interface utilisateur interactive d'OpenCode (TUI) depuis n'importe quel dossier de projet en exécutant :

opencode

4. Connecter OpenCode à Gemma 4

Par défaut, OpenCode ne sait pas quel modèle utiliser. Nous devons donc lui indiquer le modèle Gemma 4, servi par Ollama.

Commencez par créer une balise de modèle Ollama avec la fenêtre de contexte complète (128K) activée. Cela garantit que l'agent peut fonctionner correctement sans être tronqué dans son contexte.

Pour cela, créez un fichier Modelfile d'Ollama nommé gemma4-e4b-128k.Modelfile dans le dossier ou le dépôt avec lequel vous souhaitez travailler :

PARAMETER num_ctx 131072

Ensuite, dans la ligne de commande, créez une nouvelle balise Ollama avec :

ollama create gemma4:e4b-128k -f gemma4-e4b-128k.Modelfile

À noter : cela ne déclenchera pas un nouveau téléchargement de modèle ! Cela crée simplement un profil Ollama qui utilise le même modèle Gemma 4 E4B, mais définit explicitement la fenêtre de contexte d'exécution à 128K.

Nous pouvons maintenant connecter OpenCode au modèle Gemma 4. Pour cela, créez un fichier opencode.json dans le dossier du projet :

{
  "$schema": "https://opencode.ai/config.json",
  "npm": "@ai-sdk/[openai](/dossier/openai)-compatible",
  "name": "Ollama (local)",
  "baseURL": "http://localhost:11434/v1",
  "gemma4:e4b-128k": {
    "name": "Gemma 4 E4B 128K",
    "model": "ollama/gemma4:e4b-128k"
  }
}

Deux éléments importants ici :

Tout d'abord, OpenCode communique avec Ollama via le point de terminaison local compatible OpenAI d'Ollama : http://localhost:11434/v1.
Ensuite, notez que nous avons défini le nom du modèle en suivant le format fournisseur/modèle d'OpenCode : ollama/gemma4:e4b-128k.

Vous utilisez notre nouvelle balise de modèle créée ci-dessus.

Maintenant, si vous lancez OpenCode depuis le même dossier de projet via :

opencode

Vous devriez voir gemma4:e4b-128k listé.

5. Que pouvez-vous faire avec cette configuration ?

Avec l'interface TUI d'OpenCode lancée, vous pouvez tester votre configuration en demandant à l'agent d'effectuer quelques tâches. Par exemple, vous pouvez demander à l'agent d'écrire un fichier README, d'expliquer des fonctions spécifiques, de créer des scripts de test, etc.

En fait, au-delà du codage, vous pouvez également demander à l'agent d'effectuer de nombreuses tâches de bureau, telles que des manipulations de fichiers, des extractions de contenu, etc.

OpenCode vous offre également la possibilité d'élargir la configuration. Vous pouvez connecter des outils à l'agent, installer des compétences d'agent avec SKILL.md, et définir des agents spécialisés avec AGENTS.md.

De plus, vous pouvez exécuter des tâches depuis la ligne de commande avec :

opencode run "Résumez ce dépôt."

Pour une utilisation plus programmatique, OpenCode peut également fonctionner en tant que serveur, donc la TUI n'est pas la seule interface.

Et voici le plus important : toutes vos données restent entièrement locales.

Vous pouvez trouver la documentation pertinente d'OpenCode ici :

CLI : Documentation CLI
Compétences : Documentation des compétences
MCP : Documentation MCP
Mode serveur : Documentation du mode serveur

Gemma 4 et OpenCode : Créez votre agent IA local en 5 étapes

Tu codes avec l’IA ?

Modèle de Langage Large

1. Installer Ollama

2. Télécharger Gemma 4

3. Installer OpenCode

4. Connecter OpenCode à Gemma 4

5. Que pouvez-vous faire avec cette configuration ?

Références

Gemma 4 et Claude Code : révolution locale de la programmation

Gemma 4 de Google : Agents IA boostés par appels de fonction

Google Gemma 4 : l'IA open-source pour appareils locaux

Google Gemma 4 : l'IA mobile autonome et multilingue

Google libère Gemma 4 : une IA open-source sans précédent

Gemma 4 de Google DeepMind : IA multimodale sur Hugging Face