Andrej Karpathy révolutionne la recherche personnelle avec LLM-Wiki

Le brief IA que les pros lisent chaque soir
Les 7 actus IA du jour, décryptées en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Andrej Karpathy, une figure influente dans le domaine de l'intelligence artificielle, a récemment partagé un guide sur GitHub pour aider les utilisateurs à construire leur propre base de connaissances personnelle. Ce guide s'inscrit dans le cadre du projet LLM-Wiki, qui vise à compiler des notes personnelles dans un format de wiki en markdown, en utilisant un agent LLM.
Cependant, Karpathy souligne que les implémentations existantes sont souvent trop orientées vers les développeurs. Pour remédier à cela, il a développé une approche alternative nommée DyResearch. Cette méthode se distingue par sa capacité à transformer un simple assistant de codage en une équipe d'agents spécialisés. Ces agents, intégrés à Obsidian, un outil de prise de notes populaire, combinent le concept de wiki cumulatif avec une récupération locale et légère grâce à une architecture de stockage dual.
Les agents de DyResearch remplissent divers rôles, chacun ayant une fonction spécifique :
- Coordinateur d'étude : Gère l'organisation et la planification des recherches.
- Professeur : Fournit des explications et des enseignements sur les sujets étudiés.
- Bibliothécaire : S'occupe de l'organisation et de la classification des informations.
- Chercheur : Effectue des recherches approfondies sur les sujets d'intérêt.
- Prise de notes : Capture et organise les informations pertinentes.
DyResearch est servi via un backend FastAPI et se connecte à Obsidian grâce à un plugin communautaire personnalisé. Ce système permet une gestion efficace des sessions et des événements, ainsi qu'une récupération optimisée des sources d'information.
Karpathy détaille également les choix technologiques pour l'orchestration et la persistance des données. Pour l'orchestration, il utilise Google ADK, tandis que pour la persistance des bases de données et des sessions, il opte pour une combinaison de Postgres avec pgvector, en opposition à SQLite local-first et LanceDB. Ces choix permettent aux utilisateurs de discuter, d'ingérer des documents et de générer ou mettre à jour automatiquement des notes dans leur coffre.
Brief IA — L'actualité IA en français
L'essentiel de l'actualité de l'intelligence artificielle, décrypté et expliqué chaque jour.