Les notes de réunion AI de Talat restent sur votre machine, pas dans le cloud
L'application de prise de notes alimentée par l'IA, Granola, valorisée à 250 millions de dollars, est devenue un outil populaire parmi les fondateurs de l'industrie technologique et les investisseurs en capital-risque. Cependant, un développeur pense qu'il existe une demande pour une alternative plus privée, uniquement locale, disponible pour un paiement unique et sans abonnement. Cela a conduit à la création d'une nouvelle application Mac appelée Talat.
Nick Payne, un développeur basé dans le Yorkshire, en Angleterre, se décrit comme un nerd de l'informatique. Il explique que l'idée de construire un preneur de notes AI local est née principalement d'une série d'heureux accidents.
« Je pense que Granola est génial ; c'est un exemple éclatant de ce que l'on peut faire avec une application Electron [un cadre pour construire des applications de bureau] avec suffisamment d'amour et de soin », a-t-il déclaré à TechCrunch. « Lorsque je l'ai essayé pour la première fois, j'étais fasciné par le fait qu'il parvenait à enregistrer l'audio système sur mon Mac sans enregistrer de vidéo, ce qui était la solution de contournement standard à l'époque. Cela m'a conduit à beaucoup de recherches, découvrant une API Apple relativement nouvelle et mal documentée. »
Pour faciliter le travail avec cette API (Core Audio Taps, qui permet aux développeurs d'accéder aux flux audio d'un Mac), Payne a décidé de créer une bibliothèque audio open source, AudioTee.
« Pendant ce temps, je rassemblais lentement un ensemble d'outils, mais je n'ai jamais trouvé quoi que ce soit qui semblait pouvoir se tenir seul en tant que produit plutôt qu'en tant que simple démonstration technique », a déclaré Payne. « Les modèles de transcription hébergés à la pointe de la technologie — les mêmes fournisseurs que ceux utilisés par des gens comme Granola — sont incroyables, et c'est viscéralement cool de voir votre discours se dérouler à l'écran en quasi temps réel. Mais cela me dérangeait toujours que le compromis exigeait de fournir non seulement mes données, mais aussi mes données audio ; ma voix réelle », a-t-il ajouté.
Il est ensuite tombé sur un ensemble d'outils logiciels appelé FluidAudio, un cadre Swift qui permet une IA audio locale à faible latence sur les appareils Apple. Cela lui permet d'exécuter de petits modèles de transcription rapides directement sur le Neural Engine du Mac — le matériel dédié d'Apple pour le traitement de l'IA.
C'est ce qui a fait réaliser à Payne qu'il pouvait transformer sa recherche en un produit réel — un produit où votre audio ne quitte jamais votre Mac, et vos transcriptions ne sont pas stockées sur les serveurs d'une autre entreprise.
Talat, qui a été construit aux côtés de l'ami de longue date et ancien collègue de Payne, Mike Franklin, est le résultat de l'intérêt de Payne pour l'espace audio. Le résultat est un achat unique de 20 Mo qui ne nécessite pas de créer un compte ni même de partager des données analytiques avec les développeurs. Il n'y a pas de frais récurrents non plus.
Bien que certains preneurs de notes AI puissent avoir plus de fonctionnalités, Talat propose un ensemble de fonctionnalités simplifié. Il capture l'audio du microphone de votre ordinateur lorsque vous êtes dans des applications de réunion comme Zoom, Teams, Meet, et d'autres, et le transcrit en temps réel. L'application essaie d'assigner des intervenants en temps réel, mais vous pouvez les réaffecter si nécessaire. Vous pouvez également prendre des notes, ainsi qu'éditer, supprimer ou diviser des segments de transcription. Lorsque la réunion se termine, un LLM local génère un résumé avec les points clés, les décisions et les actions à entreprendre.
Les notes, transcriptions et résumés sont également tous recherchables dans Talat.
En plus de l'angle de la confidentialité, Payne a déclaré que l'objectif est de donner aux utilisateurs plus d'options.
« Nous nous orientons vers la configurabilité et permettons aux utilisateurs de contrôler où vont leurs données : choisissez votre propre LLM, exportation automatique vers l'application de prise de notes Obsidian, webhooks qui poussent les données lorsque la réunion se termine, un serveur MCP », qui est une manière standardisée pour les outils d'IA de se connecter à des sources de données externes, « pour les récupérer à la demande », a-t-il expliqué.
Sous le capot, l'IA est un mélange — « principalement assemblée et abstraite derrière FluidAudio », a noté Payne, qu'il crédite pour avoir fait beaucoup du travail lourd. Pour la partie résumé, l'application par défaut à un modèle AI appelé Qwen3-4B-4bit, qui peut fonctionner même sur du matériel relativement modeste.
Cependant, les utilisateurs peuvent choisir de le remplacer par n'importe quel fournisseur de LLM cloud de leur choix, ou ils peuvent choisir entre deux variantes de Parakeet — modèles de reconnaissance vocale développés par Nvidia — ou le pointer vers Ollama (un outil pour exécuter des modèles d'IA localement), leur donnant plus de contrôle sur l'expérience. Avec le temps, Talat ajoutera également le support pour plus de choix intégrés, ainsi que des intégrations pour d'autres applications, comme Google Calendar et Notion.
Au lancement, les utilisateurs disposant d'ordinateurs Mac de la série M (ceux fonctionnant avec les propres processeurs d'Apple, à partir du M1) peuvent télécharger l'application et l'essayer gratuitement avec 10 heures d'enregistrements avant de décider de l'acheter.
Talat est disponible pour 49 $ pendant cette version préliminaire, qui est encore en développement actif.
Lorsque l'application atteindra une version 1.0, le prix augmentera à 99 $.
Payne et Franklin autofinancent Talat et prévoient de maintenir le produit principal comme un achat unique à l'avenir.
📧
Cet article vous a plu ?
Recevez les 7 meilleures actus IA chaque soir à 19h — résumées en 5 min.