Cohere launches an open-source voice model specifically for transcription
Cohere lance un modèle vocal open-source spécifiquement pour la transcription
L'entreprise d'IA Cohere a lancé son premier modèle vocal : Transcribe, un modèle de reconnaissance automatique de la parole open-source qui peut être utilisé pour des tâches telles que la prise de notes et l'analyse de discours.
Relativement léger avec seulement 2 milliards de paramètres, ce modèle est conçu pour être utilisé avec des GPU de niveau consommateur pour ceux qui souhaitent l'héberger eux-mêmes. Il prend actuellement en charge 14 langues : anglais, français, allemand, italien, espagnol, portugais, grec, néerlandais, polonais, chinois, japonais, coréen, vietnamien et arabe.
Cohere affirme que Transcribe surpasse des modèles tels que Zoom Scribe v1, IBM Granite 4.0 1B, ElevenLabs Scribe v2, et Qwen3-ASR-1.7B Speech sur le classement Open ASR de Hugging Face, atteignant un taux d'erreur moyen de mots (WER) de 5,42, inférieur à tout autre modèle sur cette référence.
L'entreprise prétend que Transcribe a eu un taux de victoire moyen de 61% par rapport à d'autres modèles lorsque des évaluateurs humains ont évalué ses transcriptions pour leur précision, leur cohérence et leur utilité. Cependant, le modèle a été moins performant face à ses concurrents lorsqu'il s'agissait de transcrire le portugais, l'allemand et l'espagnol.
Cohere indique que Transcribe peut traiter 525 minutes d'audio en une minute, ce qui est élevé pour sa catégorie de modèle.
L'entreprise prévoit d'intégrer Transcribe dans sa plateforme d'orchestration d'agents d'entreprise, North, et met le modèle à disposition via son API gratuitement. Le modèle sera également disponible sur Model Vault, la plateforme d'inférence gérée par Cohere.
Les modèles de reconnaissance vocale gagnent en popularité à mesure que la demande pour des applications de prise de notes et de dictée comme Granola et Wispr Flow augmente.
Plus tôt cette année, Cohere aurait informé les investisseurs qu'elle générait un chiffre d'affaires récurrent annuel de 240 millions de dollars en 2025, et son PDG, Aidan Gomez, a été cité en disant que la startup pourrait devenir publique "bientôt".
Brief IA — Veille IA quotidienne
Toutes les innovations IA du monde entier, résumées et analysées automatiquement chaque jour.