Tu veux les meilleurs outils IA avant les autres ?
On teste et on décrypte les nouveaux outils IA chaque soir, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Mira Murati, une visionnaire de l'IA conversationnelle
Quatorze mois après son départ de OpenAI, Mira Murati fait un retour remarqué avec le lancement de TML-Interaction-Small, le premier projet majeur de sa nouvelle entreprise, Thinking Machines. Contrairement à ce que l'on pourrait attendre, ce n'est pas un simple émule de GPT. Murati a conçu une intelligence artificielle capable de converser de manière fluide, en écoutant et réagissant en temps réel, imitant ainsi de près une conversation humaine authentique.
Aujourd'hui, les interactions avec les assistants vocaux sont souvent comparables à un échange de courriels, où l'on doit attendre la fin de chaque réponse avant de pouvoir reprendre la parole. TML-Interaction-Small vise à transformer cette dynamique. Grâce à sa capacité à écouter et à analyser en continu tout en parlant, l'IA peut ajuster ses réponses en direct, évoquant ainsi l'ambiance d'un dîner familial animé où les conversations s'entrecroisent naturellement.
La technologie derrière TML-Interaction-Small
Le terme clé utilisé par Thinking Machines pour décrire cette innovation est "full-duplex". Ce concept permet à deux interlocuteurs de parler simultanément, comme lors d'un appel téléphonique classique. Pour réaliser cela, l'entreprise a développé deux modèles distincts qui fonctionnent en tandem.
Le premier modèle est dédié à la gestion des interactions en temps réel, s'occupant de la voix, des interruptions et du rythme de la discussion. Le second modèle, plus complexe, opère en arrière-plan pour traiter les tâches nécessitant un raisonnement avancé, telles que les recherches sur le web ou l'utilisation d'outils externes, avant de transmettre les résultats à la conversation principale.
Le système est conçu pour découper les échanges en micro-tours de 200 millisecondes, permettant à l'IA de continuer à écouter même lorsqu'elle répond. Cela évite les interruptions typiques des assistants vocaux traditionnels qui peuvent perdre le fil de la conversation, offrant une expérience plus naturelle et continue.
Performances et comparaison avec la concurrence
TML-Interaction-Small se distingue dans les tests de performance, notamment sur le FD-bench v1.5, un benchmark spécialisé dans l'évaluation de la fluidité des interactions vocales. Le modèle atteint un score impressionnant de 77,8 points, surpassant largement GPT-realtime-2.0 qui n'atteint que 46,8 points.
En termes de latence, TML-Interaction-Small affiche un temps de réponse de 0,40 seconde, comparé à 0,57 seconde pour Google Gemini 3.1 Flash Live et 1,18 seconde pour GPT-realtime-2.0 minimal. Ces chiffres rapprochent l'IA de la fluidité des conversations humaines, qui se situent généralement entre 200 et 250 millisecondes entre deux interventions.
Au-delà des benchmarks, l'architecture de TML-Interaction-Small surmonte une limitation bien connue des modèles de langage actuels : la gestion du temps. Contrairement à d'autres IA, ce modèle est capable de comprendre et de traiter des instructions temporelles complexes, comme "Rappelle-moi de vérifier la température toutes les quatre minutes", ce qui est crucial pour des applications industrielles, médicales ou scientifiques. Selon VentureBeat, cette capacité à gérer le temps avec précision est un atout majeur qui distingue TML-Interaction-Small de ses concurrents.
