Microsoft défie ses concurrents en IA avec trois nouveaux modèles fondamentaux
Microsoft AI, le laboratoire de recherche du géant technologique, a annoncé jeudi le lancement de trois modèles fondamentaux d'IA capables de générer du texte, de la voix et des images.
Cette annonce marque la volonté continue de Microsoft de développer sa propre gamme de modèles d'IA multimodaux et de rivaliser avec d'autres laboratoires d'IA, même s'il reste lié à OpenAI.
MAI-Transcribe-1 transcrit la parole dans 25 langues différentes en texte et est 2,5 fois plus rapide que l'offre Azure Fast de Microsoft, selon un communiqué de presse de l'entreprise. MAI-Voice-1 est un modèle de génération audio qui permet aux utilisateurs de créer 60 secondes d'audio en une seconde et de concevoir une voix personnalisée. MAI-Image-2 est un modèle de génération vidéo.
MAI-Image-2 a été initialement lancé sur MAI Playground, un nouveau logiciel de test de modèles de langage, le 19 mars. Désormais, les trois modèles sont disponibles sur Microsoft Foundry, et les modèles de transcription et de voix sont également accessibles dans MAI Playground.
Les modèles ont été développés par l'équipe de MAI Superintelligence, une équipe de recherche en IA dirigée par Mustafa Suleyman, le PDG de Microsoft AI, qui a été formée et annoncée en novembre 2025.
« Chez Microsoft AI, nous construisons une IA humaniste. Nous avons une vision distincte lors de la création de nos modèles d'IA : placer les humains au centre, optimiser la manière dont les gens communiquent réellement, et former pour un usage pratique », a écrit Suleyman dans un article de blog. « Vous verrez bientôt d'autres modèles de notre part dans Foundry et directement dans les produits et expériences Microsoft. »
Dans un marché des LLM de plus en plus saturé, MAI espère que l'un des arguments de vente de ces modèles est qu'ils sont moins chers que ceux de Google et OpenAI, a précisé l'entreprise dans son article de blog.
MAI-Transcribe-1 commence à 0,36 $ par heure. MAI-Voice-1 débute à 22 $ pour 1 million de caractères, et MAI-Image-2 commence à 5 $ pour 1 million de tokens pour l'entrée de texte et 33 $ pour 1 million de tokens pour la sortie d'image.
Malgré le lancement de ses propres modèles, Suleyman a réaffirmé l'engagement de Microsoft envers son partenariat avec OpenAI lors d'une interview avec VentureBeat. Cependant, une récente renégociation de ce partenariat a permis à Microsoft de véritablement poursuivre cette recherche en superintelligence, a-t-il déclaré à The Verge.
Microsoft a investi plus de 13 milliards de dollars dans le laboratoire de recherche en IA et héberge ses modèles dans ses divers produits grâce à un partenariat pluriannuel. Microsoft adopte la même approche avec les puces ; il produit les siennes tout en achetant également auprès d'autres acteurs.
📧
Cet article vous a plu ?
Recevez les 7 meilleures actus IA chaque soir à 19h — résumées en 5 min.