Brief IA

Microsoft's New AI Models Go Beyond Just Text

🤖 Models & LLMvia CNET AI·Katelyn Chedraoui·

Microsoft's New AI Models Go Beyond Just Text

Microsoft's New AI Models Go Beyond Just Text
En bref
1Microsoft a lancé de nouveaux modèles d'IA pour la voix, la transcription et l'image.
2Ces modèles visent à améliorer l'interaction utilisateur avec des capacités multimodales avancées.
3Cette initiative s'inscrit dans un contexte de compétition accrue avec d'autres géants technologiques dans le domaine de l'IA.
💡Pourquoi c'est importantMicrosoft renforce sa position sur le marché de l'IA en diversifiant ses offres au-delà du texte.
📄
Article traduit en français

Les nouveaux modèles d'IA de Microsoft vont au-delà du texte

Microsoft intensifie ses efforts sur des modèles d'IA qui ne se limitent pas aux grands modèles de langage. La société a annoncé jeudi le lancement de trois nouveaux modèles : des modèles inédits pour la transcription vocale et textuelle, ainsi que la deuxième génération de son modèle d'image interne.

Le modèle de transcription est le premier du genre chez Microsoft. Il peut traduire des enregistrements en texte dans 25 langues différentes. Ce modèle est conçu pour le sous-titrage vidéo, la transcription de réunions et les agents vocaux. Le modèle vocal peut créer des enregistrements audio d'une durée maximale de 60 secondes. La société affirme que son modèle d'image de deuxième génération offre une vitesse de génération plus rapide et des représentations plus réalistes, améliorant ainsi son modèle précédent. Ces modèles sont dès à présent disponibles dans le Foundry et le MAI playground de Microsoft, avec des projets futurs pour intégrer MAI-Image-2 dans Bing et PowerPoint. Les développeurs peuvent consulter les informations tarifaires ici.

Ces nouveaux modèles sont un signe clair que Microsoft cherche à élargir son offre sur le marché de l'IA. Le Copilot de Microsoft est l'un des chatbots les plus populaires pour les entreprises, notamment celles qui utilisent déjà la suite Office 360 et le service cloud Azure. En dehors de l'ancien modèle d'image désormais obsolète, Microsoft s'est principalement concentré sur les modèles basés sur le texte, essayant de se distinguer parmi ses nombreux concurrents en tant qu'option sécurisée et adaptée aux entreprises. Ses derniers outils d'IA, Copilot Cowork et Copilot Health, en sont la preuve.

Les modèles rappellent également que Microsoft, en tant qu'entreprise technologique historique, dispose des ressources financières et de calcul nécessaires pour investir dans ces types de "quêtes secondaires" que même des start-ups milliardaires comme OpenAI ne peuvent pas toujours se permettre. La semaine dernière, OpenAI a confirmé qu'elle allait arrêter son application vidéo Sora AI, affirmant qu'elle se recentrera sur ses activités principales. L'industrie de l'IA en 2026 vise à prouver que ses outils sont utiles dans le milieu professionnel, surtout avec le modèle Claude Code d'Anthropic qui surpasse la concurrence.

Les médias génératifs, comme les modèles qui alimentent la génération d'images et de vidéos par IA, nécessitent beaucoup de calcul et d'énergie pour fonctionner, ce qui pourrait être utilisé ailleurs. Google, en tant qu'autre entreprise technologique historique avec des milliards de son budget alloués à la recherche en IA, a indiqué cette semaine qu'elle ne renoncera pas aux médias génératifs, mais qu'elle tentera de rendre ses modèles plus rentables et économes en énergie, comme avec son nouveau modèle vidéo Veo 3.1 Lite.

TwitterLinkedIn

Brief IA — Veille IA quotidienne

Toutes les innovations IA du monde entier, résumées et analysées automatiquement chaque jour.