Tu veux les meilleurs outils IA avant les autres ?
On teste et on décrypte les nouveaux outils IA chaque soir, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Des chercheurs de l'Université de Princeton ont mis au point un test innovant nommé CEO-Bench, conçu pour évaluer la capacité des agents d'intelligence artificielle à gérer une entreprise de logiciels fictive sur une période de 500 jours simulés.
L'objectif de ce test est de mesurer l'efficacité des modèles d'IA dans un contexte de gestion d'entreprise, en observant leur capacité à maintenir et à faire fructifier un capital de départ. Cependant, les résultats ont révélé que la plupart des modèles actuels échouent à cette tâche, se retrouvant à court de fonds avant la fin de la période simulée.
Fait surprenant, une simple heuristique basée sur des règles, qui ne repose sur aucune forme d'intelligence artificielle sophistiquée, a réussi à surpasser presque tous les modèles testés. Seuls trois modèles d'IA ont réussi à terminer le test avec un capital supérieur à celui de départ, soulignant les défis auxquels sont confrontés les développeurs d'IA dans le domaine de la gestion d'entreprise.

