Tu veux les meilleurs outils IA avant les autres ?
On teste et on décrypte les nouveaux outils IA chaque soir, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Anthropic, une entreprise spécialisée dans l'intelligence artificielle, a récemment mis en place un projet expérimental nommé Project Deal. Ce projet a permis de tester un marché où des agents d'IA représentaient des acheteurs et des vendeurs, réalisant des transactions pour de véritables biens et avec de l'argent réel.
Le test a impliqué un groupe de participants auto-sélectionnés composé de 69 employés d'Anthropic, chacun disposant d'un budget de 100 $ sous forme de cartes-cadeaux. Ces participants ont pu acheter des articles auprès de leurs collègues, simulant ainsi un véritable marché.
Au total, 186 transactions ont été effectuées, atteignant une valeur cumulée de plus de 4 000 $. Anthropic a exprimé sa satisfaction quant au bon déroulement de ce projet pilote.
Quatre modèles de marché distincts
Anthropic a structuré le test en quatre marchés distincts, chacun utilisant différents modèles d'IA. Parmi ceux-ci, un marché était qualifié de "réel", où les participants étaient représentés par le modèle le plus avancé de l'entreprise, et où les transactions étaient effectivement honorées après l'expérience. Les trois autres marchés ont été mis en place à des fins d'étude.
Les résultats ont montré que les modèles plus avancés permettaient d'obtenir des "résultats objectivement meilleurs". Cependant, cette différence n'était pas perçue par les utilisateurs, ce qui soulève des questions sur les "lacunes de qualité d'agent". Cela signifie que certaines personnes pourraient ne pas se rendre compte qu'elles sont désavantagées par rapport à d'autres.
Impact des instructions initiales
Un autre aspect intéressant du test est que les instructions initiales données aux agents n'ont pas semblé influencer la probabilité de vente ni les prix négociés. Cela suggère que d'autres facteurs, peut-être liés à la sophistication des modèles d'IA, jouent un rôle plus déterminant dans le succès des transactions.
