🤖 Modeles & LLM

Le PDG de Nvidia, Jensen Huang, ne cesse de parler des tokens. Voici ce qu'ils sont et comment ils redéfinissent les budgets IA.

Business Insider Tech
Geoff Weiss·3 min·0 vues
En bref
1Jensen Huang a souligné l'importance des tokens lors de la conférence GTC de Nvidia.
2Les tokens sont essentiels pour mesurer et tarifer le travail en IA.
3Les agents IA devraient entraîner une utilisation massive des tokens, ce qui incitera les entreprises à investir davantage.
💡Pourquoi c'est importantL'essor des tokens pourrait transformer la manière dont les entreprises allouent leurs budgets pour l'IA, rendant les investissements plus stratégiques.
📄
Article traduit en français

Le PDG de Nvidia, Jensen Huang, ne cesse de parler des tokens

Les commentaires du PDG de Nvidia, Jensen Huang, lors de la conférence GTC de l'entreprise, avaient un thème récurrent : les tokens. Lors d'une conversation avec des analystes, Huang a présenté les futurs ordinateurs comme des "équipements de fabrication" qui produiront des tokens. Il a déclaré que les tokens deviendront un élément central des budgets d'entreprise, tout comme les ordinateurs portables ou les abonnements logiciels.

Avec toutes ces discussions sur les tokens, que sont-ils exactement ?

Les tokens sont des unités de texte — un mot ou une partie d'un mot — qui déterminent comment le travail d'IA est mesuré et tarifé. Un mot court peut correspondre à un seul token, tandis que les mots plus longs peuvent être divisés en plusieurs tokens. Une règle générale est qu'un token représente environ quatre caractères.

Les grands modèles de langage comme ChatGPT d'OpenAI ou Claude d'Anthropic suivent le nombre de tokens traités lorsqu'un utilisateur saisit du texte, ainsi que le nombre de tokens générés en réponse — et les géants de l'IA facturent les entreprises en conséquence. Plus le texte traité est important, plus il faut de tokens pour que les modèles d'IA puissent le traiter. Contrairement aux coûts logiciels existants, qui sont facturés sous forme d'abonnements ou de frais fixes, l'IA est tarifée par utilisation. À l'avenir, alors que la technologie deviendra encore plus centrale au travail, Huang a déclaré que les ingénieurs pourraient recevoir des "budgets de tokens" pour les aider à devenir plus productifs. Lors de son discours d'ouverture lundi, il a même évoqué l'idée d'offrir aux ingénieurs de Nvidia des tokens d'une valeur équivalente à la moitié de leur salaire annuel pour attirer les talents.

Huang a de nouveau abordé cette idée mardi. Il a affirmé que les coûts en valent la peine — surtout pour les ingénieurs très bien payés, qui peuvent réaliser d'importants gains de productivité grâce à des agents, ou des applications autonomes capables d'effectuer diverses tâches.

Dans une argumentation en faveur de Nvidia, Huang a ajouté que du matériel plus puissant et économe en énergie peut générer des tokens à un coût moindre au fil du temps.

"Si j'ajoutais 100 $ par jour de coût d'inférence — coût des tokens — je serais plus qu'heureux de le faire", a déclaré Huang à propos du paiement des tokens en plus des salaires des ingénieurs — surtout pendant les périodes intenses. "Si j'ajoutais même 1 000 $ en période de forte pression, je serais plus qu'heureux de le faire."

Huang n'est pas seul. Le concept commence à se répandre dans l'industrie technologique, les ingénieurs posant des questions sur le calcul lors des entretiens et les dirigeants l'envisageant comme partie intégrante des packages de rémunération.

L'essor de l'IA agentique pourrait augmenter considérablement l'utilisation des tokens, a déclaré Huang, car ces agents fonctionneront sans supervision humaine.

"En ce moment, pendant que nous parlons, tous nos ordinateurs portables sont un peu inactifs", a-t-il déclaré mardi. "Mais à l'avenir, l'ordinateur fonctionnera 24/7 et créera des tokens parce que vos agents sont en train de travailler."

Lire l'article original sur Business Insider Tech
Commentaires