Nvidia CEO Jensen Huang can't stop talking about tokens. Here's what they are and how they're reshaping AI budgets.
Le PDG de Nvidia, Jensen Huang, ne cesse de parler des tokens
Les commentaires du PDG de Nvidia, Jensen Huang, lors de la conférence GTC de l'entreprise, avaient un thème récurrent : les tokens. Lors d'une conversation avec des analystes, Huang a présenté les futurs ordinateurs comme des "équipements de fabrication" qui produiront des tokens. Il a déclaré que les tokens deviendront un élément central des budgets d'entreprise, tout comme les ordinateurs portables ou les abonnements logiciels.
Avec toutes ces discussions sur les tokens, que sont-ils exactement ?
Les tokens sont des unités de texte — un mot ou une partie d'un mot — qui déterminent comment le travail d'IA est mesuré et tarifé. Un mot court peut correspondre à un seul token, tandis que les mots plus longs peuvent être divisés en plusieurs tokens. Une règle générale est qu'un token représente environ quatre caractères.
Les grands modèles de langage comme ChatGPT d'OpenAI ou Claude d'Anthropic suivent le nombre de tokens traités lorsqu'un utilisateur saisit du texte, ainsi que le nombre de tokens générés en réponse — et les géants de l'IA facturent les entreprises en conséquence. Plus le texte traité est important, plus il faut de tokens pour que les modèles d'IA puissent le traiter. Contrairement aux coûts logiciels existants, qui sont facturés sous forme d'abonnements ou de frais fixes, l'IA est tarifée par utilisation. À l'avenir, alors que la technologie deviendra encore plus centrale au travail, Huang a déclaré que les ingénieurs pourraient recevoir des "budgets de tokens" pour les aider à devenir plus productifs. Lors de son discours d'ouverture lundi, il a même évoqué l'idée d'offrir aux ingénieurs de Nvidia des tokens d'une valeur équivalente à la moitié de leur salaire annuel pour attirer les talents.
Huang a de nouveau abordé cette idée mardi. Il a affirmé que les coûts en valent la peine — surtout pour les ingénieurs très bien payés, qui peuvent réaliser d'importants gains de productivité grâce à des agents, ou des applications autonomes capables d'effectuer diverses tâches.
Dans une argumentation en faveur de Nvidia, Huang a ajouté que du matériel plus puissant et économe en énergie peut générer des tokens à un coût moindre au fil du temps.
"Si j'ajoutais 100 $ par jour de coût d'inférence — coût des tokens — je serais plus qu'heureux de le faire", a déclaré Huang à propos du paiement des tokens en plus des salaires des ingénieurs — surtout pendant les périodes intenses. "Si j'ajoutais même 1 000 $ en période de forte pression, je serais plus qu'heureux de le faire."
Huang n'est pas seul. Le concept commence à se répandre dans l'industrie technologique, les ingénieurs posant des questions sur le calcul lors des entretiens et les dirigeants l'envisageant comme partie intégrante des packages de rémunération.
L'essor de l'IA agentique pourrait augmenter considérablement l'utilisation des tokens, a déclaré Huang, car ces agents fonctionneront sans supervision humaine.
"En ce moment, pendant que nous parlons, tous nos ordinateurs portables sont un peu inactifs", a-t-il déclaré mardi. "Mais à l'avenir, l'ordinateur fonctionnera 24/7 et créera des tokens parce que vos agents sont en train de travailler."
Brief IA — Veille IA quotidienne
Toutes les innovations IA du monde entier, résumées et analysées automatiquement chaque jour.