Le brief IA que les pros lisent chaque soir
Les 7 actus IA du jour, décryptées en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
OpenAI diminue drastiquement les coûts d'accès à ChatGPT
OpenAI aurait réduit les coûts de réponse pour les utilisateurs invités de ChatGPT de plus de la moitié. Des ingénieurs d'OpenAI ont informé leurs collègues plus tôt ce mois-ci qu'ils avaient réussi à diminuer les coûts d'inférence—la dépense liée à l'exécution des modèles d'IA existants—de plus de 50 %. Cela a été rapporté par une personne familière avec les discussions, selon The Information.
OpenAI a appliqué ces nouvelles optimisations à ChatGPT, spécifiquement pour les visiteurs qui n'ont pas de compte. Le nombre de GPU Nvidia nécessaires pour servir ces utilisateurs est tombé à seulement quelques centaines. Il n'est pas clair combien étaient requis auparavant ni quelles techniques OpenAI a utilisées pour y parvenir. Les utilisateurs invités n'ont accès qu'à un ensemble très limité de fonctionnalités de ChatGPT, donc il reste à voir si ces gains se répercuteront sur le produit complet.
Deepseek a également récemment lancé une nouvelle méthode open-source qui peut accélérer les demandes d'inférence de 60 à 85 %. Les ressources libérées pourraient être utilisées pour l'extension des services, de meilleurs modèles, des réponses plus rapides ou des marges bénéficiaires plus importantes. Cependant, étant donné que les constructions de centres de données avancent lentement, de tels gains donneront probablement aux laboratoires plus de marge de manœuvre plutôt que de réduire la demande de puces.


