Brief IA : OpenAI diminue drastiquement les coûts d'accès à ChatGPT

OpenAI diminue drastiquement les coûts d'accès à ChatGPT

Brief IA
Tom Levy·1 min·4 vues

OpenAI a réduit de plus de 50 % les coûts d'inférence pour ChatGPT, grâce à des optimisations qui ont diminué l'usage des GPU Nvidia, le nombre de GPU nécessaires tombant parfois à seulement quelques centaines. Cette baisse des coûts pourrait rendre ChatGPT plus accessible et compétitif, influençant ainsi le marché des IA génératives.

En bref
1OpenAI a réduit de plus de 50 % les coûts d'inférence pour ChatGPT.
2Cette réduction est due à des optimisations qui ont diminué l'usage des GPU Nvidia.
3Le nombre de GPU nécessaires est parfois tombé à seulement quelques centaines.
💡Pourquoi c'est importantCette baisse des coûts pourrait rendre ChatGPT plus accessible et compétitif, influençant le marché des IA génératives.
Le brief IA que lisent les pros

Le brief IA que les pros lisent chaque soir

Les 7 actus IA du jour, décryptées en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

OpenAI diminue drastiquement les coûts d'accès à ChatGPT

OpenAI aurait réduit les coûts de réponse pour les utilisateurs invités de ChatGPT de plus de la moitié. Des ingénieurs d'OpenAI ont informé leurs collègues plus tôt ce mois-ci qu'ils avaient réussi à diminuer les coûts d'inférence—la dépense liée à l'exécution des modèles d'IA existants—de plus de 50 %. Cela a été rapporté par une personne familière avec les discussions, selon The Information.

OpenAI a appliqué ces nouvelles optimisations à ChatGPT, spécifiquement pour les visiteurs qui n'ont pas de compte. Le nombre de GPU Nvidia nécessaires pour servir ces utilisateurs est tombé à seulement quelques centaines. Il n'est pas clair combien étaient requis auparavant ni quelles techniques OpenAI a utilisées pour y parvenir. Les utilisateurs invités n'ont accès qu'à un ensemble très limité de fonctionnalités de ChatGPT, donc il reste à voir si ces gains se répercuteront sur le produit complet.

Deepseek a également récemment lancé une nouvelle méthode open-source qui peut accélérer les demandes d'inférence de 60 à 85 %. Les ressources libérées pourraient être utilisées pour l'extension des services, de meilleurs modèles, des réponses plus rapides ou des marges bénéficiaires plus importantes. Cependant, étant donné que les constructions de centres de données avancent lentement, de tels gains donneront probablement aux laboratoires plus de marge de manœuvre plutôt que de réduire la demande de puces.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires