Amazon, Meta, Microsoft et Uber ont tous réduit leurs indicateurs internes de consommation de tokens IA ces dernières semaines, après que leurs employés ont brûlé des milliards de dollars en calcul avec peu de résultats commerciaux mesurables, marquant la correction la plus significative des dépenses IA en entreprise depuis la généralisation de la technologie.
« Veuillez ne pas utiliser l'IA juste pour utiliser l'IA », a déclaré Dave Treadwell, vice-président senior de l'ingénierie chez Amazon, au personnel cette semaine. « Utilisez l'IA pour vous aider à résoudre les problèmes des clients, pour vous aider à résoudre les problèmes de l'entreprise, pour innover. »
Amazon a fermé KiroRank, un classement interne qui suivait l'utilisation des tokens IA sur sa plateforme de développement Kiro, le 29 mai, selon Business Insider. Le tableau de bord avait encouragé les employés à gonfler leurs scores via le « tokenmaxxing » — l'exécution de tâches inutiles via des agents IA pour consommer des tokens et grimper dans le classement. Un porte-parole d'Amazon a confirmé que l'outil avait été « déprécié » et a déclaré qu'il « n'avait jamais eu pour but de promouvoir l'utilisation de l'IA pour le simple fait d'utiliser l'IA ».
Ce repli n'est pas isolé. Meta a supprimé son propre classement d'utilisation de l'IA, appelé Claudenomics, la même semaine. Ce tableau de bord suivait la consommation de tokens de 85 000 employés et distinguait les 250 meilleurs utilisateurs, selon Fortune. Le directeur de l'exploitation d'Uber, Andrew Macdonald, a récemment déclaré que l'entreprise n'avait trouvé aucune relation claire entre l'augmentation des dépenses IA et le succès des livraisons de produits — après que ses ingénieurs ont épuisé le budget annuel de Claude Code dès avril. Microsoft a annulé les licences Claude Code au sein de sa division Experiences and Devices plus tôt ce mois-ci, redirigeant ses ingénieurs vers son propre GitHub Copilot CLI.
Le coût de l'utilisation des tokens comme métrique de productivité
Les tokens sont les unités que les grands modèles de langage utilisent pour traiter le texte et générer des réponses. Dans le cadre de la tarification basée sur les tokens, les coûts augmentent avec l'utilisation, et non avec les résultats. En incitant à la consommation sans mesurer les résultats, les entreprises ont créé un système où gonfler les chiffres était rationnel pour les individus mais destructeur pour les budgets.
Une entreprise non identifiée a accidentellement dépensé 500 millions de dollars en un seul mois sur Claude d'Anthropic après avoir omis de fixer des limites d'utilisation, selon Axios. Ce seul client représentait environ un huitième du chiffre d'affaires annualisé estimé d'Anthropic, soit 4,7 milliards de dollars. L'entreprise n'a pas été publiquement identifiée, bien que les spéculations sur les réseaux sociaux se soient concentrées sur Amazon, qui prévoit environ 200 milliards de dollars de dépenses d'investissement en 2026, principalement dans l'IA et les centres de données.
Amazon s'était fixé pour objectif que plus de 80 % de ses développeurs utilisent les outils d'IA chaque semaine, selon Fortune. L'entreprise a désormais remplacé le nombre brut de tokens par une métrique appelée « déploiements normalisés », qui mesure le code assisté par IA qui est effectivement livré plutôt que les tokens consommés.
Le PDG de Duolingo, Luis von Ahn, a récemment reconnu des frictions internes similaires. « Nous ne sommes pas tenus responsables des résultats réels », a-t-il déclaré sur un podcast en avril, après que l'entreprise a retiré un projet visant à lier l'utilisation de l'IA aux évaluations de performance des employés.
Ce que cela signifie pour les dépenses d'infrastructure IA
Ce recul ne signifie pas un retrait des investissements dans l'IA. L'engagement d'Amazon de 200 milliards de dollars en dépenses d'investissement reste intact. Google a annoncé lors de sa conférence I/O que l'utilisation de Gemini était passée de 480 000 milliards de tokens par mois en mai 2025 à 3,2 quadrillions de tokens par mois en mai 2026, tirée principalement par l'IA agentique et les outils de codage qui consomment beaucoup plus de calcul que les requêtes de chatbot de base.
Mais le passage de métriques basées sur la consommation à des métriques basées sur les résultats représente un changement significatif dans la manière dont la valeur de l'IA en entreprise est mesurée. Les entreprises qui vendent des outils d'IA sur la base d'un prix par token — notamment Anthropic et, dans une moindre mesure, OpenAI — sont confrontées à une pression croissante pour démontrer un retour sur investissement alors que les clients resserrent leurs budgets. Les fournisseurs d'outils internes comme GitHub Copilot de Microsoft devraient bénéficier de la réorientation des dépenses vers des plateformes intégrées.
DeepSeek, le laboratoire d'IA chinois, a noté dans son rapport technique V4 que son modèle surpasse désormais Claude Sonnet 4.5 en interne tout en coûtant moins cher — un rappel que la prochaine phase de la concurrence en matière d'IA en entreprise sera définie par l'efficacité, et non par la consommation brute.
Pour les investisseurs, le message est nuancé. Nvidia, dont les GPU alimentent la grande majorité des charges de travail d'entraînement et d'inférence de l'IA, a été le principal bénéficiaire de la course aux tokens. Si les clients entreprises commencent à optimiser pour moins de tokens par tâche plutôt que plus, la courbe de croissance de la demande de calcul IA pourrait s'aplatir. Les actions Nvidia se négocient à environ 35 fois les bénéfices prévisionnels, intégrant une croissance exponentielle continue des revenus des centres de données.
« Les entreprises cherchent encore leur voie », a déclaré Will McGough, directeur des investissements chez Prime Capital Financial, au Wall Street Journal. La correction qui consiste à passer de « utiliser plus d'IA » à « utiliser une IA qui fonctionne » ne fait que commencer.
Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.