Las grandes tecnológicas frenan el uso de tokens de IA mientras se acumulan facturas de 500 millones de dólares

Amazon, Meta, Microsoft y Uber han reducido en las últimas semanas sus métricas internas de consumo de tokens de IA, después de que los empleados quemaran miles de millones de dólares en capacidad de cómputo con escasos resultados empresariales medibles, lo que supone la corrección más significativa en el gasto empresarial en IA desde que la tecnología se generalizó.

"No utilicen la IA solo por utilizar la IA", dijo Dave Treadwell, vicepresidente sénior de ingeniería de Amazon, al personal esta semana. "Usen la IA para ayudar a resolver problemas de los clientes, para ayudar a resolver problemas empresariales, para innovar".

Amazon cerró KiroRank, un ranking interno que rastreaba el uso de tokens de IA en su plataforma para desarrolladores Kiro, el 29 de mayo, según Business Insider. El panel había animado a los empleados a inflar sus puntuaciones mediante el "tokenmaxxing" — ejecutar tareas sin sentido a través de agentes de IA para consumir tokens y escalar posiciones. Un portavoz de Amazon confirmó que la herramienta había sido "descontinuada" y dijo que "nunca tuvo la intención de promover el uso de IA por el simple hecho de usarla".

El retroceso no es aislado. Meta eliminó su propio ranking de uso de IA, llamado Claudenomics, la misma semana. Ese panel rastreaba el consumo de tokens entre 85 000 empleados y destacaba a los 250 principales usuarios, según Fortune. El director de operaciones de Uber, Andrew Macdonald, dijo recientemente que la empresa no encontró una relación clara entre el aumento del gasto en IA y la entrega exitosa de productos — después de que sus ingenieros agotaran el presupuesto anual completo de Claude Code para abril. Microsoft canceló las licencias de Claude Code en su división de Experiencias y Dispositivos a principios de este mes, redirigiendo a los ingenieros hacia su propio GitHub Copilot CLI.

El coste de tratar los tokens como una métrica de productividad

Los tokens son las unidades que los modelos de lenguaje de gran tamaño utilizan para procesar texto y generar respuestas. Bajo la fijación de precios basada en tokens, los costes escalan con el uso, no con los resultados. Cuando las empresas incentivaron el consumo sin medir los resultados, crearon un sistema en el que inflar las cifras era racional para los individuos pero destructivo para los presupuestos.

Una empresa no identificada gastó accidentalmente 500 millones de dólares en un solo mes en Claude, de Anthropic, después de no establecer límites de uso, según Axios. Ese único cliente representó aproximadamente un octavo de la tasa de ingresos anualizada estimada de Anthropic de 4700 millones de dólares. La empresa no ha sido identificada públicamente, aunque las especulaciones en redes sociales se han centrado en Amazon, que está gastando aproximadamente 200 000 millones de dólares en gastos de capital en 2026, principalmente en IA y centros de datos.

Amazon había fijado el objetivo de que más del 80 % de sus desarrolladores utilizaran herramientas de IA semanalmente, según Fortune. La empresa ha reemplazado ahora los recuentos brutos de tokens con una métrica llamada "implementaciones normalizadas", que mide el código asistido por IA que realmente se lanza, en lugar de los tokens consumidos.

El CEO de Duolingo, Luis von Ahn, reconoció recientemente una fricción interna similar. "No estamos siendo responsables de los resultados reales", dijo en un podcast en abril, después de que la empresa retirara un plan para vincular el uso de IA con las evaluaciones de desempeño de los empleados.

Lo que esto significa para el gasto en infraestructura de IA

El retroceso no indica una retirada de la inversión en IA. El compromiso de gasto de capital de 200 000 millones de dólares de Amazon se mantiene intacto. Google anunció en su conferencia I/O que el uso de Gemini había pasado de 480 billones de tokens por mes en mayo de 2025 a 3,2 cuatrillones de tokens por mes en mayo de 2026, impulsado en gran medida por la IA agente y las herramientas de codificación que consumen mucha más capacidad de cómputo que las consultas básicas de chatbots.

Pero el cambio de métricas basadas en el consumo a métricas basadas en resultados representa un cambio significativo en la forma de medir el valor empresarial de la IA. Las empresas que venden herramientas de IA por token — incluida Anthropic y, en menor medida, OpenAI — enfrentan una presión creciente para demostrar el retorno de la inversión a medida que los clientes ajustan sus presupuestos. Los proveedores internos de herramientas como GitHub Copilot de Microsoft se beneficiarán a medida que las empresas redirijan el gasto hacia plataformas integradas.

DeepSeek, el laboratorio chino de IA, señaló en su informe técnico V4 que su modelo ahora supera internamente a Claude Sonnet 4.5 a un coste menor — un recordatorio de que la próxima fase de la competencia empresarial en IA se definirá por la eficiencia, no por el consumo bruto.

Para los inversores, el mensaje es matizado. Nvidia, cuyas GPU alimentan la gran mayoría de las cargas de trabajo de entrenamiento e inferencia de IA, ha sido el principal beneficiario de la carrera armamentística de tokens. Si los clientes empresariales comienzan a optimizar para usar menos tokens por tarea en lugar de más, la curva de crecimiento de la demanda de cómputo de IA podría aplanarse. Las acciones de Nvidia cotizan a aproximadamente 35 veces las ganancias futuras, descontando un crecimiento exponencial continuo en los ingresos de centros de datos.

"Las empresas todavía están descubriendo las cosas", dijo Will McGough, director de inversiones de Prime Capital Financial, al Wall Street Journal. La corrección de "usar más IA" a "usar IA que funcione" apenas comienza.

Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.