杰文斯悖论推动AI算力需求激增，代币成本下降1000倍

每个AI代币的成本在三年内下降了1000倍，但企业算力消耗却呈爆炸式增长——Uber到4月就已烧光了其整个2026年的AI预算，而AT&T现在每日处理270亿个代币，而18个月前这一数字仅为10亿。

"每当单位智能变得更便宜时，我们并没有减少消费，而是增加了消费，因为我们可以用同样的预算解决更复杂的任务，"AI云公司Nebius的联合创始人兼首席商务官Roman Chernin表示。

这一现象被称为杰文斯悖论，以19世纪经济学家威廉·斯坦利·杰文斯命名，描述的是效率提升降低成本的效应反而可能增加资源总消耗。本周经济学家Maury Harris在致《华尔街日报》的一封信中指出，该原则同样适用于AI算力，其需求价格弹性可能是"高度弹性的"。Nebius公司主要构建大规模GPU集群，其股价在今年1月DeepSeek引发的恐慌中下跌了40%——但Chernin表示，同一周"很可能是公司销售业绩最好的一周"，原因是企业意识到自己能够负担大规模推理成本。

这对投资者的影响十分重大。高盛估计，AI基础设施年度支出可能从2026年的7650亿美元增至2031年的1.6万亿美元。但赢家将取决于利用率、融资纪律以及吸收零部件成本波动的能力——随着AI需求从数据中心溢出并渗透到更广泛的经济领域，内存芯片价格在过去一年中上涨了六倍。

代币爆炸冲击企业预算

从实验性聊天机器人向代理式AI系统的转变是主要推动力。当企业从单轮查询转向能够链式调用、检索文档并采取行动的多步自主代理时，代币消耗量会跃升一个数量级甚至更多。一家大型医疗保险公司在不到一年的时间里，其月度AI代币消耗量从300万个飙升至超过1.5亿个。

支出激增正在重塑供应商定价策略。Anthropic取消了企业用户统一收费的方案，原因是其发现开发者每月支付200美元却烧掉了数千美元的计算资源。OpenAI同月将Codex也改为按代币计费。所有主要AI供应商都在转向计量收费模式，Chernin将其称为"结构性锁定"：每部署一个新代理，都会加深对供应商的依赖，而这些供应商掌控着定价权与条款细则。

然而，需求端的情况与1月份席卷市场的恐慌截然不同。当DeepSeek发布引发Nebius股价暴跌40%以及更广泛的AI基础设施类股抛售潮时，企业工程团队不仅没有退缩，反而在扩大规模。成本降低使得此前不经济的应用场景变得可行，从内部知识检索到自动化客户工作流，不一而足。

算力变便宜，谁会赢

竞争格局有利于那些向技术栈上游发展的公司。Chernin估计，裸金属GPU租赁市场全球大约只有十几家客户。托管基础设施可服务数百家企业。推理平台则能吸引数千家客户。他预测，代理式系统将吸引数万名开发者。

Nebius的Token Factory（一个托管推理平台）正是这一策略的体现。该服务允许企业运行开源模型而无需管理后端基础设施，通过优化技术保持成本可控。对企业的价值主张十分明确：托管模型负责追踪成本、维护系统正常运行时间，并根据预算和速度要求在不同模型之间分配任务。

但托管推理层自身也面临商品化的风险。2026年的一项研究发现，2020年至2026年间，大语言模型推理价格下降了约600倍，而经合组织（OECD）2025年AI市场报告显示，随着竞争加剧，经质量调整后的模型价格大幅下跌。这意味着，此前冲击芯片制造商的利润率压缩压力，现在正沿着技术栈向上蔓延。

对投资者而言，核心问题是哪些公司能够构建持久的护城河。英伟达目前远期市盈率约为35倍，面临着推理成本下降降低其最高利润率训练芯片需求的风险。云超大规模厂商——亚马逊、微软、谷歌——受益于计算消耗的增长，但资本开支要求也在上升。而像Nebius这样的基础设施提供商必须证明，它们能在市场扩张的同时维持利用率和定价能力。

杰文斯悖论表明，即使单位价格下降，AI行业总收入仍会增长。但要捕获这些收入，需要的不仅仅是拥有算力，还需要软件、工具以及将原始算力转化为最终产品的企业关系。

本文仅供参考，不构成投资建议。