AI越便宜,企业在它上面的花费就越多——数字已经开始证明这一点。
AI越便宜,企业在它上面的花费就越多——数字已经开始证明这一点。

每个AI代币的成本在三年内下降了1000倍,但企业算力消耗却呈爆炸式增长——Uber到4月就已烧光了其整个2026年的AI预算,而AT&T现在每日处理270亿个代币,而18个月前这一数字仅为10亿。
"每当单位智能变得更便宜时,我们并没有减少消费,而是增加了消费,因为我们可以用同样的预算解决更复杂的任务,"AI云公司Nebius的联合创始人兼首席商务官Roman Chernin表示。
这一现象被称为杰文斯悖论,以19世纪经济学家威廉·斯坦利·杰文斯命名,描述的是效率提升降低成本的效应反而可能增加资源总消耗。本周经济学家Maury Harris在致《华尔街日报》的一封信中指出,该原则同样适用于AI算力,其需求价格弹性可能是"高度弹性的"。Nebius公司主要构建大规模GPU集群,其股价在今年1月DeepSeek引发的恐慌中下跌了40%——但Chernin表示,同一周"很可能是公司销售业绩最好的一周",原因是企业意识到自己能够负担大规模推理成本。
这对投资者的影响十分重大。高盛估计,AI基础设施年度支出可能从2026年的7650亿美元增至2031年的1.6万亿美元。但赢家将取决于利用率、融资纪律以及吸收零部件成本波动的能力——随着AI需求从数据中心溢出并渗透到更广泛的经济领域,内存芯片价格在过去一年中上涨了六倍。
从实验性聊天机器人向代理式AI系统的转变是主要推动力。当企业从单轮查询转向能够链式调用、检索文档并采取行动的多步自主代理时,代币消耗量会跃升一个数量级甚至更多。一家大型医疗保险公司在不到一年的时间里,其月度AI代币消耗量从300万个飙升至超过1.5亿个。
支出激增正在重塑供应商定价策略。Anthropic取消了企业用户统一收费的方案,原因是其发现开发者每月支付200美元却烧掉了数千美元的计算资源。OpenAI同月将Codex也改为按代币计费。所有主要AI供应商都在转向计量收费模式,Chernin将其称为"结构性锁定":每部署一个新代理,都会加深对供应商的依赖,而这些供应商掌控着定价权与条款细则。
然而,需求端的情况与1月份席卷市场的恐慌截然不同。当DeepSeek发布引发Nebius股价暴跌40%以及更广泛的AI基础设施类股抛售潮时,企业工程团队不仅没有退缩,反而在扩大规模。成本降低使得此前不经济的应用场景变得可行,从内部知识检索到自动化客户工作流,不一而足。
竞争格局有利于那些向技术栈上游发展的公司。Chernin估计,裸金属GPU租赁市场全球大约只有十几家客户。托管基础设施可服务数百家企业。推理平台则能吸引数千家客户。他预测,代理式系统将吸引数万名开发者。
Nebius的Token Factory(一个托管推理平台)正是这一策略的体现。该服务允许企业运行开源模型而无需管理后端基础设施,通过优化技术保持成本可控。对企业的价值主张十分明确:托管模型负责追踪成本、维护系统正常运行时间,并根据预算和速度要求在不同模型之间分配任务。
但托管推理层自身也面临商品化的风险。2026年的一项研究发现,2020年至2026年间,大语言模型推理价格下降了约600倍,而经合组织(OECD)2025年AI市场报告显示,随着竞争加剧,经质量调整后的模型价格大幅下跌。这意味着,此前冲击芯片制造商的利润率压缩压力,现在正沿着技术栈向上蔓延。
对投资者而言,核心问题是哪些公司能够构建持久的护城河。英伟达目前远期市盈率约为35倍,面临着推理成本下降降低其最高利润率训练芯片需求的风险。云超大规模厂商——亚马逊、微软、谷歌——受益于计算消耗的增长,但资本开支要求也在上升。而像Nebius这样的基础设施提供商必须证明,它们能在市场扩张的同时维持利用率和定价能力。
杰文斯悖论表明,即使单位价格下降,AI行业总收入仍会增长。但要捕获这些收入,需要的不仅仅是拥有算力,还需要软件、工具以及将原始算力转化为最终产品的企业关系。
本文仅供参考,不构成投资建议。