DeepSeek V4 将 AI Token 成本削减 97% 以挑战 GPT-5.5

中国 AI 实验室 DeepSeek 推出的一系列大幅降价举措正在撼动人工智能市场，其 V4-Pro 模型现在的价格比 OpenAI 的 GPT-5.5 便宜高达 35 倍，为 Token 成本设定了新底线。此举与其说是对前沿模型的直接挑战，不如说是人工智能行业进入下一阶段的信号，即价格暴跌可能会极大地扩大算力需求。

“尽情狂欢吧，”一名 DeepSeek 高级研究员在 X 上发布消息称，该公司在一周内第三次下调价格。该实验室首先开源了其 V4 模型系列，随后宣布了 75% 的促销折扣，最后将输入缓存命中价格降低了 90%，创造了一个从根本上改变开发人员经济效益的定价结构。

数据非常惊人。DeepSeek 的 V4-Pro 是一个拥有 1.6 万亿参数的混合专家 (MoE) 模型，在促销价格下，每百万输入 Token 的成本约为 1.74 美元，每百万输出 Token 的成本约为 0.87 美元。相比之下，根据行业数据，GPT-5.5 每百万输出 Token 的费用约为 30.21 美元，而 Anthropic 的 Claude Opus 4.7 成本为 25 美元。中金公司 (CICC) 4 月 29 日的一份研究报告指出，V4 系列的效率将加速下游代理 AI (Agentic AI) 应用的需求，并点名智谱 (02513) 和 MiniMax 为可能的受益者。

然而，价格战掩盖了关于中国在全球 AI 竞赛中地位的更为现实的情况。虽然 DeepSeek 的定价具有破坏性，但其技术并非处于最前沿。该公司自己的论文显示，V4 落后于 GPT-5.4 和 Gemini 3.1-Pro 等模型。在独立的 Artificial Analysis 智能指数中，DeepSeek V4-Pro 得分为 52，明显落后于 GPT-5.5 的 60 和 Claude Opus 4.7 的 57。

已经获胜的沉默帝国

就在 DeepSeek 占据新闻头条的同时，另一家中国公司已经在开源 AI 领域占据了主导地位。阿里巴巴的通义千问 (Qwen) 模型家族在 Hugging Face 上的累计下载量已超过 10 亿次，且仅在 2026 年 2 月，其下载量就超过了紧随其后的八家竞争对手的总和，其中包括 Meta、OpenAI 和 Mistral。

Qwen 的策略是在宽松的 Apache 2.0 许可下发布 100 多个开源权重模型，这使其成为全球 AI 开发浪潮的默认起点。新加坡和马来西亚政府正在基于中国开源模型构建其主权 AI 生态系统，而 Qwen 是首选。这种沉默的统治力，而非 DeepSeek 的降价，代表了 AI 格局中更具意义的结构性转变。

为什么价格下跌是算力的看涨信号

AI Token 成本的暴跌并不是该行业的看跌信号，而是杰文斯悖论 (Jevons Paradox) 的一个典型案例。该悖论最早由威廉·斯坦利·杰文斯于 1865 年提出，其核心观点是：随着技术提高了资源的使用效率，该资源的消耗总量反而会增加。更便宜的 AI Token 不会导致算力使用减少，反而会导致算力被应用于更广泛的领域。

微软首席执行官萨提亚·纳德拉和英特尔前首席执行官帕特·基辛格都援引过这一原则，认为更便宜的 AI 将扩大其市场，将智能嵌入到从汽车到灯泡的一切事物中。这表明，AI Token 的正确心理模型不是价格稳定的 iPhone，而是晶体管——其成本在 60 年间的暴跌使其能够渗透到经济的每个角落。价格暴跌是 AI 无处不在的前提条件。

底层才是护城河

当前的 AI 热潮与 2000 年代初的搜索市场遥相呼应。当时，数百家初创公司通过在利基应用中封装谷歌的搜索结果建立了盈利业务，但当谷歌直接整合这些功能时，这些公司便被淘汰了。今天，成千上万的“凭感觉编码 (vibe-coded)”的应用只是 OpenAI 或 Anthropic 模型的薄封装层，使它们处于同样的脆弱“租客”地位。

这一历史平行线表明，AI 时代真正的、可防御的护城河不在应用层，而在底层：基座模型、运行它们的基建以及训练它们的芯片。英伟达的股价从 2015 年拆分调整后的 0.66 美元攀升至如今的 208 美元以上，证明了价值捕捉的所在。投资者的核心问题不是中国模型是否比 Claude 便宜，而是对 AI 算力的需求是否将继续超过供应。现有的每一个信号都表明答案是肯定的。

本文仅供参考，不构成投资建议。