小米新人工智能模型 token 消耗量比 GPT-5.4 减少 60%

小米发布了两款开源人工智能模型，挑战了 OpenAI 和 Google 领先系统的 token 效率，标志着智能体 AI 经济学发生了重大转变。

中国科技公司小米发布了两款开源 AI 模型 MiMo-V2.5 和 V2.5-Pro，在处理复杂的智能体任务时，其 token 消耗量比 OpenAI 和 Google 的模型减少了多达 60%。旗舰型号 MiMo-V2.5-Pro 采用宽松的 MIT 许可证发布，旨在随着行业向按需付费定价模式转变而降低 AI 开发成本。

“模型的价值不在于排名，而在于它能解决的问题，”小米 MiMo 项目负责人、DeepSeek 团队前成员罗福莉在社交媒体平台 X 上表示。

根据小米公布的基准测试数据，MiMo-V2.5-Pro 在 ClawEval 基准测试中实现了 63.8% 的成功率，而消耗的 token 仅约 7 万个。相比之下，Anthropic 的 Claude Opus 4.6、Google 的 Gemini 3.1 Pro 和 OpenAI 的 GPT-5.4 在达到类似结果时所需的 token 消耗量要多出 40-60%。该模型通过 API 提供服务，输入价格为极具竞争力的每百万 token 1.00 美元。

此次发布通过提供低成本、开源的替代方案，直接挑战了 OpenAI、Anthropic 和 Google 等闭源 AI 领导者的经济模式。随着 GitHub Copilot 等服务转向计量计费，MiMo 的高效率和宽松许可可能会吸引那些希望避免 AI 工作流程中不断增加的“SaaS 税”的开发者和企业。

通过专业化实现高效

MiMo 系列的核心是稀疏混合专家 (MoE) 架构。拥有 1.02 万亿参数的 MiMo-V2.5-Pro 在执行任何特定任务时仅调用 420 亿个参数，这种设计显著降低了计算成本。这使得 Pro 模型在执行智能体“抓取” (claw) 任务（即 AI 代理代表用户完成复杂工作流）时，能够实现高性能的同时，token 消耗显著低于同行。在 GDPVal-AA 基准测试中，Pro 模型获得了 1581 分，优于智谱的 GLM 5.1 和月之暗面的 Kimi K2.6。

小米展示了该模型的强大能力，让其自主完成了数个复杂项目。V2.5-Pro 在 4.3 小时内通过 672 次工具调用实现了一个完整的 Rust 语言编译器，并在 11.5 小时内编写了一个拥有 8192 行代码的视频编辑器应用程序。

对“SaaS 税”的开源挑战

通过在宽松的 MIT 许可证下发布模型，小米允许任何开发者或企业不受限制地进行商业使用、修改和部署。此举是对许多顶级 AI 实验室“围墙花园”模式的直接挑战，且正值行业定价模式发生变革之际。随着 GitHub Copilot 和其他服务从固定订阅费转向按量计费，运行强大的 AI 智能体的成本正成为企业关注的焦点。

小米的 API 定价进一步压低了市场价格。MiMo-V2.5-Pro 的输入 token 价格为每百万 1.00 美元，输出为 3.00 美元；相比之下，Google Gemini 3 Pro 分别为 2.00 美元和 12.00 美元，OpenAI GPT-5.5 则为 5.00 美元和 30.00 美元。为了加速推广，小米还宣布向开发者提供 100 万亿个免费 token 的额度。

此次发布反映了中国企业高性能开源模型（包括阿里巴巴的 Qwen 系列和智谱 AI 的 GLM）在追赶西方竞争对手方面的广泛趋势。近期，《时代》周刊将字节跳动、智谱 AI 和阿里巴巴列入 2026 年最具影响力的 10 家 AI 公司名单，凸显了中国技术在全球 AI 领域日益增长的影响力。对于美国企业而言，在私有服务器上运行这些开源模型提供了一条利用低成本、高性能 AI 的途径，同时降低了数据驻留和合规性风险。

本文仅供参考，不构成投资建议。