Key Takeaways:
- 小米发布了开源 AI 模型 MiMo-V2.5-Pro,在执行智能体任务时,其 token 消耗量比 OpenAI 的 GPT-5.4 等竞争对手减少了多达 60%。
- 该模型采用宽松的 MIT 许可证发布,允许免费商业使用和修改,对闭源市场领导者发起了挑战。
- Pro 模型的 API 定价设为每百万输入 token 1.00 美元,显著低于 Google、OpenAI 和 Anthropic 的同类模型。
Key Takeaways:

小米发布了两款开源人工智能模型,挑战了 OpenAI 和 Google 领先系统的 token 效率,标志着智能体 AI 经济学发生了重大转变。
中国科技公司小米发布了两款开源 AI 模型 MiMo-V2.5 和 V2.5-Pro,在处理复杂的智能体任务时,其 token 消耗量比 OpenAI 和 Google 的模型减少了多达 60%。旗舰型号 MiMo-V2.5-Pro 采用宽松的 MIT 许可证发布,旨在随着行业向按需付费定价模式转变而降低 AI 开发成本。
“模型的价值不在于排名,而在于它能解决的问题,”小米 MiMo 项目负责人、DeepSeek 团队前成员罗福莉在社交媒体平台 X 上表示。
根据小米公布的基准测试数据,MiMo-V2.5-Pro 在 ClawEval 基准测试中实现了 63.8% 的成功率,而消耗的 token 仅约 7 万个。相比之下,Anthropic 的 Claude Opus 4.6、Google 的 Gemini 3.1 Pro 和 OpenAI 的 GPT-5.4 在达到类似结果时所需的 token 消耗量要多出 40-60%。该模型通过 API 提供服务,输入价格为极具竞争力的每百万 token 1.00 美元。
此次发布通过提供低成本、开源的替代方案,直接挑战了 OpenAI、Anthropic 和 Google 等闭源 AI 领导者的经济模式。随着 GitHub Copilot 等服务转向计量计费,MiMo 的高效率和宽松许可可能会吸引那些希望避免 AI 工作流程中不断增加的“SaaS 税”的开发者和企业。
MiMo 系列的核心是稀疏混合专家 (MoE) 架构。拥有 1.02 万亿参数的 MiMo-V2.5-Pro 在执行任何特定任务时仅调用 420 亿个参数,这种设计显著降低了计算成本。这使得 Pro 模型在执行智能体“抓取” (claw) 任务(即 AI 代理代表用户完成复杂工作流)时,能够实现高性能的同时,token 消耗显著低于同行。在 GDPVal-AA 基准测试中,Pro 模型获得了 1581 分,优于智谱的 GLM 5.1 和月之暗面的 Kimi K2.6。
小米展示了该模型的强大能力,让其自主完成了数个复杂项目。V2.5-Pro 在 4.3 小时内通过 672 次工具调用实现了一个完整的 Rust 语言编译器,并在 11.5 小时内编写了一个拥有 8192 行代码的视频编辑器应用程序。
通过在宽松的 MIT 许可证下发布模型,小米允许任何开发者或企业不受限制地进行商业使用、修改和部署。此举是对许多顶级 AI 实验室“围墙花园”模式的直接挑战,且正值行业定价模式发生变革之际。随着 GitHub Copilot 和其他服务从固定订阅费转向按量计费,运行强大的 AI 智能体的成本正成为企业关注的焦点。
小米的 API 定价进一步压低了市场价格。MiMo-V2.5-Pro 的输入 token 价格为每百万 1.00 美元,输出为 3.00 美元;相比之下,Google Gemini 3 Pro 分别为 2.00 美元和 12.00 美元,OpenAI GPT-5.5 则为 5.00 美元和 30.00 美元。为了加速推广,小米还宣布向开发者提供 100 万亿个免费 token 的额度。
此次发布反映了中国企业高性能开源模型(包括阿里巴巴的 Qwen 系列和智谱 AI 的 GLM)在追赶西方竞争对手方面的广泛趋势。近期,《时代》周刊将字节跳动、智谱 AI 和阿里巴巴列入 2026 年最具影响力的 10 家 AI 公司名单,凸显了中国技术在全球 AI 领域日益增长的影响力。对于美国企业而言,在私有服务器上运行这些开源模型提供了一条利用低成本、高性能 AI 的途径,同时降低了数据驻留和合规性风险。
本文仅供参考,不构成投资建议。