Le nouveau modèle d'IA de Xiaomi utilise 60 % de jetons en moins que GPT-5.4

Xiaomi a publié une paire de modèles d'IA open-source qui défient l'efficacité des jetons des systèmes de pointe d'OpenAI et de Google, signalant un changement majeur dans l'économie de l'IA agentique.

L'entreprise technologique chinoise Xiaomi a lancé deux modèles d'IA open-source, MiMo-V2.5 et V2.5-Pro, qui consomment jusqu'à 60 % de jetons en moins que les modèles d'OpenAI et de Google pour des tâches agentiques complexes. Le modèle phare MiMo-V2.5-Pro, publié sous une licence MIT permissive, vise à réduire le coût du développement de l'IA alors que l'industrie s'oriente vers une tarification basée sur l'utilisation.

« La valeur d'un modèle ne se mesure pas uniquement par les classements — elle se mesure par les problèmes qu'il résout », a déclaré Fuli Luo, responsable du projet chez Xiaomi MiMo et ancien membre de l'équipe DeepSeek, sur le réseau social X.

Selon les benchmarks publiés par Xiaomi, le MiMo-V2.5-Pro atteint un taux de réussite de 63,8 % sur le benchmark ClawEval tout en ne consommant qu'environ 70 000 jetons. C'est 40 à 60 % de moins que ce que nécessitent le Claude Opus 4.6 d'Anthropic, le Gemini 3.1 Pro de Google et le GPT-5.4 d'OpenAI pour des résultats similaires. Le modèle est disponible via API au tarif compétitif de 1,00 $ par million de jetons d'entrée.

Ce lancement défie directement le modèle économique des leaders de l'IA propriétaire comme OpenAI, Anthropic et Google en offrant une alternative open-source à moindre coût. Alors que des services comme GitHub Copilot passent à une facturation à l'usage, la haute efficacité et la licence permissive de MiMo pourraient attirer les développeurs et les entreprises cherchant à éviter l'escalade de la « taxe SaaS » sur les flux de travail d'IA.

L'efficacité par la spécialisation

Au cœur de la série MiMo se trouve une architecture Sparse Mixture-of-Experts (MoE). Le MiMo-V2.5-Pro, doté de 1,02 billion de paramètres, n'en utilise que 42 milliards pour une tâche donnée, une conception qui réduit considérablement le coût de calcul. Cela permet au modèle Pro d'atteindre ses hautes performances sur les tâches agentiques de type « claw » — où un agent d'IA accomplit des flux de travail complexes pour le compte d'un utilisateur — tout en consommant substantiellement moins de jetons que ses pairs. Sur le benchmark GDPVal-AA, le modèle Pro a obtenu un score de 1581, surpassant des modèles comme le GLM 5.1 de Zhipu et le Kimi K2.6 de Moonshot.

Xiaomi a démontré la puissance du modèle en lui faisant réaliser de manière autonome plusieurs projets complexes. V2.5-Pro a implémenté un compilateur complet en langage Rust en 4,3 heures via 672 appels d'outils et a produit une application d'édition vidéo de 8 192 lignes en 11,5 heures.

Un défi open-source à la « taxe SaaS »

En publiant les modèles sous licence MIT, Xiaomi permet à tout développeur ou entreprise de les utiliser, de les modifier et de les déployer commercialement sans restriction. Cette initiative est un défi direct à l'approche de « jardin clos » de nombreux laboratoires d'IA de premier plan et intervient alors que les modèles de tarification de l'industrie évoluent. Avec GitHub Copilot et d'autres services passant d'abonnements forfaitaires à une facturation basée sur l'usage, le coût de fonctionnement d'agents d'IA puissants devient une préoccupation majeure pour les entreprises.

La tarification de l'API de Xiaomi casse encore davantage les prix du marché. Le MiMo-V2.5-Pro coûte 1,00 $ par million de jetons d'entrée et 3,00 $ pour la sortie, contre 2,00 $ et 12,00 $ pour le Gemini 3 Pro de Google ou 5,00 $ et 30,00 $ pour le GPT-5.5 d'OpenAI. Pour accélérer l'adoption, la société a également annoncé l'octroi de 100 billions de jetons gratuits pour les développeurs.

Ce lancement reflète une tendance plus large de modèles open-source très performants provenant de firmes chinoises, notamment la série Qwen d'Alibaba et le GLM de Zhipu AI, qui gagnent du terrain sur leurs concurrents occidentaux. TIME a récemment nommé ByteDance, Zhipu AI et Alibaba dans sa liste des 10 entreprises d'IA les plus influentes de 2026, soulignant l'influence croissante de la technologie chinoise dans le paysage mondial de l'IA. Pour les entreprises américaines, l'exécution de ces modèles open-source sur des serveurs privés offre un moyen de tirer parti d'une IA performante à bas coût tout en atténuant les risques de résidence des données et de conformité.

Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.