Microsoft Copilot Cowork : l'essor des coûts liés aux tokens impose un virage vers le routage de modèles

La décision de Microsoft d'abandonner l'utilisation illimitée de l'IA pour son produit professionnel Copilot Cowork marque un tournant : même la deuxième entreprise la plus valorisée au monde ne peut absorber les coûts des tokens de l'IA agentique à grande échelle.

Microsoft a rendu Copilot Cowork disponible au grand public mardi, avec un modèle de facturation à l'usage, remplaçant l'approche d'accès illimité en vigueur depuis l'aperçu du produit en mars. L'agent IA — capable d'exécuter de manière autonome des tâches multi-étapes dans les documents Microsoft 365, même lorsque l'ordinateur de l'utilisateur est éteint — facture désormais les clients par crédit, chaque crédit étant proposé à 0,01 $ dans le cadre du plan de paiement à l'utilisation. Une licence mensuelle distincte de 30 $ par utilisateur pour Microsoft 365 Copilot reste obligatoire pour les grandes entreprises.

« Certains utilisateurs effectuent des centaines de tâches par semaine, ce qui est très productif — mais le coût peut grimper très rapidement », a déclaré Charles Lamanna, vice-président exécutif de Microsoft en charge de Copilot.

Ce changement de tarification coïncide avec des informations selon lesquelles Microsoft évaluerait une version auto-hébergée du modèle open-source DeepSeek V4 comme alternative moins coûteuse aux modèles d'Anthropic et d'OpenAI qui alimentent actuellement Copilot Cowork, selon Axios. Les clients peuvent déjà choisir entre Opus 4.8 et Sonnet 4.6 d'Anthropic, tandis que ceux du programme Frontier peuvent accéder à GPT 5.5 d'OpenAI et au modèle Cowork 1 de Microsoft. L'ajout de DeepSeek V4 donnerait à Microsoft une option open-source hébergée qui pourrait réduire considérablement les coûts des tokens par tâche — une décision qui, selon Axios, pourrait être annoncée dans les semaines à venir.

La pression sur les coûts n'est pas propre à Microsoft. L'indice Silicon Data Token Index, qui suit la tarification des tokens IA chez les principaux fournisseurs, a baissé lors de 12 des 13 dernières séances de bourse, s'approchant des plus bas à court terme, alors que les fournisseurs rivalisent sur les prix et que les entreprises font pression contre la hausse des factures. Mason Daugherty, consultant en IA pour les entreprises, a déclaré que dans pratiquement toutes les conversations avec les clients au cours des deux derniers mois, les dépenses globales en tokens sont devenues une préoccupation majeure. Il a prédit que « l'économie des tokens » deviendra le thème dominant des discussions sur l'achat d'IA au cours des six à douze prochains mois, alors que les contrats annuels des entreprises arrivent à échéance et que les équipes financières s'interrogent sur la justification des prix élevés des modèles de pointe.

L'avantage architectural

Le champ de bataille concurrentiel passe de l'intelligence des modèles au routage efficace des coûts. Arvind Jain, directeur général de la plateforme d'IA pour entreprises Glean, a déclaré que le principal goulot d'étranglement pour l'IA en entreprise n'est plus la capacité du modèle, mais « l'efficacité de production des tokens » — la quantité de travail utile produite par chaque token consommé. La plupart des coûts de l'IA, a-t-il noté, ne proviennent pas de l'invite elle-même, mais de l'infrastructure environnante : récupération, appels d'outils, gestion de la mémoire et raisonnement multi-étapes. Une simple requête de 11 mots peut gonfler jusqu'à des milliers de tokens une fois que le système rassemble le contexte et traite les tâches de manière séquentielle.

« L'intelligence de pointe devient abondante ; l'exécution efficace, elle, ne l'est pas », a déclaré Jain. « Le véritable avantage concurrentiel provient des architectures qui associent le bon modèle et la profondeur de raisonnement appropriée à chaque tâche — des systèmes dotés d'un routage solide, de contrôles de coûts et d'une gouvernance efficace. »

Ce diagnostic s'aligne sur la stratégie de Microsoft. Plutôt que de simplement remplacer un modèle par un autre moins cher, l'entreprise construit un mécanisme de routage de modèles capable d'affecter dynamiquement les tâches à l'option la plus rentable — Anthropic pour le raisonnement complexe, DeepSeek ou le propre modèle de Microsoft pour les requêtes plus simples. Le système de facturation décompose déjà les coûts en quatre composantes : utilisation du modèle, récupération du contexte, appels d'outils et temps d'exécution, offrant aux administrateurs informatiques une visibilité granulaire sur l'accumulation des dépenses.

Le cadre de Nadella : Capital token vs. Capital humain

Le directeur général de Microsoft, Satya Nadella, a récemment articulé un cadre plus large qui contextualise ce changement. Chaque entreprise doit construire ce qu'il a appelé le « capital token » — ses propres systèmes et capacités d'IA propriétaires — parallèlement au « capital humain », c'est-à-dire les connaissances, les relations et le jugement de sa main-d'œuvre. Il a soutenu que le capital humain ne se déprécie pas à mesure que le capital token augmente : « Sans direction humaine, vous ne faites que faire tourner du calcul à vide. »

Nadella a déclaré que le véritable test de la stratégie d'IA en entreprise est de savoir si une entreprise peut remplacer son modèle de base sous-jacent sans perdre les connaissances et capacités propriétaires qu'elle a accumulées. « C'est le test fondamental pour savoir si vous conservez le contrôle et la souveraineté dans l'ère à venir », a-t-il affirmé.

Cet avertissement portait une tension implicite : Nadella a mis en garde contre la concentration de toute la valeur dans une poignée de modèles dominants, comparant cela à la façon dont la mondialisation a vidé les économies industrielles. Pourtant, sa propre entreprise approfondit simultanément ses liens avec OpenAI et Anthropic tout en explorant une alternative open-source chinoise — un exercice d'équilibriste qui reflète les pressions sur les coûts auxquelles chaque acheteur d'IA en entreprise est confronté.

Pour les investisseurs, les implications sont claires. Les fournisseurs premium d'API comme OpenAI et Anthropic sont confrontés à une compression de leurs marges, car les entreprises exigent des alternatives moins chères, tandis que les hébergeurs de modèles open-source comme DeepSeek gagnent du terrain dans les processus d'achat. Les entreprises qui construisent des infrastructures de routage de modèles et d'optimisation des coûts — un intergiciel situé entre l'utilisateur et le modèle — pourraient capturer une valeur disproportionnée, alors que l'économie des tokens devient le critère d'achat central. Les actions Microsoft se négocient à environ 30 fois les bénéfices futurs ; la transition de Copilot Cowork pourrait faire économiser à l'entreprise des centaines de millions de dollars par an en coûts d'inférence si DeepSeek V4 est adopté, mais elle signale également que les marges de l'IA en entreprise dans l'ensemble du secteur se resserrent plus rapidement que ce que le pouvoir de fixation des prix de nombreux modèles peut supporter.

Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.