L’ère du « tokenmaxxing » est terminée : ces nouveaux outils veulent changer les règles du jeu de l’IA
Face à des factures imprévisibles, une nouvelle génération d’outils s’impose pour reprendre le contrôle, tandis que l’open source et les modèles low cost rebattent déjà les cartes du marché de l’IA.
Pendant des mois, dans la Silicon Valley, consommer toujours plus d’IA était presque devenu un objectif en soi. Cette course à l’usage, baptisée « tokenmaxxing », reposait sur une idée simple : plus un salarié utilisait des modèles comme GPT ou Claude, plus il était productif. Cependant, cette logique est en train de se fisr, rattrapée par une réalité beaucoup plus concrète : la facture.
Derrière les promesses d’efficacité, l’économie des tokens s’avère bien plus instable que prévu. Plusieurs entreprises découvrent que leurs coûts explosent, non pas parce que les prix unitaires augmentent, mais parce que les usages deviennent plus complexes. Requêtes plus longues et automatisations multiples conduisent à une consommation accrue de tokens, souvent sans visibilité claire. Une question simple revient alors en boucle : « combien de tokens me reste-t-il ? » et surtout, combien cela va-t-il coûter à la fin du mois.
Le problème est d’autant plus aigu que les modèles économiques évoluent. La transition vers une tarification à l’usage rend les dépenses imprévisibles. Selon un article de Reuters, certaines entreprises, comme Uber, ont dû freiner l’adoption d’outils d’IA après avoir épuisé leur budget annuel en quelques mois.
Face à cette dérive, un changement de stratégie s’opère et de nouveaux acteurs émergent. De nombreux dirigeants de la tech, comme chez Microsoft, plaident pour une approche plus pragmatique : réserver les modèles les plus puissants aux tâches critiques et basculer le reste vers des alternatives moins coûteuses.
Ce virage ouvre un boulevard à l’open source et à la concurrence chinoise. Des modèles comme ceux de DeepSeek ou le récent GLM-5.2, présenté comme capable de rivaliser avec les meilleurs modèles occidentaux, rebattent les cartes. L’écart de performance se réduit, et l’argument du prix devient décisif.
En parallèle, un écosystème d’optimisation émerge. Des outils open source proposent de compresser les tokens avant même qu’ils n’atteignent le modèle, réduisant drastiquement la facture sans sacrifier les résultats. D’autres s’appuient sur une logique de « routing », qui consiste à choisir le bon modèle au bon moment. C’est le cas d’OpenRouter, une plateforme permettant aux entreprises de faire transiter leurs requêtes vers différents modèles d’IA afin de choisir l’option la plus performante et la moins coûteuse.
Cette pression sur les prix commence également à reconfigurer la stratégie des géants de l’IA. OpenAI et Anthropic envisagent des baisses significatives de leurs tarifs, notamment sur les tokens, dans un contexte de concurrence accrue et à l’approche d’éventuelles introductions en bourse. Le risque est évident : déclencher une guerre des prix qui rognerait les marges, au moment même où les investisseurs commencent à s’impatienter du retour sur investissement de l’IA.
Source : Numerama
