Uber a épuisé son budget IA 2026 en 4 mois à cause de Claude Code — et ce n'est que le début

Uber a épuisé son budget IA 2026 en 4 mois à cause de Claude Code

Intelligence Artificielle

18 mai 2026 — Lecture : ~8 min

Uber a épuisé son budget IA 2026 en 4 mois à cause de Claude Code — et ce n'est que le début

Quand 5 000 ingénieurs adoptent un outil plus vite que la direction financière ne peut le modéliser, le résultat est prévisible : le budget fond. Uber en a fait l'expérience en grandeur nature, et la leçon vaut bien plus que quelques millions de dollars de tokens consommés.

Quatre mois. Un budget annuel. Voilà le problème.

En avril 2026, la direction financière d'Uber a constaté quelque chose d'inhabituel : le budget alloué à l'IA pour toute l'année 2026 était déjà épuisé. Nous étions au quatrième mois de l'année. Il en restait huit. Ce n'était pas le résultat d'un projet fou, d'un recrutement massif ou d'un serveur qui aurait disjoncté. C'était simplement le résultat de 5 000 ingénieurs qui avaient trouvé un outil utile et l'avaient utilisé — massivement, quotidiennement, et bien au-delà de ce que quiconque avait anticipé.

Cet outil, c'est Claude Code, l'agent de codage développé par Anthropic. Et l'histoire d'Uber, révélée par Forbes le 17 mai 2026, est en train de devenir un cas d'école pour toutes les grandes entreprises technologiques du monde.

Claude Code : qu'est-ce que c'est, exactement ?

Claude Code est un agent IA développé par Anthropic, conçu pour assister les développeurs dans l'écriture, la révision, la correction et la génération de code. Ce n'est pas un simple outil d'autocomplétion. C'est ce qu'on appelle un agent agentique — un terme qui mérite qu'on s'y arrête.

Un agent agentique, c'est un outil IA capable d'exécuter des séquences d'actions de manière autonome : il peut lire un fichier, comprendre le contexte d'un projet, proposer une solution, tester cette solution, la corriger, et recommencer — sans que l'utilisateur n'ait à détailler chaque étape. C'est une différence fondamentale avec un chatbot classique. Et c'est précisément cette autonomie qui explique la consommation explosive de tokens — l'unité de base facturée par les fournisseurs d'IA comme Anthropic.

Chaque interaction avec Claude Code génère des dizaines, parfois des centaines de milliers de tokens. Multipliez cela par 5 000 ingénieurs, plusieurs heures par jour, sur quatre mois. Vous obtenez une facture que personne n'avait vue venir.

Les chiffres qui racontent tout

La progression de l'adoption de Claude Code chez Uber est, en soi, un phénomène remarquable. Elle n'a pas été pilotée par le haut. Elle n'a pas fait l'objet d'un déploiement planifié avec formation et communication interne. Elle s'est propagée organiquement, ingénieur par ingénieur, équipe par équipe.

Période	Indicateur	Valeur
Février 2026	Part des ingénieurs utilisant Claude Code	32 %
Mars 2026	Part classifiée "utilisateurs agentiques"	84 %
Printemps 2026	Ingénieurs utilisant des outils IA au quotidien	95 %
Printemps 2026	Part du code commité issu des outils IA	70 %

Ces chiffres sont à lire avec attention. Passer de 32 % à 84 % d'utilisateurs agentiques en un seul mois — de février à mars — c'est une vitesse d'adoption que très peu d'entreprises ont connue avec n'importe quel outil logiciel. Et atteindre 95 % en quelques semaines supplémentaires, c'est tout simplement une saturation totale de la base d'ingénieurs.

Le chiffre de 70 % du code commité provenant de l'IA est peut-être le plus structurant. Il signifie que chez Uber, au printemps 2026, l'essentiel de la production de code n'est plus le fait de mains humaines qui tapent des lignes une par une. Ce sont des agents qui génèrent, proposent, corrigent. Les ingénieurs valident, orientent, arbitrent. Le métier de développeur est en train de se redéfinir en temps réel.

Le vrai problème : la tarification token-based n'entre dans aucune case budgétaire connue

Pour comprendre pourquoi Uber n'a pas vu venir la situation, il faut comprendre comment fonctionne la facturation des LLM — les grands modèles de langage comme Claude. Ces modèles ne se paient pas comme un abonnement SaaS classique. On ne règle pas une licence annuelle par siège. On paye à l'usage, par token consommé.

Un token, pour simplifier, correspond à environ trois quarts d'un mot en anglais. Une requête simple à un modèle IA consomme quelques centaines de tokens. Une session de Claude Code sur un projet de taille moyenne, avec contexte, génération de code, tests et corrections, peut en consommer plusieurs centaines de milliers. Et un agent agentique, qui enchaîne les étapes de manière autonome, peut en dévorer des millions en une seule session complexe.

Le problème budgétaire en résumé

Un CFO sait modéliser le coût d'un abonnement GitHub Copilot ou d'une licence Jira. Il sait calculer le coût d'un serveur. Mais il n'existe pas encore de modèle financier standard pour estimer combien de tokens 5 000 ingénieurs vont consommer dans un mois si on leur donne accès à un agent aussi puissant que Claude Code. La consommation est non-linéaire, imprévisible, et croît avec l'adoption — ce qui est précisément l'inverse d'un coût fixe maîtrisable.

Pour rappel, le budget R&D total d'Uber s'élevait à 3,4 milliards de dollars en 2025. Le fait que le poste IA puisse être épuisé en quatre mois donne une idée de l'ampleur des sommes en jeu et, surtout, de la vitesse à laquelle les coûts peuvent s'emballer quand l'adoption devient virale en interne.

Ce que cela signifie pour votre entreprise

L'histoire d'Uber n'est pas une anomalie. C'est un signal d'alarme pour toute organisation qui déploie ou envisage de déployer des outils IA agentiques à grande échelle. Voici les questions concrètes que chaque direction devrait se poser aujourd'hui.

1. Votre gouvernance IA est-elle à la hauteur de la vitesse d'adoption ?

Chez Uber, l'adoption n'a pas été décidée par le comité exécutif. Elle est partie du terrain. C'est à la fois une bonne nouvelle — les ingénieurs trouvent l'outil genuinement utile — et un défi de gouvernance. Si votre politique IA ne prévoit pas de mécanismes de suivi de l'usage en temps réel, vous risquez de vous retrouver dans la même situation : découvrir le problème au moment où le budget est déjà consommé.

La gouvernance IA en 2026, ce n'est plus seulement une question de conformité ou de sécurité des données. C'est une question de pilotage financier opérationnel. Il faut des tableaux de bord, des alertes de consommation, des seuils d'approbation. Les outils existent, mais les processus internes ne suivent souvent pas.

2. Comment budgétiser une consommation non-linéaire ?

C'est le chantier le plus urgent pour les directions financières. La tarification à l'usage des LLM exige une nouvelle approche budgétaire. Quelques pistes concrètes que les équipes finance commencent à explorer :

Budgétisation par cohorte d'usage : plutôt que d'allouer un budget global, définir des enveloppes par équipe ou par type d'usage, avec un suivi hebdomadaire.
Modèles de consommation basés sur des phases pilotes : avant tout déploiement à grande échelle, mesurer la consommation réelle sur un groupe restreint pendant 4 à 6 semaines, puis extrapoler.
Clauses de plafonnement avec les fournisseurs : négocier des caps de consommation ou des contrats à volume fixe avec Anthropic, OpenAI ou d'autres, pour éviter les mauvaises surprises.
Intégration dans les coûts de production : traiter les tokens comme un coût variable de production — au même titre que le compute cloud — et non comme un poste R&D discret.

3. Le ROI : comment le mesurer quand 70 % du code vient de l'IA ?

C'est la question qui fâche, et pourtant c'est celle qui légitime tout le reste. Si 70 % du code commité chez Uber provient d'outils IA, cela signifie que la productivité de chaque ingénieur a probablement augmenté de manière significative. Mais de combien ? Et cette augmentation compense-t-elle le coût des tokens ?

Le calcul est complexe parce qu'il ne se fait pas en ligne droite. Un ingénieur qui utilise Claude Code ne produit pas seulement plus de lignes de code — il produit aussi potentiellement moins de bugs, documente mieux, passe moins de temps sur des tâches répétitives. La valeur créée dépasse la seule vélocité de production. Mais sans métriques claires définies en amont, il est très difficile de défendre ce ROI devant un comité financier.

Les entreprises qui s'en sortent le mieux sont celles qui ont défini, avant le déploiement, ce qu'elles allaient mesurer : temps moyen de livraison d'une fonctionnalité, taux de bugs en production, temps passé en revue de code, délai moyen de résolution d'incidents. Ces indicateurs existaient avant l'IA. Il suffit de les comparer avant et après.

La question que personne ne pose encore assez fort

Derrière le cas Uber, il y a une réalité plus large que l'industrie commence tout juste à articuler : nous entrons dans une période où les outils IA agentiques vont se déployer plus vite que la capacité des organisations à les gouverner, à les budgétiser et à en mesurer l'impact.

Ce n'est pas un jugement négatif sur la technologie. Claude Code est visiblement utile — personne ne force 95 % des ingénieurs d'Uber à l'utiliser tous les jours si l'outil ne tient pas ses promesses. Mais l'utilité d'un outil ne dispense pas de le piloter.

Le modèle économique des LLM — payer à la consommation, par token — est fondamentalement différent de tout ce que les entreprises ont géré jusqu'ici en matière de logiciel. Il ressemble davantage à une facture d'électricité ou de bande passante qu'à une licence logicielle. Et les directions financières, les DSI et les DAF n'ont pas encore tous intégré cette réalité dans leurs processus.

Uber n'est pas seul dans ce cas. C'est simplement l'une des premières grandes entreprises à en parler ouvertement. D'autres vivent la même chose en silence, découvrant leurs dépassements budgétaires trimestre après trimestre.

Ce que l'on peut retenir de tout cela

L'aventure d'Uber avec Claude Code illustre trois réalités qui vont définir la prochaine phase de l'adoption IA en entreprise.

Premièrement, les agents agentiques changent l'échelle de la consommation. Un chatbot consomme peu. Un agent qui raisonne, itère et exécute des tâches complexes consomme un multiple de tokens à chaque session. La différence n'est pas marginale, elle est d'un ordre de grandeur.

Deuxièmement, l'adoption virale n'attend pas les processus internes. Quand un outil est genuinement utile, les gens l'utilisent. C'est une bonne nouvelle pour la productivité. C'est un défi pour la gouvernance. Les deux peuvent coexister, à condition de le prévoir.

Troisièmement, la budgétisation IA n'est plus une option. Ce n'est plus un sujet pour les seules équipes technique ou les directions innovation. C'est un sujet financier et stratégique qui concerne le CFO, le DAF, la direction générale. Les entreprises qui ne mettent pas en place une approche rigoureuse de pilotage de leurs dépenses IA en 2026 vont répliquer l'expérience d'Uber — parfois avec des budgets moins solides pour encaisser le choc.

Sources

Forbes — Uber Burns Its 2026 AI Budget In Four Months On Claude Code (17 mai 2026)

Et vous — votre organisation a-t-elle déjà défini comment elle allait piloter ses dépenses IA agentiques ? C'est probablement la question budgétaire la plus urgente de l'année 2026.