Meta implémente des contrôles de dépenses IA assistés par l’IA après un pic d’utilisation
Meta a déployé un système centralisé de surveillance et de contrôle des coûts liés à l'IA, suite à la découverte que ses dépenses internes en IA dépassaient les prévisions. L'entreprise a envoyé une note à ses quelque 6 000 employés, détaillant de nouveaux plafonds de dépenses, des restrictions budgétaires et des limitations sur l'utilisation des jetons IA. Via la plateforme AI Gateway, les équipes obtiennent une vue consolidée de l'utilisation et reçoivent des alertes automatiques en cas de pics de dépenses anormaux. La gestion structurée des jetons devrait être pleinement opérationnelle d'ici là.
Les conséquences de l'optimisation des jetons
Le changement d'orientation chez Meta, qui passe de la promotion de l'IA au contrôle de son utilisation, illustre une tendance récurrente au sein des entreprises américaines. Auparavant, la société incitait ses employés à utiliser l'IA en les encourageant à établir des classements internes (« Claudeonomics », du nom du système d'IA d'Anthropic). Meta n'utilise plus ce système.
Cette tendance plus générale porte un nom : le « tokenmaxxing », qui consiste à utiliser le maximum de jetons d’IA possible, quelle qu’en soit la raison, que ce soit pour gonfler artificiellement les indicateurs d’adoption internes ou simplement pour les consommer. Amazon a connu le même phénomène après que ses employés ont mis en place un classement pour tracl’utilisation des jetons. L’entreprise l’a cependant retiré fin mai, craignant qu’il n’entraîne des dépenses inutiles, rapporte Business Insider.
L'exemple d'Uber illustre la rapidité avec laquelle les coûts peuvent s'envoler. La société de VTC a épuisé l'intégralité de son budget de développement d'IA prévu pour 2026 dès avril, soit quatre mois seulement après le début de l'année. Andrew Macdonald, directeur des opérations d'Uber, a déclaré à Rapid Response que l'entreprise peinait à traduire ses dépenses symboliques en résultats concrets. « Ce lien n'est pas encore établi, n'est-ce pas ? », a-t-il affirmé. « Il est très difficile de faire le lien entre une simple statistique et le fait de dire : "Ça y est, nous produisons réellement 25 % de fonctionnalités utiles supplémentaires pour les consommateurs." »
Un problème de coûts que l'industrie n'a pas résolu
Les difficultés budgétaires dépassent largement le cadre de la Silicon Valley. Selon une enquête de KPMG initialement publiée par le Wall Street Journal, seules 26 % des entreprises ont une vision globale de leurs coûts liés à l'IA, tandis que 50 % en ont une visibilité partielle et 22 % n'en ont aucune ou ne découvrent leurs dépenses qu'après réception des factures. Comme l'a souligné Steve Chase, responsable mondial de l'IA chez KPMG, l'entreprise aurait aidé des clients ayant épuisé leurs budgets annuels de tokenisation ou de cloud computing en quelques mois seulement.
Microsoft a récemment retiré la quasi-totalité des licences directes de Claude Code et a incité ses ingénieurs à utiliser son interface de ligne de commande GitHub Copilot, rapporte Fortune, six mois seulement après avoir mis l'outil Anthropic à la disposition de ses employés. Cette décision fait suite à une utilisation par les employés qui a connu une croissance plus rapide que prévu.
Des considérations économiques suggèrent que les prévisions initiales concernant la rentabilité rapide de l'IA grâce aux économies de main-d'œuvre étaient trop optimistes. Bryan Catanzaro, vice-président de NVIDIAdent de l'apprentissage profond appliqué, a révélé à Axios que les coûts de calcul de son équipe dépassent déjà le coût de l'emploi. Goldman Sachs estime que l'IA autonome pourrait multiplier par 24 la consommation de tokens d'ici 2030, avec des taux de consommation mensuels atteignant 120 quadrillions de tokens, malgré la baisse du prix unitaire des tokens.
De plus, Gartner prévoit que la baisse du coût des jetons ne se traduira pas par une réduction du prix des applications d'IA d'entreprise, car les algorithmes d'IA agentielle utilisent un nombre de jetons bien plus élevé par tâche, tandis que les fournisseurs conserveront probablement l'intégralité des économies. « Les directeurs des produits ne doivent pas confondre la déflation des jetons de base avec la démocratisation du raisonnement de pointe », a déclaré Will Sommer, analyste directeur senior chez Gartner. Auparavant, Cryptopolitan avait rapporté que Zuckerberg avait admis que Meta avait commis des « erreurs » dans sa transformation en matière d'IA.
À quoi peuvent s'attendre les employés de Meta ?
D'après les informations recueillies, une note interne révèle que Meta entend dissuader ses employés d'utiliser des logiciels externes de programmation d'IA et les inciter à privilégier son propre assistant, MetaCode (anciennement Devmate). Ces changements seront mis en œuvre dans les semaines à venir.
Dans le même temps, les efforts de Meta pour réduire les coûts liés à l'IA s'accompagnent de changements organisationnels importants. En mars dernier, Meta envisageait des suppressions d'emplois concernant au moins 20 % de ses effectifs, soit environ 79 000 employés. Ces réductions sont en partie dues à des investissements dans l'infrastructure d'IA d'une valeur d'environ 600 milliards de dollars d'ici 2028.
Le PDG d'OpenAI, Sam Altman, a très bien mis en lumière ce défi pour le secteur. Il a déclaré : « C'est la critique la plus juste qu'on puisse adresser à l'IA actuellement. On entend des entreprises dire : “Je dépense des sommes colossales en IA.” Et je sais que des choses formidables se produisent, mais je sais aussi qu'il y a énormément de gaspillage. »
Pour l'économie mondiale, la question est de savoir si les budgets des entreprises consacrés à l'IA vont setracavant même que cette technologie ne tienne ses promesses de productivité, ou si la baisse des prix des jetons et l'amélioration des outils permettront d'abord de combler l'écart. La réponse influencera les embauches, les investissements et la dynamique concurrentielle dans tous les secteurs d'activité pendant des années.
Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.