
Le PDG de Palantir, Alex Karp, a publiquement critiqué le modèle économique basé sur les tokens utilisé par OpenAI et Anthropic, soutenant que la manière dont les principaux fournisseurs de modèles facturent l’usage de l’IA reflète un problème plus profond sur le marché. Les propos, rapportés par CNBC, sont remarquables parce qu’ils viennent du dirigeant d’une entreprise qui défend une approche différente auprès des clients d’entreprise et du secteur public : l’IA comme système opérationnel lié à des résultats, et non comme un simple accès à un modèle mesuré par tokens.
L’information immédiate porte moins sur un lancement de produit que sur un clivage stratégique grandissant dans l’IA. D’un côté se trouvent les entreprises de modèles comme OpenAI et Anthropic, dont les API et les produits de chat sont généralement tarifés à l’usage. De l’autre, des fournisseurs de plateformes comme Palantir, qui cherchent à se positionner comme la couche reliant les modèles aux données sensibles, aux workflows métier et aux contrôles de déploiement. La critique de Karp compte parce qu’elle capture une tension à laquelle de nombreux acheteurs sont déjà confrontés : les dépenses en IA d’entreprise doivent-elles se concentrer sur la consommation brute de modèles ou sur des systèmes logiciels qui gèrent la fiabilité, le coût, la sécurité et l’intégration aux workflows ?
L’extrait disponible de CNBC n’inclut pas les propos complets de Karp, le cadre dans lequel il les a tenus, ni des exemples détaillés venant étayer sa critique. Cela limite la portée du reportage sur son argument précis. Mais même à partir du seul titre, l’idée est claire : Palantir ne remet pas seulement en cause ses concurrents, mais aussi l’économie devenue standard dans une grande partie de l’IA générative.
L’attaque de Karp arrive à un moment où les acheteurs d’entreprise dépassent les premières phases d’expérimentation avec les grands modèles de langage et posent des questions plus difficiles sur la prévisibilité des coûts. La tarification au token a aidé des entreprises comme OpenAI et Anthropic à étendre l’accès aux modèles de pointe parce qu’elle relie l’usage à la demande de calcul. Pour les développeurs, c’est une manière simple d’acheter de la capacité de modèle via une API. Pour les équipes financières et les DSI, en revanche, le suivi au token peut devenir difficile à prévoir une fois que les fonctionnalités d’IA se déploient dans plusieurs produits, équipes et agents.
C’est là que Palantir a tenté de se différencier. Plutôt que de concurrencer de front comme une entreprise de modèles de fondation, Palantir a mis en avant sa valeur autour de l’orchestration, de la gouvernance et du déploiement au sein d’institutions complexes. Son récit plus large sur l’IA d’entreprise s’est articulé autour de plateformes comme AIP, acronyme de Artificial Intelligence Platform, que Palantir a présentée comme un moyen d’opérationnaliser les modèles dans des environnements réels avec des contrôles sur l’accès aux données et les workflows de décision.
Les propos de Karp se lisent donc comme plus qu’une simple pique rhétorique. Ils s’alignent sur l’argument de longue date de Palantir selon lequel l’IA d’entreprise ne peut pas se réduire à l’accès à un modèle puissant. Dans les secteurs où existent de vastes ensembles de données, des contraintes réglementaires ou des chaînes de décision à haut risque, le modèle de tarification est indissociable de la conception du système. Si l’économie de base récompense une consommation continue de tokens, les acheteurs peuvent craindre que l’architecture logicielle soit façonnée autour de l’augmentation de l’usage plutôt que de l’efficacité.
Le débat sur la tarification est en réalité une lutte pour savoir où se concentre la valeur dans la pile IA. OpenAI et Anthropic se situent près de la couche des modèles, où les améliorations de performance et les nouvelles capacités peuvent justifier des tarifs premium. La facturation basée sur les tokens est un prolongement naturel de ce modèle économique, car elle transforme les appels au modèle en revenus récurrents. Elle permet aussi aux fournisseurs de segmenter leurs offres selon la qualité du modèle, la longueur de contexte et le débit.
Palantir vient d’une tradition logicielle différente. Ses contrats d’entreprise et gouvernementaux ont historiquement mis l’accent sur le déploiement, l’intégration et les logiciels spécifiques à la mission. De ce point de vue, des frais liés à l’usage du modèle peuvent sembler constituer une base instable pour des budgets d’IA d’entreprise à long terme, surtout lorsque les charges de travail sont variables et que les clients apprennent encore quelles tâches doivent être automatisées, et lesquelles ne le doivent pas.
Ce n’est pas la première fois que le marché de l’IA se divise entre économie de l’infrastructure et économie des applications. Le cloud computing a traversé une phase similaire, les clients payant d’abord pour des ressources brutes avant de réclamer des services gérés de niveau supérieur et de meilleurs contrôles des coûts. Dans l’IA, la distinction est plus nette parce que les produits les plus visibles sont des systèmes conversationnels, tandis que la décision d’achat en entreprise dépend souvent de fonctionnalités beaucoup moins visibles comme la gouvernance, l’auditabilité, la gestion de la latence et le routage des modèles.
Cela rend les propos de Karp stratégiquement utiles pour Palantir. Si les acheteurs d’entreprise deviennent sceptiques face aux dépenses ouvertes en tokens, les entreprises qui intègrent l’IA dans des systèmes de niveau supérieur pourraient gagner en levier. Mais l’inverse est également vrai : si OpenAI et Anthropic continuent à améliorer rapidement la qualité de leurs modèles, beaucoup de clients pourraient accepter la tarification au token comme le prix à payer pour accéder aux meilleures capacités.
Le fait le plus solidement confirmé dans la source disponible est que CNBC a rapporté que Karp « bashes OpenAI, Anthropic token model » et l’a cité disant « Something has gone completely wrong. » Sans le texte complet de l’article, il n’y a pas suffisamment d’éléments pour affirmer avec fiabilité le contexte exact, ni pour savoir si ces commentaires ont été faits lors d’une interview, d’une prise de parole liée aux résultats financiers, d’une conférence ou d’un autre cadre public.
Il n’y a pas non plus assez d’éléments dans cette source seule pour dire si Karp a proposé une structure tarifaire alternative spécifique, cité des exemples de clients, ou fait directement référence à des produits d’OpenAI ou d’Anthropic. Ces détails compteraient, car « modèle de token » peut désigner un mécanisme de facturation, mais Karp critiquait peut-être aussi des incitations plus larges liées à la manière dont les entreprises d’IA mesurent la valeur.
Il est important de distinguer ce qui est confirmé par le reportage de ce qui relève de l’interprétation du marché. CNBC semble avoir établi que Karp a formulé cette critique. La conclusion plus large — à savoir que Palantir profite de ce moment pour renforcer son positionnement dans l’IA d’entreprise — est une analyse fondée sur la stratégie de marché connue de Palantir, et non sur une citation directe de l’extrait source fourni.
De même, suggérer que la tarification au token échoue sur le marché irait au-delà des preuves disponibles ici. OpenAI et Anthropic restent des fournisseurs centraux de l’IA générative, et la facturation au token est encore largement utilisée dans les API et les outils pour développeurs. L’information n’est pas que le modèle s’est effondré, mais qu’un dirigeant influent du logiciel d’entreprise affirme publiquement qu’il ne correspond pas aux besoins des clients.
Pour les créateurs, les propos de Karp soulignent un problème pratique : la conception du produit détermine de plus en plus les coûts cloud et les coûts de modèle. Les équipes qui bâtissent sur OpenAI ou Anthropic peuvent livrer rapidement, mais elles héritent aussi de l’économie des appels d’inférence fréquents, des longues fenêtres de contexte et des agents IA en plusieurs étapes. Dans les produits grand public, cela peut rester gérable si l’engagement est élevé et que les marges le permettent. Dans l’IA d’entreprise, surtout pour les systèmes internes de productivité, il peut être plus difficile de prouver le retour de chaque workflow gourmand en tokens.
Cela crée une pression pour optimiser l’architecture. Les équipes peuvent répondre en utilisant plus souvent des modèles plus petits, en réservant les modèles premium aux tâches les plus difficiles, en ajoutant des couches de cache, en resserrant les prompts, ou en transférant certaines charges de travail vers des alternatives à poids ouverts. D’autres peuvent se tourner vers des fournisseurs d’orchestration qui promettent de meilleurs contrôles sur la sélection des modèles, la recherche de contexte et la gestion des politiques. En ce sens, la critique de la tarification au token pourrait accélérer la demande pour des plateformes qui abstraient l’usage du modèle plutôt que d’exposer chaque coût d’inférence directement au client.
Pour les entreprises, le message est encore plus concret. Acheter de l’IA n’est plus seulement une question de savoir quel modèle fonctionne le mieux dans une démonstration. C’est un sujet d’approvisionnement qui implique la prévisibilité budgétaire, la dépendance vis-à-vis des fournisseurs, la sécurité et la responsabilité opérationnelle. Une équipe peut apprécier OpenAI pour l’aide au codage, Anthropic pour des cas d’usage sensibles aux politiques, et Palantir pour le déploiement dans des systèmes internes. Ces choix interagissent de plus en plus entre eux.
C’est particulièrement pertinent pour les entreprises qui évaluent les agents IA. Les agents peuvent multiplier les appels au modèle en arrière-plan parce qu’ils planifient, récupèrent du contexte, appellent des outils et vérifient les résultats. Une structure tarifaire fondée sur les tokens peut donc provoquer des pics de coûts qui ne sont pas évidents pendant les phases pilotes. Cela ne rend pas le modèle faux, mais cela rend l’observabilité et la conception des workflows plus importantes.
La critique de Palantir résonnera sans doute surtout chez les acheteurs déjà frustrés par des factures d’inférence imprévisibles. Cela dit, les fournisseurs de modèles ont leur propre défense : la tarification au token reflète l’usage réel et évite d’imposer à de petits utilisateurs des contrats fixes coûteux. Pour certaines organisations, cette flexibilité est une qualité, pas un défaut.
Cette histoire repose sur une base de source étroite. Le seul élément disponible est un article de CNBC relayé via Google News, et le texte extrait n’inclut pas l’intégralité de l’article. En conséquence, l’article peut rapporter de manière responsable que CNBC indique qu’Alex Karp a critiqué l’approche basée sur les tokens associée à OpenAI et Anthropic, et qu’il a employé la formule « Something has gone completely wrong. »
Au-delà de cela, la prudence s’impose. Il n’existe ici aucune preuve directe d’un impact financier, d’une réaction de clients ou d’un nouveau mouvement produit chez Palantir lié à cette critique. Il n’y a pas non plus de revendications sur les benchmarks ni de métriques d’adoption dans la source fournie. Toute comparaison entre Palantir, OpenAI et Anthropic dans cet article concerne donc le positionnement des modèles économiques plutôt qu’une performance ou une part de marché vérifiée.
Le premier signal à surveiller est de savoir si Palantir transforme la critique de Karp en argument commercial plus explicite dans AIP et dans ses messages de vente autour de l’IA d’entreprise. Si l’entreprise commence à mettre davantage l’accent sur la gouvernance des coûts et sur des structures tarifaires alternatives, cela suggérerait qu’il ne s’agit pas seulement d’un commentaire, mais d’une offensive de marché coordonnée.
Un deuxième signal concerne la manière dont OpenAI et Anthropic adaptent leurs offres d’entreprise. Les deux sociétés proposent déjà un mélange d’API et de produits orientés business, et une pression durable de grands clients pourrait encourager davantage d’options à forfait, par poste ou hybrides en complément de la facturation au token.
Troisièmement, il faudra observer la manière dont les agents IA seront vendus aux entreprises au cours des prochains trimestres. Si les acheteurs deviennent plus sensibles aux coûts d’inférence cachés, les fournisseurs capables de montrer une économie unitaire claire et des contrôles d’usage pourraient prendre l’avantage sur ceux qui s’appuient sur de larges promesses d’automatisation.
Enfin, il sera utile de suivre si d’autres PDG de logiciels d’entreprise rejoignent Karp pour critiquer la tarification purement à l’usage des grands modèles de langage. Si cela se produit, le débat pourrait passer d’un point de communication de Palantir à une correction plus large du marché.
Les propos de Karp comptent parce qu’ils mettent en évidence un problème structurel que le marché de l’IA n’a pas encore totalement résolu : les entreprises qui créent les modèles les plus avancés et celles qui déploient l’IA dans de vraies institutions optimisent souvent pour des choses différentes. Les fournisseurs de modèles veulent une monétisation flexible liée à un usage intensif en calcul. Les entreprises veulent des coûts prévisibles, de la gouvernance et des systèmes qui résolvent les problèmes métier sans transformer chaque workflow en compteur ouvert.
L’issue la plus probable n’est pas la fin de la tarification au token. C’est un marché plus stratifié. OpenAI et Anthropic continueront de vendre l’accès aux modèles là où la performance est déterminante. Mais à mesure que l’IA d’entreprise mûrit, une plus grande partie de la valeur pourrait se déplacer vers l’orchestration, les contrôles et les workflows packagés — des domaines dans lesquels Palantir, et d’autres entreprises qui construisent autour du déploiement de l’IA en entreprise, pensent avoir un avantage. La vraie question n’est pas de savoir si les tokens disparaissent. C’est de savoir quels fournisseurs peuvent rendre la consommation de tokens économiquement gérable dans un logiciel de production.