En février 2024, Klarna annonçait qu'un assistant propulsé par OpenAI assurait le travail de 700 agents de service client à temps plein. En 2025, l'entreprise affirmait que ce chiffre était passé à 853. En mai 2025, le PDG de Klarna a déclaré au Financial Times que la société avait recommencé à embaucher des humains, invoquant des plaintes sur la qualité et les limites de l'automatisation pure. Cette trajectoire — annonce, escalade, repli partiel — est l'histoire la plus citée dans toute discussion sur le remplacement du support client par l'IA, et c'est aussi la plus mal comprise. Lue comme un triomphe, elle exagère. Lue comme un échec, elle sous-estime. Lue comme un outil, elle dit quelque chose de précis : le coût de substituer un agent n'est pas un seul chiffre, c'est une distribution répartie entre des classes de substitution, et ces classes se comportent très différemment.
Cet article détaille les quatre classes de substitution que Wagecore utilise pour le travail de support client, les fourchettes de coûts assorties de bandes de confiance à l'intérieur de chacune, et les choix méthodologiques derrière les chiffres.
Le cas Klarna, lu attentivement
Le communiqué original Klarna/OpenAI de février 2024 rapportait que l'assistant IA résolvait 2,3 millions de conversations lors de son premier mois — environ deux tiers des tickets de chat entrants — avec des scores de satisfaction client statistiquement indistinguables de ceux des agents humains et un temps de résolution moyen passé de 11 minutes à moins de 2. C'était le titre. Les détails du suivi, essentiellement révélés dans les reportages de 2025 de Yahoo Finance et du Financial Times, comptent davantage : le chiffre de 700 agents était une comparaison avec la capacité d'agents sous contrat que l'assistant a remplacée, et non avec les propres salariés de Klarna. Le chiffre de 853 annoncé plus tard en 2025 utilisait la même méthode de comparaison. Et le repli partiel de 2025 n'était pas « l'IA ne fonctionne pas » — c'était « les tickets résiduels que l'IA ne peut pas résoudre sont plus difficiles, plus chargés émotionnellement, et exigent des humains mieux payés que la référence des agents sous contrat ».
Ce que ce cas montre réellement, ce sont les classes de substitution qui se séparent dans le monde réel. La classe volume élevé, réinitialisation de mot de passe, statut-de-ma-commande est allée presque entièrement à l'IA et y est restée. La classe litige-et-dépannage est allée majoritairement à l'IA avec une boucle de révision humaine, et y est restée aussi. La classe escalade complexe est d'abord allée à l'IA, puis partiellement revenue aux humains. Et la classe relation-ou-cas-limite-inédit n'a en réalité jamais bougé.
Ce n'est pas un échec de la technologie. C'est la carte de substitution qui s'affirme.
Quatre classes de substitution
Wagecore classe les tâches de support client en quatre classes fondées sur des propriétés observables de coût et de fiabilité — pas sur le fait qu'une tâche « semble automatisable ». Les classes sont :
Substitution totale. Triage de tickets de niveau 1, réinitialisations de mot de passe, recherches de statut de commande, réponses aux FAQ, traitement de remboursements simples dans les limites de la politique. Ces tâches ont des distributions d'entrées étroites, des exigences de fiabilité élevées seulement sur un petit ensemble de modes de défaillance, et un faible coût d'erreur. L'IA les traite de bout en bout sans humain dans le chemin de résolution. Bande de confiance : 2 à 8 $ par ticket résolu en utilisant une API de modèle de pointe plus un habillage éditeur (Intercom Fin, Ada, Forethought se situent tous dans cette fourchette selon les tarifs publics jusqu'en 2025). Le bas de la fourchette suppose un éditeur bien réglé ; le haut suppose une solution prête à l'emploi avec récupération d'information mais sans réentraînement. Équivalent humain : 15 à 25 $ par ticket pour un agent de centre de contact externalisé, selon les guides de tarifs publics publiés par Crescendo et le marché intermédiaire du BPO. Le ratio favorise l'IA d'environ 3 à 5×, et l'écart est stable.
Substitution supervisée. Litiges de facturation, dépannage produit où la configuration du client importe, changements de compte avec cas limites de politique, réclamations simples. L'IA propose une résolution, un humain la révise avant qu'elle ne parte au client — soit au cas par cas pour les cas à faible confiance, soit via un audit groupé pour les cas à confiance élevée. La structure de coût est nettement différente de la substitution totale : vous payez le coût d'inférence de l'IA plus une fraction du temps d'un agent par ticket, où la fraction dépend de votre politique d'audit. Bande de confiance : 5 à 14 $ par ticket résolu. La large fourchette reflète le choix entre audit lourd (chaque ticket révisé) et audit léger (échantillonné). Équivalent purement humain : 18 à 30 $ par ticket — ces tickets prennent plus de temps que ceux de la substitution totale, la référence humaine augmente donc aussi. Le ratio favorise l'IA de 2 à 3×, et se dégrade à mesure que vous resserrez la boucle d'audit.
Augmentation. Escalades complexes, situations émotionnelles (remboursements liés à des circonstances médicales ou familiales, réclamations sur des défaillances de service), enquêtes multi-systèmes, cas nécessitant l'attention de la direction. L'IA assiste l'humain — rédaction de réponses, extraction de l'historique, résumé des tickets antérieurs, suggestion de précédents de politique — mais n'agit pas. L'humain est propriétaire de la résolution. Le coût est essentiellement « salaire humain plus un abonnement à un assistant IA par poste ». Bande de confiance : 20 à 45 $ par ticket. La contribution de l'IA apparaît en débit, pas en effectif : un agent expérimenté doté d'un bon copilote traite peut-être 30 % de tickets en plus par poste. Équivalent purement humain : 25 à 60 $ par ticket. Ratio : une réduction de coût modeste, de l'ordre du pourcentage à un chiffre, l'avantage s'exprimant par une résolution plus rapide plutôt que par une baisse d'effectif.
Résidu non substituable. Gestion de la relation avec les comptes stratégiques, cas limites inédits qui ne correspondent à aucun schéma antérieur, correspondance réglementaire ou juridique, incidents de crise (réseaux de fraude, gestion de pannes massives, réclamations sensibles pour l'image). L'IA peut être dans la boucle comme outil de recherche, mais le chemin de résolution est entièrement humain et implique souvent plusieurs humains (un agent, un manager, parfois le service juridique). Coût : 50 à 200 $+ par ticket selon la durée et l'ancienneté. Il n'y a pas de référence IA à laquelle se comparer, car la probabilité de substitution est effectivement nulle aux capacités actuelles. Le rappel partiel d'agents humains chez Klarna en 2025 s'est produit surtout à l'intérieur de cette classe et à la limite supérieure de l'Augmentation — précisément la classe où la confiance de l'IA était la plus faible et le coût d'une mauvaise réponse le plus élevé.
La référence humaine, en coût complet
Les chiffres de coût par ticket ci-dessus reposent sur une référence humaine qui mérite elle-même une bande de confiance. Les données 2025 de ZipRecruiter pour « Customer Support Representative » aux États-Unis montrent une base annuelle moyenne d'environ 42 000 $, avec une fourchette du 25e au 75e percentile de 34 000 à 50 000 $ selon la géographie et l'ancienneté. En coût complet — avantages sociaux, charges patronales, équipement, frais d'encadrement, coût de remplacement lié au turnover, amortissement de la formation — le multiplicateur typique est de 1,35 à 1,55×, portant le coût annuel chargé à environ 57 000 à 77 000 $. Divisez par 1 800 à 2 000 heures productives par an et vous obtenez 28 à 43 $ par heure-agent chargée. À un temps de traitement typique du secteur de 8 à 14 minutes par ticket sur l'ensemble du mix, cela produit le chiffre de 15 à 25 $ par ticket pour le travail routinier de niveau 1 et le chiffre de 25 à 60 $ pour les tickets complexes cités plus haut.
Les tarifs du BPO externalisé — le guide publié par Crescendo, les références du marché intermédiaire des cabinets d'analyse de centres de contact — sont inférieurs à cela sur la base du coût par ticket (6 à 15 $ pour la voix ou le chat de niveau 1 dans les géographies à bas coûts) mais ne devraient pas être lus comme la référence humaine sauf si l'alternative IA est comparée au même arrangement offshore. La comparaison économiquement honnête met en regard le comparable avec le comparable : interne contre interne, BPO contre BPO, et IA contre le coût humain qu'elle remplace réellement à l'intérieur de cette organisation. Mélanger les comparaisons, c'est ainsi que l'on obtient les affirmations de réduction de coûts de 10× qui ne survivent pas au premier trimestre d'exploitation.
L'implication pour le calcul par classe de substitution : dans un environnement interne à coût élevé, le ratio de 3 à 5× de la Substitution totale se démultiplie parce que la référence humaine est haute. Dans un environnement BPO à bas coût, la même technologie produit un ratio de 1,5 à 2,5× parce que la référence humaine est déjà basse. La technologie est constante ; les économies ne le sont pas.
Pourquoi des bandes de confiance, et non des estimations ponctuelles
Un chiffre unique en dollars par ticket est la réponse la plus nette possible, et elle est presque toujours fausse. Deux raisons.
D'abord, la distribution des entrées de chaque classe varie énormément d'une entreprise à l'autre. Un mix de tickets de fintech grand public penche fortement vers la Substitution totale en haut de l'entonnoir ; une file de support B2B SaaS est chargée en Augmentation parce que les tickets font référence à des configurations propres au client. La même affirmation « un agent IA remplace un humain » peut correspondre à une réduction de coût de 4× dans une entreprise et de 1,2× dans une autre, non parce que la technologie diffère mais parce que la distribution du travail diffère.
Ensuite, la tarification de l'IA bouge. Le coût par jeton des modèles de pointe a chuté d'environ 10× entre début 2024 et mi-2025. Les habillages éditeurs n'ont pas baissé au même rythme, parce que la structure de coût d'un Intercom Fin ou d'un Ada n'est pas de la pure inférence de modèle — c'est de la récupération d'information, de la marge éditeur, de l'effort commercial et de l'intégration. Le bas de chaque fourchette suit l'inférence brute ; le haut suit la tarification éditeur. L'écart entre les deux se resserre avec le temps mais n'est pas nul.
Nous publions des bandes de confiance parce que les estimations ponctuelles créent l'illusion de certitude que le cas Klarna a explicitement contredite. Le chiffre de 700 agents était une estimation ponctuelle, et il n'a pas survécu au contact avec la distribution des tickets résiduels.
La méthodologie Wagecard derrière ces chiffres
La Wagecard de Wagecore traite les rôles de support client comme elle traite tout autre rôle : comme une moyenne pondérée entre classes de substitution, chaque classe étant notée sur la capacité, la fiabilité, le coût d'erreur et le coût de supervision. Les quatre classes ci-dessus se rattachent à notre frontière standard — la Substitution totale correspond à notre cellule Replaceable, la Substitution supervisée à AI-augmented, l'Augmentation à Human-led-AI-assisted, le Résidu non substituable à Human-critical.
La vue Investissement sur une fonction de support client se lit donc comme un calcul de VAN, pas comme un ratio unique. Entrées : distribution du volume de tickets entre les quatre classes, coût actuel purement humain par classe, coût attendu IA-plus-humain par classe avec une politique d'audit choisie, coûts de bascule (intégration éditeur, construction de l'index de récupération, contrats de réentraînement), et un taux d'actualisation ajusté du risque qui tient compte de la possibilité que la tarification ou la qualité de l'éditeur change en cours de contrat. Le TRI sur les files chargées en substitution totale est élevé — typiquement 80 %+ sur un horizon d'un an aux fourchettes ci-dessus. Le TRI sur les files chargées en augmentation est modeste. La période de retour varie de moins d'un trimestre à plus de deux ans selon la classe qui domine.
Ce n'est pas une boîte noire. Les classes de substitution, les fourchettes de coûts et la pondération sont toutes publiées dans notre méthodologie. Nous ne réajustons pas rétroactivement les chiffres antérieurs quand notre méthodologie évolue : une Wagecard calculée sous la v1 reste une Wagecard v1, avec les chiffres de la v1, même si la v2 met à jour les fourchettes. La raison est que le coût d'une décision de substitution se paie sur les chiffres connus au moment de la décision — réajuster réécrit l'histoire d'une façon qui fait paraître les décisions antérieures meilleures ou pires qu'elles ne l'étaient lorsqu'elles ont été prises.
Lire la trajectoire Klarna à travers les classes
Avec les quatre classes en main, la séquence annonce-escalade-repli partiel de Klarna se lit clairement :
Les chiffres de 700 et 853 agents captaient le déplacement de la Substitution totale et de l'essentiel de la Substitution supervisée. Ceux-là sont réels, le calcul tient, et le ratio est à peu près celui que la tarification publique d'Intercom Fin et d'éditeurs équivalents prédirait pour un mix de tickets de fintech grand public à volume élevé.
Le rappel partiel de 2025 captait l'Augmentation et le Résidu non substituable. Klarna avait initialement acheminé ces tickets par l'IA aussi, a heurté un mur de qualité, et a ajusté. Ce n'est pas un échec de l'IA — c'est la carte de substitution lue correctement au deuxième essai. Les frontières entre classes sont réelles, et les franchir sur des hypothèses optimistes coûte de l'argent en insatisfaction client plus vite que cela n'en économise en salaires.
Ce que le cas ne montre pas, c'est le cadrage binaire qui domine la plupart des commentaires : soit l'IA remplace le support client, soit elle ne le remplace pas. Les deux lectures sont fausses. L'IA remplace une fraction mesurable du travail à un ratio de coût connu, la fraction dépendant de la distribution des tickets et de la politique d'audit choisie. L'autre fraction reste humaine, et prend de la valeur à mesure que le travail substituable se comprime autour d'elle.
Que faire de tout cela
Trois choses en découlent.
D'abord, avant de calculer tout coût « l'IA remplace le support client », classez les tickets. La part de Substitution totale compte le plus parce qu'elle domine le ratio. Une file à 70 % de Substitution totale se comporte très différemment d'une file à 30 % de Substitution totale et 40 % d'Augmentation — et les chiffres phares des concurrents disent rarement laquelle ils ont.
Ensuite, traitez la politique d'audit comme une variable de premier ordre. La bande de coût de la Substitution supervisée est plus large que les autres parce que le choix d'audit change le coût unitaire de près de 3×. La plupart des analyses sautent ce point et citent l'extrémité qui flatte la conclusion.
Troisièmement, ne tarifez pas le Résidu non substituable contre une référence IA. Il n'y en a pas. Ces tickets restent humains, et la bonne comparaison est humain-contre-humain (agent expérimenté contre junior, interne contre externalisé), pas humain-contre-IA. Tarifer le résidu contre une référence IA fantôme, c'est ce qui a fait que le premier passage de Klarna a surestimé les économies — et ce qui fait que la plupart des dossiers internes « l'IA remplace le support client » surpromettent de 30 à 50 % avant même d'atteindre le pilote.
Quatrièmement, versionnez l'analyse. Les fourchettes ici reflètent la tarification de l'inférence et la tarification éditeur telles qu'observées jusqu'à mi-2025. Elles vont bouger. Une décision prise aujourd'hui devrait enregistrer sur quels chiffres elle a été prise, parce que les douze prochains mois de changements de tarification ne ressembleront à des économies que face à une référence inchangée. Les Wagecards portent une version de méthodologie sur le recto de la carte précisément pour cette raison : une Wagecard est un instantané d'une décision, pas une prévision.
Si vous voulez la même analyse appliquée à votre propre rôle ou fonction, avec classes de substitution, bandes de confiance et vue Investissement, c'est ce que fait Wagecore. La méthodologie est ouverte sur wagecore.ai/methodology et une Wagecard gratuite est disponible sur wagecore.ai/start.
Sources
- Annonce conjointe Klarna et OpenAI, février 2024 — assistant IA résolvant 2,3 M de conversations, équivalent d'environ 700 agents.
- Reportage Yahoo Finance, 2025 — assistant IA de Klarna réalisant un travail équivalent à 853 agents à temps plein.
- Reportage du Financial Times sur le réembauchage partiel d'agents humains par Klarna, mai 2025.
- Données salariales ZipRecruiter pour les représentants du support client, 2025 — moyenne américaine sur une base de coût complet par ticket.
- Tarification publique d'Intercom Fin AI — références de coût par résolution jusqu'en 2025.
- Guide de tarification des centres d'appels externalisés de Crescendo — fourchettes de coût par ticket du BPO, du niveau 1 aux niveaux complexes.