I februari 2024 meddelade Klarna att en OpenAI-driven assistent utförde arbetet motsvarande 700 heltidsanställda kundtjänstmedarbetare. Till 2025 uppgav företaget att siffran hade vuxit till 853. I maj 2025 berättade Klarnas vd för Financial Times att företaget hade börjat anställa människor igen, med hänvisning till klagomål på kvalitet och gränserna för ren automatisering. Den bågen — besked, upptrappning, delvis reträtt — är den mest citerade berättelsen i varje samtal om AI som ersätter kundtjänst, och den är också den mest missförstådda. Läst som en triumf överdriver den fallet. Läst som ett misslyckande underskattar den det. Läst som ett verktyg berättar den något specifikt: kostnaden för att ersätta en medarbetare är inte ett enda tal, det är en fördelning över substitutionsklasser, och klasserna beter sig mycket olika.
Det här inlägget går igenom de fyra substitutionsklasser som Wagecore använder för kundtjänstarbete, kostnadsspannen med konfidensband inom varje klass, och de metodval som ligger bakom siffrorna.
Fallet Klarna, läst noggrant
Klarnas och OpenAI:s ursprungliga pressmeddelande i februari 2024 rapporterade att AI-assistenten löste 2,3 miljoner konversationer under den första månaden — ungefär två tredjedelar av inkommande chattärenden — med kundnöjdhetspoäng som statistiskt inte gick att skilja från mänskliga medarbetare, och en genomsnittlig lösningstid som föll från 11 minuter till under 2. Det var rubriken. Detaljerna som följde, mestadels framkomna i 2025 års rapportering från Yahoo Finance och Financial Times, väger tyngre: siffran 700 medarbetare var en jämförelse mot den kontrakterade agentkapacitet som assistenten trängde undan, inte mot Klarnas egna anställda. Siffran 853 som meddelades senare 2025 använde samma jämförelsemetod. Och den delvisa reträtten 2025 var inte ”AI fungerar inte” — den var ”de kvarvarande ärenden som AI inte kan lösa är svårare, mer känslomässigt laddade och kräver människor som är bättre betalda än den kontrakterade agentbaslinjen.”
Vad fallet faktiskt visar är substitutionsklasserna som glider isär i verkligheten. Klassen av volymärenden, lösenordsåterställningar och ”var är min beställning” gick nästan helt till AI:n och stannade där. Klassen av tvister och felsökning gick mestadels till AI:n med en mänsklig granskningsslinga, och stannade även den där. Klassen av komplexa eskaleringar gick först till AI:n, sedan delvis tillbaka till människor. Och klassen av relationshantering eller nya gränsfall flyttade aldrig egentligen.
Det är inte ett misslyckande för tekniken. Det är substitutionskartan som gör sig gällande.
Fyra substitutionsklasser
Wagecore klassificerar kundtjänstuppgifter i fyra klasser baserat på observerbara kostnads- och tillförlitlighetsegenskaper — inte på om en uppgift ”känns automatiserbar”. Klasserna är:
Full substitution. L1-ärendetriage, lösenordsåterställningar, statuskontroller av beställningar, FAQ-svar, enkel återbetalningshantering inom policygränser. Dessa uppgifter har smala indatafördelningar, höga tillförlitlighetskrav endast på en liten uppsättning felmoder, och låg felkostnad. AI:n hanterar dem från början till slut utan en människa i lösningsvägen. Konfidensband: 2–8 USD per löst ärende med ett frontier-modell-API plus en leverantörsomslag (Intercom Fin, Ada, Forethought ligger enligt offentlig prissättning fram till 2025 alla i detta spann). Den nedre änden förutsätter en väl inställd leverantör; den övre änden en färdig produkt med retrieval men utan omträning. Mänsklig motsvarighet: 15–25 USD per ärende för en utlagd kontaktcentermedarbetare, enligt de offentliga prisguiderna från Crescendo och BPO-mellanmarknaden. Förhållandet gynnar AI:n med ungefär 3–5×, och gapet är stabilt.
Övervakad substitution. Faktureringstvister, produktfelsökning där kundens konfiguration spelar roll, kontoändringar med policygränsfall, enkla klagomål. AI:n föreslår en lösning, en människa granskar den innan den går till kunden — antingen ärende för ärende vid ärenden med låg konfidens, eller via samlad revision vid ärenden med hög konfidens. Kostnadsstrukturen skiljer sig betydligt från full substitution: du betalar AI-inferenskostnaden plus en bråkdel av en medarbetares tid per ärende, där bråkdelen beror på din revisionspolicy. Konfidensband: 5–14 USD per löst ärende. Det breda bandet speglar valet mellan tung revision (varje ärende granskat) och lätt revision (stickprov). Motsvarighet endast med människa: 18–30 USD per ärende — dessa ärenden tar längre tid än ärenden med full substitution, så den mänskliga baslinjen stiger också. Förhållandet gynnar AI:n med 2–3×, och försämras när du drar åt revisionsslingan.
Förstärkning. Komplexa eskaleringar, känslomässiga situationer (återbetalningar kopplade till medicinska eller familjära omständigheter, klagomål om serviceavbrott), utredningar över flera system, ärenden med ledningens uppmärksamhet. AI:n hjälper människan — utformar svar, hämtar historik, sammanfattar tidigare ärenden, föreslår policyprejudikat — men agerar inte. Människan äger lösningen. Kostnaden är i huvudsak ”människolön plus en AI-assistentprenumeration per arbetsplats”. Konfidensband: 20–45 USD per ärende. AI-bidraget syns i genomströmning, inte i personalstyrka: en senior medarbetare med en bra medpilot hanterar kanske 30 % fler ärenden per skift. Motsvarighet endast med människa: 25–60 USD per ärende. Förhållande: blygsam kostnadsminskning på ensiffriga procent, med vinsten uttryckt som snabbare lösning snarare än färre medarbetare.
Icke-substituerbar rest. Relationshantering med strategiska konton, nya gränsfall som inte passar något tidigare mönster, regulatorisk eller juridisk korrespondens, krisincidenter (bedrägeriligor, hantering av massavbrott, PR-känsliga klagomål). AI:n kan vara med i slingan som ett researchverktyg, men lösningsvägen är helt mänsklig och spänner ofta över flera människor (en medarbetare, en chef, ibland juridik). Kostnad: 50–200+ USD per ärende beroende på varaktighet och senioritet. Det finns ingen AI-baslinje att jämföra mot eftersom substitutionssannolikheten i praktiken är noll vid nuvarande kapacitet. Klarnas delvisa återanställning av mänskliga medarbetare 2025 skedde mestadels inom denna klass och i den övre kanten av Förstärkning — precis den klass där AI:ns konfidens var lägst och kostnaden för ett felaktigt svar var högst.
Den mänskliga baslinjen, fullt belastad
Kostnaden-per-ärende-siffrorna ovan vilar på en mänsklig baslinje som själv förtjänar ett konfidensband. ZipRecruiters data från 2025 för ”Customer Support Representative” i USA visar en genomsnittlig årlig grundlön på ungefär 42 000 USD, med ett band från 25:e till 75:e percentilen på 34 000–50 000 USD beroende på geografi och anställningstid. Fullt belastad — förmåner, arbetsgivaravgifter, utrustning, chefsomkostnader, ersättningskostnad för personalomsättning, amorterad utbildning — är den typiska multiplikatorn 1,35–1,55×, vilket placerar den belastade årskostnaden på ungefär 57 000–77 000 USD. Dividerat med 1 800–2 000 produktiva timmar per år får du 28–43 USD per belastad medarbetartimme. Vid en branschtypisk hanteringstid på 8–14 minuter per ärende över hela mixen ger det siffran 15–25 USD per ärende för rutinmässigt L1-arbete och siffran 25–60 USD för komplexa ärenden som nämns ovan.
Utlagd BPO-prissättning — Crescendos publicerade guide, mellanmarknadens riktmärken från kontaktcenteranalytikerna — ligger lägre än detta på ärendebasis (6–15 USD för L1 via röst eller chatt i lågkostnadsregioner) men bör inte läsas som den mänskliga baslinjen om inte AI-alternativet jämförs mot samma offshore-upplägg. Den ekonomiskt hederliga jämförelsen ställer lika mot lika: internt mot internt, BPO mot BPO, och AI mot den mänskliga kostnad den faktiskt tränger undan inom den organisationen. Att blanda ihop jämförelserna är hur man får fram påståendena om 10× kostnadsminskning som inte överlever det första kvartalet av drift.
Implikationen för substitutionsklassmatematiken: i en dyr intern miljö förstärks Full substitutions 3–5×-förhållande eftersom den mänskliga baslinjen är hög. I en billig BPO-miljö ger samma teknik ett förhållande på 1,5–2,5× eftersom den mänskliga baslinjen redan är låg. Tekniken är konstant; besparingarna är det inte.
Varför konfidensband, inte punktskattningar
En enda dollarsiffra per ärende är det renaste möjliga svaret, och det är nästan alltid fel. Två skäl.
För det första varierar indatafördelningen till varje klass enormt mellan företag. En konsumentfintechs ärendemix är kraftigt Full substitution i toppen av tratten; en B2B-SaaS-supportkö är förstärkningstung eftersom ärendena hänvisar till kundspecifika konfigurationer. Samma påstående ”AI-agent ersätter en människa” kan motsvara en 4×-kostnadsminskning på ett företag och en 1,2×-minskning på ett annat — inte för att tekniken är annorlunda, utan för att arbetsfördelningen är det.
För det andra rör sig AI-prissättningen. Frontier-modellernas kostnad per token har fallit ungefär 10× från början av 2024 till mitten av 2025. Leverantörsomslag har inte fallit i samma takt, eftersom kostnadsstrukturen hos ett Intercom Fin eller ett Ada inte är ren modellinferens — det är retrieval, leverantörsmarginal, säljinsats och integration. Den nedre änden av varje band följer ren inferens; den övre änden följer leverantörens prissättning. Gapet mellan de två krymper över tid men är inte noll.
Vi publicerar konfidensband eftersom punktskattningar skapar den illusion av säkerhet som fallet Klarna uttryckligen motsade. Siffran 700 medarbetare var en punktskattning, och den överlevde inte kontakten med fördelningen av kvarvarande ärenden.
Wagecard-metodiken bakom dessa siffror
Wagecores Wagecard behandlar kundtjänstroller som varje annan roll: som ett viktat genomsnitt över substitutionsklasser, där varje klass poängsätts på förmåga, tillförlitlighet, felkostnad och tillsynskostnad. De fyra klasserna ovan avbildas på vår standardgräns — Full substitution motsvarar vår cell ”replaceable”, Övervakad substitution ”ai-augmented”, Förstärkning ”human-led-ai-assisted”, icke-substituerbar rest ”human-critical”.
Investment View för en kundtjänstfunktion läses därför som en NPV-beräkning, inte ett enda förhållande. Indata: fördelning av ärendevolymen över de fyra klasserna, nuvarande kostnad endast med människa per klass, förväntad AI-plus-människa-kostnad per klass med en vald revisionspolicy, omställningskostnader (leverantörsintroduktion, uppbyggnad av retrieval-index, omträningskontrakt), och en riskjusterad diskonteringsränta som tar hänsyn till risken att leverantörens prissättning eller kvalitet ändras mitt i kontraktet. IRR på köer med tung full substitution är hög — typiskt 80 %+ på ett års horisont vid banden ovan. IRR på förstärkningstunga köer är blygsam. Återbetalningstiden varierar från under ett kvartal till över två år beroende på vilken klass som dominerar.
Detta är inte en svart låda. Substitutionsklasserna, kostnadsbanden och viktningen är alla publicerade i vår metodik. Vi fyller inte retroaktivt i tidigare siffror när vår metodik revideras: en Wagecard beräknad under v1 förblir en v1-Wagecard, med v1-siffrorna, även om v2 uppdaterar banden. Skälet är att kostnaden för ett substitutionsbeslut betalas mot de siffror som var kända vid beslutstillfället — att fylla i retroaktivt skriver om historien på ett sätt som får tidigare beslut att se bättre eller sämre ut än de var när de fattades.
Klarnabågen läst genom klasserna
Med de fyra klasserna i handen läses Klarnas sekvens av besked, upptrappning och delvis reträtt rent:
Siffrorna 700 och 853 medarbetare fångade undanträngningen av Full substitution och större delen av Övervakad substitution. De är verkliga, matematiken håller, och förhållandet är ungefär vad den offentliga prissättningen på Intercom Fin och likvärdiga leverantörer skulle förutsäga för en konsumentfintechs ärendemix med hög volym.
Den delvisa återanställningen 2025 fångade Förstärkning och icke-substituerbar rest. Klarna dirigerade först även dessa ärenden genom AI:n, träffade en kvalitetsvägg och justerade. Det är inte ett AI-misslyckande — det är substitutionskartan som lästs korrekt andra gången. Klassgränserna är verkliga, och att korsa dem på optimistiska antaganden kostar pengar i kundmissnöje snabbare än det sparar i lön.
Vad fallet inte visar är den binära inramningen som dominerar de flesta kommentarer: AI ersätter antingen kundtjänsten eller så gör den det inte. Båda läsningarna är fel. AI:n ersätter en mätbar bråkdel av arbetet till ett känt kostnadsförhållande, där bråkdelen beror på ärendefördelningen och den valda revisionspolicyn. Den andra bråkdelen förblir mänsklig och blir mer värdefull i takt med att det substituerbara arbetet komprimeras runt den.
Vad man ska göra med detta
Tre saker följer.
För det första, innan du beräknar någon kostnad för ”AI ersätter kundtjänst”, klassificera ärendena. Andelen Full substitution väger tyngst eftersom den dominerar förhållandet. En kö som är 70 % Full substitution beter sig mycket annorlunda än en med 30 % Full substitution och 40 % Förstärkning — och konkurrenternas rubriksiffror avslöjar sällan vilken de har.
För det andra, behandla revisionspolicyn som en förstklassig variabel. Övervakad substitutions kostnadsband är bredare än de andra eftersom revisionsvalet ändrar styckkostnaden med nästan 3×. De flesta framställningar hoppar över detta och citerar den ändpunkt som smickrar slutsatsen mest.
För det tredje, prissätt inte den icke-substituerbara resten mot en AI-baslinje. Det finns ingen. De ärendena förblir mänskliga, och den rätta jämförelsen är människa mot människa (senior medarbetare mot junior, internt mot utlagt), inte människa mot AI. Att prissätta resten mot en fantom-AI-baslinje är vad som fick Klarnas första omgång att överskatta besparingarna — och vad som får de flesta interna affärscase för ”AI ersätter kundtjänst” att överlova med 30–50 % redan innan de når pilotstadiet.
För det fjärde, versionshantera analysen. Banden här speglar inferens- och leverantörsprissättning som observerats fram till mitten av 2025. De kommer att röra sig. Ett beslut som fattas idag bör registrera vilka siffror det fattades mot, eftersom de kommande tolv månadernas prisförändringar bara kommer att se ut som besparingar mot en oförändrad baslinje. Wagecards bär av precis detta skäl en metodikversion på kortets framsida: en Wagecard är en ögonblicksbild av ett beslut, inte en prognos.
Om du vill ha samma analys körd mot din egen roll eller funktion, med substitutionsklasser, konfidensband och en Investment View, är det precis vad Wagecore gör. Metodiken är öppen på wagecore.ai/methodology och en gratis Wagecard finns på wagecore.ai/start.
Källor
- Gemensamt besked från Klarna och OpenAI, februari 2024 — AI-assistent löser 2,3 miljoner konversationer, ~700-medarbetarmotsvarighet.
- Rapportering från Yahoo Finance, 2025 — Klarnas AI-assistent utför arbete motsvarande 853 heltidsmedarbetare.
- Financial Times rapportering om Klarnas delvisa återanställning av mänskliga medarbetare, maj 2025.
- Lönedata från ZipRecruiter för customer support representative, 2025 — USA-genomsnitt som grund för fullt belastad kostnad per ärende.
- Offentlig prissättning för Intercom Fin AI — riktmärken för kostnad per lösning fram till 2025.
- Crescendos prisguide för utlagda callcenter — BPO-kostnadsspann per ärende för L1 till komplexa nivåer.