W lutym 2024 roku Klarna ogłosiła, że asystent oparty na OpenAI wykonuje pracę 700 pełnoetatowych agentów obsługi klienta. Do 2025 roku firma podała, że liczba ta wzrosła do 853. W maju 2025 roku prezes Klarny powiedział Financial Times, że firma zaczęła ponownie zatrudniać ludzi, powołując się na skargi dotyczące jakości i ograniczenia czystej automatyzacji. Ten łuk — ogłoszenie, eskalacja, częściowy odwrót — to najczęściej cytowana historia w każdej rozmowie o zastępowaniu obsługi klienta przez SI, i zarazem najczęściej błędnie interpretowana. Traktowana jako triumf, wyolbrzymia sprawę. Traktowana jako porażka, ją umniejsza. Traktowana jako narzędzie, mówi coś konkretnego: koszt zastąpienia agenta to nie jedna liczba, lecz rozkład pomiędzy klasami substytucji, a klasy zachowują się bardzo różnie.
Ten wpis prowadzi przez cztery klasy substytucji, których Wagecore używa dla pracy w obsłudze klienta, przez przedziały kosztów z pasmami ufności wewnątrz każdej z nich oraz przez wybory metodologiczne stojące za tymi liczbami.
Przypadek Klarny, przeczytany uważnie
Pierwotny komunikat Klarna/OpenAI z lutego 2024 roku podawał, że asystent SI rozwiązał 2,3 miliona rozmów w pierwszym miesiącu — około dwóch trzecich przychodzących zgłoszeń czatowych — z wynikami satysfakcji klientów statystycznie nieodróżnialnymi od agentów-ludzi i średnim czasem rozwiązania spadającym z 11 minut do poniżej 2. To był nagłówek. Szczegóły z późniejszego okresu, ujawnione głównie w relacjach z 2025 roku w Yahoo Finance i Financial Times, znaczą więcej: liczba 700 agentów była porównaniem z zakontraktowaną zdolnością agencyjną, którą asystent wyparł, a nie z własnymi pracownikami Klarny. Liczba 853 ogłoszona później w 2025 roku wykorzystała tę samą metodę porównania. A częściowy odwrót z 2025 roku nie oznaczał "SI nie działa" — oznaczał "zgłoszenia rezydualne, których SI nie potrafi rozwiązać, są trudniejsze, mocniej naładowane emocjonalnie i wymagają ludzi lepiej opłacanych niż zakontraktowana baza agentów."
To, co ten przypadek naprawdę pokazuje, to rozchodzenie się klas substytucji w rzeczywistym świecie. Klasa masowa — resetowanie haseł, "gdzie jest moje zamówienie" — trafiła niemal w całości do SI i tam pozostała. Klasa sporów i diagnostyki trafiła w większości do SI z pętlą kontroli ludzkiej i również tam pozostała. Klasa złożonych eskalacji trafiła najpierw do SI, a potem częściowo z powrotem do ludzi. A klasa relacji i nowatorskich przypadków brzegowych nigdy się faktycznie nie ruszyła.
To nie jest porażka technologii. To mapa substytucji dająca o sobie znać.
Cztery klasy substytucji
Wagecore klasyfikuje zadania obsługi klienta w cztery klasy na podstawie obserwowalnych właściwości kosztu i niezawodności — a nie na podstawie tego, czy zadanie "wydaje się automatyzowalne". Klasy są następujące:
Substytucja pełna. Segregacja zgłoszeń L1, resetowanie haseł, sprawdzanie statusu zamówienia, odpowiedzi z FAQ, proste przetwarzanie zwrotów w granicach polityki. Zadania te mają wąskie rozkłady danych wejściowych, wysokie wymagania niezawodności jedynie dla niewielkiego zbioru trybów awarii oraz niski koszt błędu. SI obsługuje je od początku do końca bez człowieka na ścieżce rozwiązania. Pasmo ufności: od 2 do 8 USD za rozwiązane zgłoszenie przy użyciu API modelu granicznego plus nakładki dostawcy (Intercom Fin, Ada i Forethought mieszczą się w tym przedziale według publicznych cen do 2025 roku). Dolny kraniec zakłada dobrze dostrojonego dostawcę; górny zakłada gotowe rozwiązanie z wyszukiwaniem, ale bez ponownego trenowania. Odpowiednik ludzki: od 15 do 25 USD za zgłoszenie dla agenta outsourcowanego contact center, według publicznych przewodników cenowych publikowanych przez Crescendo oraz średniego segmentu rynku BPO. Stosunek faworyzuje SI mniej więcej 3–5×, a różnica jest stabilna.
Substytucja nadzorowana. Spory dotyczące rachunków, diagnostyka produktu, w której liczy się konfiguracja klienta, zmiany konta z brzegowymi przypadkami polityki, proste skargi. SI proponuje rozwiązanie, człowiek je przegląda, zanim trafi do klienta — indywidualnie w przypadkach o niskiej pewności, albo w formie zbiorczego audytu w przypadkach o wysokiej pewności. Struktura kosztów istotnie różni się od substytucji pełnej: płacisz koszt wnioskowania SI plus ułamek czasu agenta na zgłoszenie, gdzie ułamek zależy od twojej polityki audytu. Pasmo ufności: od 5 do 14 USD za rozwiązane zgłoszenie. Szerokie pasmo odzwierciedla wybór między ciężkim audytem (każde zgłoszenie sprawdzane) a lekkim audytem (próbkowanym). Odpowiednik wyłącznie ludzki: od 18 do 30 USD za zgłoszenie — te zgłoszenia trwają dłużej niż zgłoszenia substytucji pełnej, więc baza ludzka też rośnie. Stosunek faworyzuje SI 2–3× i pogarsza się w miarę zacieśniania pętli audytu.
Wspomaganie. Złożone eskalacje, sytuacje emocjonalne (zwroty związane z okolicznościami medycznymi lub rodzinnymi, skargi na awarie usług), dochodzenia wielosystemowe, sprawy wymagające uwagi zarządu. SI wspiera człowieka — redagując odpowiedzi, wyciągając historię, streszczając wcześniejsze zgłoszenia, sugerując precedensy polityki — ale nie działa. Człowiek jest właścicielem rozwiązania. Koszt to w istocie "pensja człowieka plus subskrypcja asystenta SI na stanowisko". Pasmo ufności: od 20 do 45 USD za zgłoszenie. Wkład SI ujawnia się jako przepustowość, a nie jako etaty: starszy agent z dobrym kopilotem obsługuje może o 30% więcej zgłoszeń na zmianę. Odpowiednik wyłącznie ludzki: od 25 do 60 USD za zgłoszenie. Stosunek: skromna, jednocyfrowa procentowo redukcja kosztu, z korzyścią wyrażoną jako szybsze rozwiązanie, a nie mniejsza liczba agentów.
Rezydualna niezastępowalna. Zarządzanie relacjami z kontami strategicznymi, nowatorskie przypadki brzegowe niepasujące do żadnego wcześniejszego wzorca, korespondencja regulacyjna lub prawna, incydenty kryzysowe (siatki oszustów, obsługa masowych awarii, skargi wrażliwe wizerunkowo). SI może być w pętli jako narzędzie badawcze, ale ścieżka rozwiązania jest w pełni ludzka i często obejmuje wielu ludzi (agenta, menedżera, czasem dział prawny). Koszt: od 50 do ponad 200 USD za zgłoszenie, zależnie od czasu trwania i seniority. Nie ma bazy SI, z którą można by porównywać, ponieważ prawdopodobieństwo substytucji jest przy obecnych możliwościach faktycznie zerowe. Częściowe ponowne zatrudnienie agentów-ludzi przez Klarnę w 2025 roku miało miejsce głównie wewnątrz tej klasy i na górnym krańcu Wspomagania — dokładnie w klasie, w której pewność SI była najniższa, a koszt błędnej odpowiedzi najwyższy.
Baza ludzka, w pełni obciążona
Powyższe liczby kosztu na zgłoszenie opierają się na bazie ludzkiej, która sama zasługuje na pasmo ufności. Dane ZipRecruiter z 2025 roku dla stanowiska "Customer Support Representative" w USA pokazują średnią roczną podstawę na poziomie około 42 000 USD, z pasmem od 25. do 75. percentyla wynoszącym od 34 000 do 50 000 USD, zależnie od geografii i stażu. W pełni obciążona — świadczenia, podatki od wynagrodzeń, sprzęt, narzut menedżerski, koszt zastąpienia w wyniku rotacji, amortyzacja szkoleń — typowy mnożnik wynosi 1,35–1,55×, co daje obciążony koszt roczny na poziomie około 57 000–77 000 USD. Podziel przez 1800–2000 produktywnych godzin rocznie, a otrzymasz od 28 do 43 USD za obciążoną godzinę agenta. Przy typowym dla branży czasie obsługi 8–14 minut na zgłoszenie w pełnym miksie daje to przywołany wyżej przedział od 15 do 25 USD za zgłoszenie dla rutynowej pracy L1 oraz od 25 do 60 USD dla zgłoszeń złożonych.
Cennik outsourcowanego BPO — opublikowany przewodnik Crescendo, wskaźniki średniego segmentu rynku od firm analitycznych zajmujących się contact center — plasuje się poniżej tego poziomu na bazie jednego zgłoszenia (od 6 do 15 USD za L1 głosowe lub czatowe w tańszych geografiach), ale nie należy go czytać jako bazy ludzkiej, chyba że alternatywa SI jest porównywana z tym samym układem offshore. Uczciwe ekonomicznie porównanie zestawia podobne z podobnym: wewnętrzne z wewnętrznym, BPO z BPO, a SI z kosztem ludzkim, który faktycznie wypiera wewnątrz danej organizacji. Mieszanie porównań to sposób, w jaki powstają twierdzenia o 10-krotnej redukcji kosztów, które nie przeżywają pierwszego kwartału działania.
Wniosek dla matematyki klas substytucji: w drogim środowisku wewnętrznym stosunek 3–5× Substytucji Pełnej narasta, ponieważ baza ludzka jest wysoka. W tanim środowisku BPO ta sama technologia daje stosunek 1,5–2,5×, ponieważ baza ludzka jest już niska. Technologia jest stała; oszczędności nie.
Dlaczego pasma ufności, a nie szacunki punktowe
Pojedyncza kwota w dolarach na zgłoszenie to najczystsza możliwa odpowiedź i niemal zawsze błędna. Dwa powody.
Po pierwsze, rozkład danych wejściowych do każdej klasy różni się drastycznie między firmami. Miks zgłoszeń fintechu konsumenckiego jest mocno przechylony w stronę Substytucji Pełnej na szczycie lejka; kolejka wsparcia SaaS B2B jest ciężka we Wspomaganie, ponieważ zgłoszenia odwołują się do konfiguracji specyficznych dla klienta. To samo twierdzenie "agent SI zastępuje człowieka" może odwzorować się na 4-krotną redukcję kosztu w jednej firmie i 1,2-krotną w drugiej, nie dlatego, że technologia jest inna, ale dlatego, że rozkład pracy jest inny.
Po drugie, ceny SI są w ruchu. Koszt na token dla modeli granicznych spadł mniej więcej 10-krotnie od początku 2024 do połowy 2025 roku. Nakładki dostawców nie spadły w tym samym tempie, ponieważ struktura kosztów Intercom Fin czy Ady to nie czyste wnioskowanie modelu — to wyszukiwanie, marża dostawcy, proces sprzedaży i integracja. Dolny kraniec każdego pasma śledzi surowe wnioskowanie; górny śledzi cennik dostawcy. Odstęp między nimi zawęża się z czasem, ale nie jest zerowy.
Publikujemy pasma ufności, ponieważ szacunki punktowe tworzą złudzenie pewności, któremu przypadek Klarny wprost zaprzeczył. Liczba 700 agentów była szacunkiem punktowym i nie przeżyła kontaktu z rozkładem zgłoszeń rezydualnych.
Metodologia Wagecard stojąca za tymi liczbami
Wagecard od Wagecore traktuje role w obsłudze klienta tak samo jak każdą inną rolę: jako średnią ważoną pomiędzy klasami substytucji, gdzie każda klasa jest oceniana pod kątem zdolności, niezawodności, kosztu błędu i kosztu nadzoru. Cztery powyższe klasy odwzorowują się na naszą standardową granicę — Substytucja Pełna odpowiada naszej komórce Replaceable, Substytucja Nadzorowana — AI-augmented, Wspomaganie — Human-led-AI-assisted, Rezydualna niezastępowalna — Human-critical.
Widok Inwestycyjny dla funkcji obsługi klienta czyta się zatem jako obliczenie NPV, a nie pojedynczy stosunek. Dane wejściowe: rozkład wolumenu zgłoszeń pomiędzy cztery klasy, obecny koszt wyłącznie ludzki na klasę, oczekiwany koszt SI-plus-człowiek na klasę przy wybranej polityce audytu, koszty przełączenia (wdrożenie dostawcy, budowa indeksu wyszukiwania, kontrakty na ponowne trenowanie) oraz skorygowana o ryzyko stopa dyskontowa uwzględniająca szansę, że cennik lub jakość dostawcy zmienią się w trakcie kontraktu. IRR na kolejkach ciężkich w substytucję pełną jest wysoki — zazwyczaj powyżej 80% w horyzoncie jednego roku przy powyższych pasmach. IRR na kolejkach ciężkich we wspomaganie jest skromny. Okres zwrotu waha się od poniżej kwartału do ponad dwóch lat, zależnie od tego, która klasa dominuje.
To nie jest czarna skrzynka. Klasy substytucji, pasma kosztów i wagi są wszystkie opublikowane w naszej metodologii. Nie uzupełniamy wstecznie wcześniejszych liczb, gdy nasza metodologia się zmienia: Wagecard obliczony w ramach v1 pozostaje Wagecardem v1, z liczbami v1, nawet jeśli v2 zaktualizuje pasma. Powód jest taki, że koszt decyzji o substytucji płaci się względem liczb znanych w chwili decyzji — uzupełnianie wsteczne przepisuje historię w sposób, który sprawia, że wcześniejsze decyzje wyglądają lepiej lub gorzej, niż były w momencie podejmowania.
Odczytanie łuku Klarny przez klasy
Mając w ręku cztery klasy, sekwencję ogłoszenie–eskalacja–częściowy odwrót Klarny czyta się czysto:
Liczby 700 i 853 agentów uchwyciły wyparcie Substytucji Pełnej i większości Substytucji Nadzorowanej. Są one realne, matematyka się zgadza, a stosunek jest mniej więcej taki, jaki publiczny cennik Intercom Fin i równoważnych dostawców przewidywałby dla wysokowolumenowego miksu zgłoszeń fintechu konsumenckiego.
Częściowe ponowne zatrudnienie w 2025 roku uchwyciło Wspomaganie i Rezydualną niezastępowalną. Klarna początkowo kierowała te zgłoszenia również przez SI, uderzyła w ścianę jakości i skorygowała kurs. To nie jest porażka SI — to poprawne odczytanie mapy substytucji za drugim razem. Granice klas są realne, a przekraczanie ich na optymistycznych założeniach kosztuje pieniądze w niezadowoleniu klientów szybciej, niż oszczędza je w pensjach.
Czego ten przypadek nie pokazuje, to binarne ujęcie, które dominuje w większości komentarzy: SI albo zastępuje obsługę klienta, albo nie. Oba odczytania są błędne. SI zastępuje mierzalny ułamek pracy przy znanym stosunku kosztów, gdzie ułamek zależy od rozkładu zgłoszeń i wybranej polityki audytu. Pozostały ułamek zostaje ludzki i staje się cenniejszy w miarę, jak praca substytuowalna kurczy się wokół niego.
Co z tym zrobić
Wynikają stąd trzy rzeczy.
Po pierwsze, zanim policzysz jakikolwiek koszt "SI zastępuje obsługę klienta", sklasyfikuj zgłoszenia. Udział Substytucji Pełnej liczy się najbardziej, bo dominuje w stosunku. Kolejka, która jest w 70% Substytucją Pełną, zachowuje się zupełnie inaczej niż taka, która jest w 30% Substytucją Pełną i w 40% Wspomaganiem — a nagłówkowe liczby konkurentów rzadko mówią, którą z nich mają.
Po drugie, traktuj politykę audytu jako zmienną pierwszej kategorii. Pasmo kosztów Substytucji Nadzorowanej jest szersze niż pozostałych, ponieważ wybór audytu zmienia koszt jednostkowy niemal 3-krotnie. Większość opracowań pomija to i cytuje ten kraniec, który schlebia wnioskowi.
Po trzecie, nie wyceniaj Rezydualnej niezastępowalnej względem bazy SI. Takiej nie ma. Te zgłoszenia zostają ludzkie, a właściwe porównanie to człowiek kontra człowiek (starszy agent vs. młodszy, wewnętrzny vs. outsourcowany), a nie człowiek kontra SI. Wycenianie rezydualnej względem fantomowej bazy SI to właśnie to, co sprawiło, że pierwsze podejście Klarny przeszacowało oszczędności — i co sprawia, że większość wewnętrznych uzasadnień biznesowych "SI zastępuje obsługę klienta" obiecuje o 30–50% za dużo, zanim jeszcze trafią do pilotażu.
Po czwarte, wersjonuj analizę. Pasma tutaj odzwierciedlają ceny wnioskowania i ceny dostawców obserwowane do połowy 2025 roku. Będą się zmieniać. Decyzja podjęta dziś powinna odnotować, względem jakich liczb została podjęta, ponieważ kolejne dwanaście miesięcy zmian cen będzie wyglądać jak oszczędności jedynie względem niezmienionej bazy. Wagecardy noszą wersję metodologii na licu karty dokładnie z tego powodu: Wagecard to migawka decyzji, a nie prognoza.
Jeśli chcesz przeprowadzić tę samą analizę dla swojej własnej roli lub funkcji, z klasami substytucji, pasmami ufności i Widokiem Inwestycyjnym, to właśnie robi Wagecore. Metodologia jest otwarta pod wagecore.ai/methodology, a darmowy Wagecard znajdziesz pod wagecore.ai/start.
Źródła
- Wspólne ogłoszenie Klarny i OpenAI, luty 2024 — asystent SI rozwiązujący 2,3 mln rozmów, równowartość ~700 agentów.
- Relacja Yahoo Finance, 2025 — asystent SI Klarny wykonujący pracę równoważną 853 pełnoetatowym agentom.
- Relacja Financial Times o częściowym ponownym zatrudnieniu agentów-ludzi przez Klarnę, maj 2025.
- Dane płacowe ZipRecruiter dla przedstawiciela obsługi klienta, 2025 — w pełni obciążona baza kosztu na zgłoszenie, średnia dla USA.
- Publiczny cennik Intercom Fin AI — wskaźniki kosztu na rozwiązanie do 2025 roku.
- Przewodnik cenowy outsourcowanego call center Crescendo — przedziały kosztu BPO na zgłoszenie, od L1 po poziomy złożone.