Nel febbraio 2024 Klarna ha annunciato che un assistente basato su OpenAI svolgeva il lavoro di 700 agenti di assistenza clienti a tempo pieno. Entro il 2025 l'azienda ha dichiarato che il numero era salito a 853. Nel maggio 2025 l'amministratore delegato di Klarna ha detto al Financial Times che l'azienda aveva ricominciato ad assumere persone, citando lamentele sulla qualità e i limiti dell'automazione pura. Quell'arco — annuncio, escalation, ritirata parziale — è la storia più citata in ogni discussione sulla sostituzione dell'assistenza clienti con l'IA, ed è anche la più fraintesa. Letta come un trionfo, sopravvaluta il caso. Letta come un fallimento, lo sottovaluta. Letta come uno strumento, dice qualcosa di specifico: il costo di sostituire un agente non è un numero solo, è una distribuzione tra classi di sostituzione, e le classi si comportano in modo molto diverso.
Questo articolo percorre le quattro classi di sostituzione che Wagecore usa per il lavoro di assistenza clienti, le fasce di costo con bande di confidenza all'interno di ciascuna, e le scelte metodologiche dietro i numeri.
Il caso Klarna, letto con attenzione
Il comunicato originale Klarna/OpenAI del febbraio 2024 riportava che l'assistente IA risolveva 2,3 milioni di conversazioni nel suo primo mese — circa due terzi dei ticket di chat in entrata — con punteggi di soddisfazione dei clienti statisticamente indistinguibili da quelli degli agenti umani e un tempo medio di risoluzione sceso da 11 minuti a meno di 2. Quello era il titolo. I dettagli successivi, emersi soprattutto nella copertura del 2025 di Yahoo Finance e del Financial Times, contano di più: la cifra di 700 agenti era un confronto rispetto alla capacità di agenti a contratto che l'assistente ha sostituito, non rispetto ai dipendenti di Klarna. La cifra di 853 annunciata più tardi nel 2025 usava lo stesso metodo di confronto. E la ritirata parziale del 2025 non era «l'IA non funziona» — era «i ticket residui che l'IA non riesce a risolvere sono più difficili, più carichi emotivamente, e richiedono persone pagate meglio del riferimento dell'agente a contratto».
Ciò che questo caso mostra davvero sono le classi di sostituzione che si separano nel mondo reale. La classe ad alto volume, reset della password, stato-del-mio-ordine è andata quasi interamente all'IA e lì è rimasta. La classe contestazione-e-risoluzione-problemi è andata per lo più all'IA con un ciclo di revisione umana, ed è rimasta lì anche quella. La classe escalation complessa è andata inizialmente all'IA, poi parzialmente di nuovo agli umani. E la classe relazione-o-caso-limite-inedito non si è in realtà mai spostata.
Non è un fallimento della tecnologia. È la mappa di sostituzione che si afferma.
Quattro classi di sostituzione
Wagecore classifica i compiti di assistenza clienti in quattro classi in base a proprietà osservabili di costo e affidabilità — non in base al fatto che un compito «sembri automatizzabile». Le classi sono:
Sostituzione totale. Smistamento di ticket di livello 1, reset della password, ricerche sullo stato dell'ordine, risposte alle FAQ, elaborazione di rimborsi semplici entro i limiti della policy. Questi compiti hanno distribuzioni di input ristrette, requisiti di affidabilità elevati solo su un piccolo insieme di modalità di guasto, e un basso costo dell'errore. L'IA li gestisce dall'inizio alla fine senza un umano nel percorso di risoluzione. Banda di confidenza: 2–8 $ per ticket risolto usando un'API di modello di frontiera più un wrapper di fornitore (Intercom Fin, Ada, Forethought si collocano tutti in questa fascia secondo i prezzi pubblici fino al 2025). L'estremo inferiore presuppone un fornitore ben calibrato; l'estremo superiore presuppone una soluzione pronta all'uso con recupero delle informazioni ma senza riaddestramento. Equivalente umano: 15–25 $ per ticket per un agente di contact center esternalizzato, secondo le guide di prezzo pubbliche pubblicate da Crescendo e dal mercato intermedio del BPO. Il rapporto favorisce l'IA di circa 3–5×, e il divario è stabile.
Sostituzione supervisionata. Contestazioni di fatturazione, risoluzione di problemi di prodotto in cui conta la configurazione del cliente, modifiche all'account con casi limite di policy, reclami semplici. L'IA propone una risoluzione, un umano la revisiona prima che arrivi al cliente — o caso per caso per quelli a bassa confidenza, o tramite audit in blocco per quelli ad alta confidenza. La struttura dei costi è nettamente diversa dalla sostituzione totale: si paga il costo di inferenza dell'IA più una frazione del tempo di un agente per ticket, dove la frazione dipende dalla policy di audit. Banda di confidenza: 5–14 $ per ticket risolto. La banda ampia riflette la scelta tra audit intenso (ogni ticket revisionato) e audit leggero (a campione). Equivalente solo umano: 18–30 $ per ticket — questi ticket richiedono più tempo di quelli della sostituzione totale, quindi anche il riferimento umano sale. Il rapporto favorisce l'IA di 2–3×, e si degrada man mano che si stringe il ciclo di audit.
Aumento. Escalation complesse, situazioni emotive (rimborsi legati a circostanze mediche o familiari, reclami per interruzioni del servizio), indagini su più sistemi, casi che richiedono l'attenzione della dirigenza. L'IA assiste l'umano — bozze di risposta, recupero dello storico, sintesi dei ticket precedenti, suggerimento di precedenti di policy — ma non agisce. L'umano è titolare della risoluzione. Il costo è essenzialmente «stipendio umano più un abbonamento ad assistente IA per postazione». Banda di confidenza: 20–45 $ per ticket. Il contributo dell'IA si manifesta come throughput, non come organico: un agente senior con un buon copilota gestisce forse il 30 % di ticket in più per turno. Equivalente solo umano: 25–60 $ per ticket. Rapporto: una riduzione di costo modesta, dell'ordine di una cifra percentuale, con il vantaggio espresso come risoluzione più rapida anziché come minor numero di agenti.
Residuo non sostituibile. Gestione delle relazioni con account strategici, casi limite inediti che non rientrano in alcuno schema precedente, corrispondenza regolatoria o legale, incidenti di crisi (reti di frode, gestione di guasti su larga scala, reclami sensibili per l'immagine). L'IA può essere nel ciclo come strumento di ricerca, ma il percorso di risoluzione è interamente umano e spesso coinvolge più persone (un agente, un responsabile, a volte l'ufficio legale). Costo: 50–200 $+ per ticket a seconda della durata e dell'anzianità. Non c'è un riferimento IA con cui confrontarsi perché la probabilità di sostituzione è di fatto nulla con le capacità attuali. La riassunzione parziale di agenti umani da parte di Klarna nel 2025 è avvenuta soprattutto all'interno di questa classe e al margine superiore dell'Aumento — esattamente la classe dove la confidenza dell'IA era più bassa e il costo di una risposta sbagliata era più alto.
Il riferimento umano, a costo pienamente caricato
Le cifre di costo per ticket sopra riportate poggiano su un riferimento umano che a sua volta merita una banda di confidenza. I dati 2025 di ZipRecruiter per «Customer Support Representative» negli Stati Uniti mostrano una base annua media di circa 42.000 $, con una banda dal 25° al 75° percentile di 34.000–50.000 $ a seconda della geografia e dell'anzianità. A costo pienamente caricato — benefit, contributi sul lavoro, attrezzatura, costi di supervisione, costo di sostituzione per turnover, ammortamento della formazione — il moltiplicatore tipico è di 1,35–1,55×, portando il costo annuo caricato a circa 57.000–77.000 $. Dividi per 1.800–2.000 ore produttive all'anno e ottieni 28–43 $ per ora-agente caricata. A un tempo di gestione tipico del settore di 8–14 minuti per ticket sull'intero mix, questo produce la cifra di 15–25 $ per ticket per il lavoro di routine di livello 1 e la cifra di 25–60 $ per i ticket complessi citata sopra.
I prezzi del BPO esternalizzato — la guida pubblicata da Crescendo, i parametri di mercato intermedio delle società di analisi dei contact center — sono più bassi di questo sulla base del costo per ticket (6–15 $ per voce o chat di livello 1 nelle geografie a costo inferiore) ma non andrebbero letti come il riferimento umano a meno che l'alternativa IA non sia confrontata con lo stesso assetto offshore. Il confronto economicamente onesto accosta il comparabile al comparabile: interno contro interno, BPO contro BPO, e IA contro il costo umano che sta effettivamente sostituendo all'interno di quell'organizzazione. Mescolare i confronti è il modo in cui si ottengono le affermazioni di riduzione dei costi di 10× che non sopravvivono al primo trimestre di operatività.
L'implicazione per il calcolo per classe di sostituzione: in un ambiente interno ad alto costo, il rapporto di 3–5× della Sostituzione totale si amplifica perché il riferimento umano è alto. In un ambiente BPO a basso costo, la stessa tecnologia produce un rapporto di 1,5–2,5× perché il riferimento umano è già basso. La tecnologia è costante; i risparmi no.
Perché bande di confidenza, e non stime puntuali
Una singola cifra in dollari per ticket è la risposta più pulita possibile, ed è quasi sempre sbagliata. Per due motivi.
Primo, la distribuzione degli input a ciascuna classe varia enormemente tra le aziende. Un mix di ticket di fintech consumer pende fortemente verso la Sostituzione totale in cima all'imbuto; una coda di supporto SaaS B2B è carica di Aumento perché i ticket fanno riferimento a configurazioni specifiche del cliente. La stessa affermazione «un agente IA sostituisce un umano» può corrispondere a una riduzione di costo di 4× in un'azienda e di 1,2× in un'altra, non perché la tecnologia sia diversa ma perché lo è la distribuzione del lavoro.
Secondo, i prezzi dell'IA si stanno muovendo. Il costo per token dei modelli di frontiera è calato di circa 10× dall'inizio del 2024 alla metà del 2025. I wrapper di fornitore non sono calati allo stesso ritmo, perché la struttura di costo di un Intercom Fin o di un Ada non è pura inferenza di modello — è recupero delle informazioni, margine del fornitore, azione commerciale e integrazione. L'estremo inferiore di ogni banda segue l'inferenza grezza; l'estremo superiore segue i prezzi del fornitore. Il divario tra i due si restringe nel tempo ma non è nullo.
Pubblichiamo bande di confidenza perché le stime puntuali creano l'illusione di certezza che il caso Klarna ha esplicitamente contraddetto. La cifra di 700 agenti era una stima puntuale, e non è sopravvissuta al contatto con la distribuzione dei ticket residui.
La metodologia Wagecard dietro questi numeri
La Wagecard di Wagecore tratta i ruoli di assistenza clienti come tratta ogni altro ruolo: come una media ponderata tra classi di sostituzione, con ciascuna classe valutata su capacità, affidabilità, costo dell'errore e costo di supervisione. Le quattro classi sopra si mappano sulla nostra frontiera standard — la Sostituzione totale corrisponde alla nostra cella Replaceable, la Sostituzione supervisionata a AI-augmented, l'Aumento a Human-led-AI-assisted, il Residuo non sostituibile a Human-critical.
La Vista Investimento su una funzione di assistenza clienti si legge quindi come un calcolo di VAN, non come un singolo rapporto. Input: distribuzione del volume di ticket tra le quattro classi, costo attuale solo umano per classe, costo atteso IA-più-umano per classe con una policy di audit scelta, costi di passaggio (onboarding del fornitore, costruzione dell'indice di recupero, contratti di riaddestramento), e un tasso di sconto corretto per il rischio che tiene conto della possibilità che i prezzi o la qualità del fornitore cambino a metà contratto. Il TIR sulle code cariche di sostituzione totale è alto — tipicamente 80 %+ su un orizzonte di un anno alle bande sopra. Il TIR sulle code cariche di aumento è modesto. Il periodo di rientro varia da meno di un trimestre a più di due anni a seconda di quale classe domina.
Questa non è una scatola nera. Le classi di sostituzione, le bande di costo e la ponderazione sono tutte pubblicate nella nostra metodologia. Non ricalcoliamo retroattivamente i numeri precedenti quando la nostra metodologia si aggiorna: una Wagecard calcolata sotto la v1 resta una Wagecard v1, con i numeri della v1, anche se la v2 aggiorna le bande. Il motivo è che il costo di una decisione di sostituzione si paga rispetto ai numeri noti al momento della decisione — ricalcolare riscrive la storia in un modo che fa apparire le decisioni precedenti migliori o peggiori di quanto fossero quando sono state prese.
Leggere l'arco di Klarna attraverso le classi
Con le quattro classi in mano, la sequenza annuncio-escalation-ritirata parziale di Klarna si legge con chiarezza:
Le cifre di 700 e 853 agenti catturavano lo spostamento della Sostituzione totale e della maggior parte della Sostituzione supervisionata. Quelle sono reali, il calcolo regge, e il rapporto è più o meno quello che i prezzi pubblici di Intercom Fin e di fornitori equivalenti prevederebbero per un mix di ticket di fintech consumer ad alto volume.
La riassunzione parziale del 2025 catturava l'Aumento e il Residuo non sostituibile. Klarna aveva inizialmente instradato anche quei ticket attraverso l'IA, ha urtato un muro di qualità, e ha corretto. Non è un fallimento dell'IA — è la mappa di sostituzione letta correttamente al secondo tentativo. I confini tra le classi sono reali, e attraversarli su ipotesi ottimistiche costa denaro in insoddisfazione dei clienti più in fretta di quanto ne risparmi in stipendi.
Ciò che il caso non mostra è l'inquadramento binario che domina la maggior parte dei commenti: l'IA o sostituisce l'assistenza clienti o non lo fa. Entrambe le letture sono sbagliate. L'IA sostituisce una frazione misurabile del lavoro a un rapporto di costo noto, con la frazione che dipende dalla distribuzione dei ticket e dalla policy di audit scelta. L'altra frazione resta umana, e diventa più preziosa man mano che il lavoro sostituibile si comprime attorno a essa.
Cosa farne
Ne conseguono tre cose.
Primo, prima di calcolare qualsiasi costo «l'IA sostituisce l'assistenza clienti», classifica i ticket. La quota di Sostituzione totale conta di più perché domina il rapporto. Una coda al 70 % di Sostituzione totale si comporta in modo molto diverso da una al 30 % di Sostituzione totale e 40 % di Aumento — e le cifre di titolo dei concorrenti raramente ti dicono quale hanno.
Secondo, tratta la policy di audit come una variabile di primo piano. La banda di costo della Sostituzione supervisionata è più ampia delle altre perché la scelta di audit cambia il costo unitario di quasi 3×. La maggior parte delle analisi salta questo punto e cita l'estremo che avvalora la conclusione.
Terzo, non prezzare il Residuo non sostituibile rispetto a un riferimento IA. Non ce n'è uno. Quei ticket restano umani, e il confronto giusto è umano-contro-umano (agente senior contro junior, interno contro esternalizzato), non umano-contro-IA. Prezzare il residuo rispetto a un riferimento IA fantasma è ciò che ha fatto sì che il primo passaggio di Klarna sovrastimasse i risparmi — e ciò che porta la maggior parte dei business case interni di «l'IA sostituisce l'assistenza clienti» a sovrapromettere del 30–50 % ancor prima di arrivare al pilota.
Quarto, versiona l'analisi. Le bande qui riflettono i prezzi di inferenza e i prezzi di fornitore così come osservati fino alla metà del 2025. Si muoveranno. Una decisione presa oggi dovrebbe registrare rispetto a quali numeri è stata presa, perché i prossimi dodici mesi di cambiamenti di prezzo sembreranno risparmi solo rispetto a un riferimento invariato. Le Wagecard portano una versione di metodologia sul fronte della scheda proprio per questo motivo: una Wagecard è un'istantanea di una decisione, non una previsione.
Se vuoi la stessa analisi applicata al tuo ruolo o alla tua funzione, con classi di sostituzione, bande di confidenza e una Vista Investimento, è questo che fa Wagecore. La metodologia è aperta su wagecore.ai/methodology e una Wagecard gratuita è su wagecore.ai/start.
Fonti
- Annuncio congiunto Klarna e OpenAI, febbraio 2024 — assistente IA che risolve 2,3 M di conversazioni, equivalente a ~700 agenti.
- Copertura di Yahoo Finance, 2025 — assistente IA di Klarna che svolge un lavoro equivalente a 853 agenti a tempo pieno.
- Copertura del Financial Times sulla riassunzione parziale di agenti umani da parte di Klarna, maggio 2025.
- Dati salariali ZipRecruiter per i rappresentanti dell'assistenza clienti, 2025 — media statunitense su base di costo pienamente caricato per ticket.
- Prezzi pubblici di Intercom Fin AI — parametri di costo per risoluzione fino al 2025.
- Guida ai prezzi dei call center esternalizzati di Crescendo — fasce di costo per ticket del BPO, dal livello 1 ai livelli complessi.