Em fevereiro de 2024, a Klarna anunciou que um assistente movido pela OpenAI estava dando conta do trabalho de 700 agentes de atendimento em tempo integral. Até 2025 a empresa afirmou que o número havia crescido para 853. Em maio de 2025, o CEO da Klarna disse ao Financial Times que a companhia tinha voltado a contratar humanos, alegando reclamações de qualidade e os limites da automação pura. Esse arco — anúncio, escalada, recuo parcial — é a história mais citada em qualquer conversa sobre IA substituindo o suporte ao cliente, e também é a mais mal interpretada. Tratada como triunfo, exagera o argumento. Tratada como fracasso, subestima-o. Tratada como instrumento, ela diz algo específico: o custo de substituir um agente não é um número, é uma distribuição entre classes de substituição, e as classes se comportam de formas muito diferentes.
Este texto percorre as quatro classes de substituição que a Wagecore usa para o trabalho de suporte ao cliente, as faixas de custo com bandas de confiança dentro de cada uma e as escolhas metodológicas por trás dos números.
O caso Klarna, lido com atenção
O comunicado original Klarna/OpenAI, de fevereiro de 2024, relatou que o assistente de IA resolveu 2,3 milhões de conversas em seu primeiro mês — cerca de dois terços dos tíquetes de chat recebidos — com índices de satisfação do cliente estatisticamente indistinguíveis dos agentes humanos e tempo médio de resolução caindo de 11 minutos para menos de 2. Esse foi o título. Os detalhes de acompanhamento, em grande parte revelados na cobertura de 2025 do Yahoo Finance e do Financial Times, importam mais: o número de 700 agentes era uma comparação com a capacidade contratada de agentes que o assistente deslocou, não com os próprios funcionários da Klarna. O número de 853, anunciado mais tarde em 2025, usou o mesmo método de comparação. E a reversão parcial de 2025 não foi "a IA não funciona" — foi "os tíquetes residuais que a IA não consegue resolver são mais difíceis, mais carregados emocionalmente e exigem humanos mais bem pagos do que a base contratada de agentes."
O que esse caso de fato mostra são as classes de substituição se separando no mundo real. A classe de alto volume, de redefinição de senha e "onde está meu pedido" foi quase inteiramente para a IA e ali permaneceu. A classe de disputa e diagnóstico foi majoritariamente para a IA com um laço de revisão humana, e também ali permaneceu. A classe de escalada complexa foi inicialmente para a IA e depois parcialmente de volta para humanos. E a classe de relacionamento ou caso de borda inédito nunca chegou a se mover.
Isso não é uma falha da tecnologia. É o mapa de substituição se afirmando.
Quatro classes de substituição
A Wagecore classifica as tarefas de suporte ao cliente em quatro classes com base em propriedades observáveis de custo e confiabilidade — não com base em se a tarefa "parece automatizável". As classes são:
Substituição Total. Triagem de tíquetes de N1, redefinição de senhas, consultas de status de pedido, respostas de FAQ, processamento simples de reembolso dentro dos limites da política. Essas tarefas têm distribuições de entrada estreitas, exigências de confiabilidade altas apenas em um pequeno conjunto de modos de falha e baixo custo de erro. A IA as resolve de ponta a ponta sem um humano no caminho da resolução. Banda de confiança: US$ 2 a US$ 8 por tíquete resolvido usando uma API de modelo de fronteira mais um wrapper de fornecedor (Intercom Fin, Ada e Forethought ficam todos nessa faixa segundo os preços públicos até 2025). O piso pressupõe um fornecedor bem ajustado; o teto pressupõe uma solução pronta com recuperação, mas sem retreinamento. Equivalente humano: US$ 15 a US$ 25 por tíquete para um agente de central de contato terceirizada, segundo os guias públicos de preços publicados pela Crescendo e o mercado intermediário de BPO. A razão favorece a IA em cerca de 3 a 5×, e a diferença é estável.
Substituição Supervisionada. Disputas de cobrança, diagnóstico de produto em que a configuração do cliente importa, alterações de conta com casos de borda de política, reclamações simples. A IA propõe uma resolução, um humano a revisa antes de ela ir para o cliente — caso a caso para situações de baixa confiança, ou via auditoria em lote para situações de alta confiança. A estrutura de custo é significativamente diferente da substituição total: você paga o custo de inferência da IA mais uma fração do tempo de um agente por tíquete, em que a fração depende da sua política de auditoria. Banda de confiança: US$ 5 a US$ 14 por tíquete resolvido. A banda larga reflete a escolha entre auditoria pesada (todos os tíquetes revisados) e auditoria leve (por amostragem). Equivalente somente humano: US$ 18 a US$ 30 por tíquete — esses tíquetes levam mais tempo do que os de substituição total, então a base humana também sobe. A razão favorece a IA em 2 a 3×, e piora à medida que você aperta o laço de auditoria.
Aumento. Escaladas complexas, situações emocionais (reembolsos ligados a circunstâncias médicas ou familiares, reclamações sobre falhas de serviço), investigações multissistema, casos que exigem atenção da diretoria. A IA auxilia o humano — redigindo respostas, puxando histórico, resumindo tíquetes anteriores, sugerindo precedentes de política — mas não age. O humano é o dono da resolução. O custo é essencialmente "salário humano mais uma assinatura de assistente de IA por posto". Banda de confiança: US$ 20 a US$ 45 por tíquete. A contribuição da IA aparece como vazão, não como quadro de pessoal: um agente sênior com um bom copiloto atende talvez 30% mais tíquetes por turno. Equivalente somente humano: US$ 25 a US$ 60 por tíquete. Razão: redução de custo modesta, de um dígito percentual, com o ganho expresso como resolução mais rápida, e não como menos agentes.
Residual não substituível. Gestão de relacionamento com contas estratégicas, casos de borda inéditos que não se encaixam em nenhum padrão anterior, correspondência regulatória ou jurídica, incidentes de crise (quadrilhas de fraude, gestão de queda em massa, reclamações sensíveis à imagem). A IA pode estar no laço como ferramenta de pesquisa, mas o caminho da resolução é inteiramente humano e frequentemente envolve vários humanos (um agente, um gerente, às vezes o jurídico). Custo: US$ 50 a mais de US$ 200 por tíquete, dependendo da duração e da senioridade. Não há uma base de IA com que comparar, porque a probabilidade de substituição é efetivamente zero nas capacidades atuais. A recontratação parcial de agentes humanos pela Klarna em 2025 aconteceu majoritariamente dentro dessa classe e na borda superior do Aumento — exatamente a classe em que a confiança da IA era menor e o custo de uma resposta errada era mais alto.
A base humana, com todos os custos
Os números de custo por tíquete acima repousam sobre uma base humana que, ela própria, merece uma banda de confiança. Os dados de 2025 do ZipRecruiter para "Representante de Suporte ao Cliente" nos EUA mostram uma base anual média de cerca de US$ 42.000, com uma banda entre os percentis 25 e 75 de US$ 34.000 a US$ 50.000, dependendo da geografia e do tempo de casa. Com todos os custos — benefícios, encargos sobre a folha, equipamento, sobrecarga de gestão, custo de reposição por rotatividade, amortização de treinamento — o multiplicador típico é de 1,35 a 1,55×, colocando o custo anual carregado em cerca de US$ 57.000 a US$ 77.000. Divida por 1.800 a 2.000 horas produtivas por ano e você chega a US$ 28 a US$ 43 por hora de agente carregada. Com um tempo de atendimento típico do setor de 8 a 14 minutos por tíquete no mix completo, isso produz a faixa de US$ 15 a US$ 25 por tíquete para o trabalho rotineiro de N1 e a faixa de US$ 25 a US$ 60 para os tíquetes complexos citada acima.
O preço de BPO terceirizado — o guia publicado da Crescendo, os benchmarks de mercado intermediário das firmas de análise de central de contato — fica abaixo disso na base por tíquete (US$ 6 a US$ 15 para N1 de voz ou chat em geografias de menor custo), mas não deve ser lido como a base humana a menos que a alternativa de IA esteja sendo comparada com o mesmo arranjo offshore. A comparação economicamente honesta coloca semelhante contra semelhante: interno contra interno, BPO contra BPO, e IA contra o custo humano que ela de fato está deslocando dentro daquela organização. Misturar as comparações é como se chega às alegações de redução de custo de 10× que não sobrevivem ao primeiro trimestre de operação.
A implicação para a matemática das classes de substituição: em um ambiente interno de alto custo, a razão de 3 a 5× da Substituição Total se acumula porque a base humana é alta. Em um ambiente de BPO de baixo custo, a mesma tecnologia produz uma razão de 1,5 a 2,5× porque a base humana já é baixa. A tecnologia é constante; a economia, não.
Por que bandas de confiança, e não estimativas pontuais
Um único valor em dólares por tíquete é a resposta mais limpa possível, e quase sempre está errada. Duas razões.
Primeiro, a distribuição de entrada de cada classe varia enormemente entre empresas. O mix de tíquetes de uma fintech de consumo é fortemente de Substituição Total no topo do funil; a fila de suporte de um SaaS B2B é pesada em Aumento porque os tíquetes fazem referência a configurações específicas do cliente. A mesma alegação de "um agente de IA substitui um humano" pode mapear para uma redução de custo de 4× em uma empresa e de 1,2× em outra, não porque a tecnologia seja diferente, mas porque a distribuição do trabalho é.
Segundo, o preço da IA está em movimento. O custo por token dos modelos de fronteira caiu cerca de 10× do início de 2024 a meados de 2025. Os wrappers de fornecedor não caíram na mesma proporção, porque a estrutura de custo de um Intercom Fin ou de um Ada não é pura inferência de modelo — é recuperação, margem do fornecedor, esforço de vendas e integração. O piso de cada banda acompanha a inferência bruta; o teto acompanha o preço do fornecedor. A distância entre os dois se estreita com o tempo, mas não é zero.
Publicamos bandas de confiança porque estimativas pontuais criam a ilusão de certeza que o caso Klarna contradisse explicitamente. O número de 700 agentes era uma estimativa pontual, e não sobreviveu ao contato com a distribuição de tíquetes residuais.
A metodologia do Wagecard por trás desses números
O Wagecard da Wagecore trata os cargos de suporte ao cliente da mesma forma que trata todos os outros cargos: como uma média ponderada entre classes de substituição, com cada classe pontuada em capacidade, confiabilidade, custo de erro e custo de supervisão. As quatro classes acima se mapeiam na nossa fronteira padrão — Substituição Total corresponde à nossa célula Replaceable, Substituição Supervisionada a AI-augmented, Aumento a Human-led-AI-assisted, Residual não substituível a Human-critical.
A Visão de Investimento sobre uma função de suporte ao cliente, portanto, se lê como um cálculo de VPL, não como uma razão única. Entradas: distribuição do volume de tíquetes entre as quatro classes, custo atual somente humano por classe, custo esperado de IA-mais-humano por classe com uma política de auditoria escolhida, custos de troca (integração do fornecedor, construção do índice de recuperação, contratos de retreinamento) e uma taxa de desconto ajustada ao risco que leve em conta a chance de o preço ou a qualidade do fornecedor mudarem no meio do contrato. A TIR em filas pesadas de substituição total é alta — tipicamente acima de 80% em um horizonte de um ano nas bandas acima. A TIR em filas pesadas de aumento é modesta. O período de retorno varia de menos de um trimestre a mais de dois anos, dependendo de qual classe domina.
Isto não é uma caixa-preta. As classes de substituição, as bandas de custo e a ponderação estão todas publicadas na nossa metodologia. Não preenchemos retroativamente números anteriores quando nossa metodologia é revisada: um Wagecard calculado sob a v1 permanece um Wagecard v1, com os números da v1, mesmo que a v2 atualize as bandas. A razão é que o custo de uma decisão de substituição é pago contra os números conhecidos no momento da decisão — o preenchimento retroativo reescreve a história de um jeito que faz decisões anteriores parecerem melhores ou piores do que foram quando tomadas.
Lendo o arco da Klarna através das classes
Com as quatro classes em mãos, a sequência anúncio-escalada-recuo-parcial da Klarna se lê de forma limpa:
Os números de 700 e 853 agentes capturaram o deslocamento da Substituição Total e da maior parte da Substituição Supervisionada. Esses são reais, a conta fecha, e a razão é aproximadamente o que o preço público do Intercom Fin e de fornecedores equivalentes preveria para um mix de tíquetes de fintech de consumo de alto volume.
A recontratação parcial de 2025 capturou o Aumento e o Residual não substituível. A Klarna inicialmente roteou esses tíquetes também pela IA, bateu em uma parede de qualidade e ajustou. Isso não é uma falha da IA — é o mapa de substituição sendo lido corretamente na segunda vez. As fronteiras entre classes são reais, e cruzá-las com base em premissas otimistas custa dinheiro em insatisfação do cliente mais rápido do que economiza em salário.
O que o caso não mostra é o enquadramento binário que domina a maior parte dos comentários: a IA ou substitui o suporte ao cliente, ou não. As duas leituras estão erradas. A IA substitui uma fração mensurável do trabalho a uma razão de custo conhecida, com a fração dependendo da distribuição de tíquetes e da política de auditoria escolhida. A outra fração permanece humana, e fica mais valiosa à medida que o trabalho substituível se comprime ao seu redor.
O que fazer com isso
Três coisas decorrem daqui.
Primeiro, antes de calcular qualquer custo de "a IA substitui o suporte ao cliente", classifique os tíquetes. A parcela de Substituição Total é a que mais importa porque domina a razão. Uma fila que é 70% Substituição Total se comporta de forma muito diferente de uma que é 30% Substituição Total e 40% Aumento — e os números de manchete dos concorrentes raramente dizem qual delas eles têm.
Segundo, trate a política de auditoria como uma variável de primeira classe. A banda de custo da Substituição Supervisionada é mais larga que as outras porque a escolha de auditoria muda o custo unitário em quase 3×. A maioria dos textos pula isso e cita o extremo que mais favorece a conclusão.
Terceiro, não precifique o Residual não substituível contra uma base de IA. Não existe uma. Esses tíquetes permanecem humanos, e a comparação certa é humano contra humano (agente sênior vs. júnior, interno vs. terceirizado), não humano contra IA. Precificar o residual contra uma base de IA fantasma foi o que fez a primeira tentativa da Klarna superestimar a economia — e é o que faz a maioria dos casos de negócio internos de "a IA substitui o suporte ao cliente" prometer 30 a 50% a mais antes mesmo de chegarem ao piloto.
Quarto, versione a análise. As bandas aqui refletem o preço de inferência e o preço de fornecedor observados até meados de 2025. Eles vão se mover. Uma decisão tomada hoje deveria registrar contra quais números foi tomada, porque os próximos doze meses de mudanças de preço vão parecer economia apenas contra uma base inalterada. Os Wagecards carregam uma versão de metodologia na face do cartão exatamente por essa razão: um Wagecard é um retrato de uma decisão, não uma previsão.
Se você quiser a mesma análise rodada sobre o seu próprio cargo ou função, com classes de substituição, bandas de confiança e uma Visão de Investimento, é isso que a Wagecore faz. A metodologia está aberta em wagecore.ai/methodology e um Wagecard gratuito está em wagecore.ai/start.
Fontes
- Anúncio conjunto da Klarna e da OpenAI, fevereiro de 2024 — assistente de IA resolvendo 2,3 milhões de conversas, equivalente a ~700 agentes.
- Cobertura do Yahoo Finance, 2025 — assistente de IA da Klarna realizando trabalho equivalente a 853 agentes em tempo integral.
- Cobertura do Financial Times sobre a recontratação parcial de agentes humanos pela Klarna, maio de 2025.
- Dados de salário de representante de suporte ao cliente do ZipRecruiter, 2025 — base de custo por tíquete totalmente carregada, média dos EUA.
- Preço público do Intercom Fin AI — benchmarks de custo por resolução até 2025.
- Guia de preços de central de atendimento terceirizada da Crescendo — faixas de custo de BPO por tíquete, de N1 a níveis complexos.