En febrero de 2024, Klarna anunció que un asistente impulsado por OpenAI realizaba el trabajo de 700 agentes de atención al cliente a tiempo completo. Para 2025 la empresa afirmó que la cifra había crecido hasta 853. En mayo de 2025, el CEO de Klarna dijo al Financial Times que la firma había empezado a volver a contratar personas, citando quejas sobre la calidad y los límites de la automatización pura. Ese arco — anuncio, escalada, repliegue parcial — es la historia más citada en cualquier conversación sobre la sustitución de la atención al cliente por IA, y también la peor interpretada. Leída como un triunfo, exagera el caso. Leída como un fracaso, lo minimiza. Leída como una herramienta, dice algo específico: el coste de sustituir a un agente no es un solo número, es una distribución entre clases de sustitución, y las clases se comportan de forma muy distinta.
Este artículo recorre las cuatro clases de sustitución que Wagecore usa para el trabajo de atención al cliente, los rangos de coste con bandas de confianza dentro de cada una, y las decisiones metodológicas detrás de las cifras.
El caso Klarna, leído con cuidado
El comunicado original de Klarna/OpenAI de febrero de 2024 informaba de que el asistente de IA resolvía 2,3 millones de conversaciones en su primer mes — alrededor de dos tercios de los tickets de chat entrantes — con puntuaciones de satisfacción del cliente estadísticamente indistinguibles de las de los agentes humanos y un tiempo medio de resolución que bajaba de 11 minutos a menos de 2. Ese fue el titular. Los detalles posteriores, revelados sobre todo en la cobertura de 2025 de Yahoo Finance y el Financial Times, importan más: la cifra de 700 agentes era una comparación frente a la capacidad de agentes contratados que el asistente desplazó, no frente a los propios empleados de Klarna. La cifra de 853 anunciada más tarde en 2025 usaba el mismo método de comparación. Y el repliegue parcial de 2025 no fue «la IA no funciona» — fue «los tickets residuales que la IA no puede resolver son más difíciles, más cargados emocionalmente, y requieren personas mejor pagadas que la referencia del agente contratado».
Lo que este caso muestra en realidad son las clases de sustitución separándose en el mundo real. La clase de alto volumen, restablecimiento de contraseña, estado-de-mi-pedido pasó casi por completo a la IA y allí se quedó. La clase de disputa-y-diagnóstico pasó mayoritariamente a la IA con un bucle de revisión humana, y allí también se quedó. La clase de escalada compleja pasó a la IA al principio, y luego parcialmente de vuelta a los humanos. Y la clase de relación-o-caso-límite-inédito en realidad nunca se movió.
Eso no es un fallo de la tecnología. Es el mapa de sustitución afirmándose.
Cuatro clases de sustitución
Wagecore clasifica las tareas de atención al cliente en cuatro clases según propiedades observables de coste y fiabilidad — no según si una tarea «parece automatizable». Las clases son:
Sustitución total. Triaje de tickets de nivel 1, restablecimientos de contraseña, consultas de estado de pedido, respuestas de preguntas frecuentes, procesamiento de reembolsos simples dentro de los límites de la política. Estas tareas tienen distribuciones de entrada estrechas, requisitos de fiabilidad altos solo en un pequeño conjunto de modos de fallo, y un coste de error bajo. La IA las gestiona de principio a fin sin un humano en la ruta de resolución. Banda de confianza: 2–8 $ por ticket resuelto usando una API de modelo de vanguardia más un envoltorio de proveedor (Intercom Fin, Ada, Forethought se sitúan todos en este rango según los precios públicos hasta 2025). El extremo bajo supone un proveedor bien ajustado; el extremo alto supone una solución lista para usar con recuperación de información pero sin reentrenamiento. Equivalente humano: 15–25 $ por ticket para un agente de centro de contacto externalizado, según las guías de precios públicas publicadas por Crescendo y el mercado intermedio del BPO. La proporción favorece a la IA en aproximadamente 3–5×, y la brecha es estable.
Sustitución supervisada. Disputas de facturación, resolución de problemas de producto donde importa la configuración del cliente, cambios de cuenta con casos límite de política, quejas sencillas. La IA propone una resolución, un humano la revisa antes de que llegue al cliente — ya sea caso por caso para los de baja confianza, o mediante auditoría por lotes para los de alta confianza. La estructura de costes es notablemente distinta de la sustitución total: se paga el coste de inferencia de la IA más una fracción del tiempo de un agente por ticket, donde la fracción depende de la política de auditoría. Banda de confianza: 5–14 $ por ticket resuelto. La banda amplia refleja la elección entre auditoría intensa (cada ticket revisado) y auditoría ligera (por muestreo). Equivalente solo humano: 18–30 $ por ticket — estos tickets llevan más tiempo que los de sustitución total, así que la referencia humana también sube. La proporción favorece a la IA en 2–3×, y se degrada a medida que se aprieta el bucle de auditoría.
Aumento. Escaladas complejas, situaciones emocionales (reembolsos ligados a circunstancias médicas o familiares, quejas por caídas del servicio), investigaciones entre varios sistemas, casos que requieren atención de la dirección. La IA asiste al humano — redactando respuestas, recuperando el historial, resumiendo tickets previos, sugiriendo precedentes de política — pero no actúa. El humano es dueño de la resolución. El coste es esencialmente «salario humano más una suscripción de asistente de IA por puesto». Banda de confianza: 20–45 $ por ticket. La contribución de la IA aparece como rendimiento, no como plantilla: un agente sénior con un buen copiloto gestiona quizá un 30 % más de tickets por turno. Equivalente solo humano: 25–60 $ por ticket. Proporción: una reducción de coste modesta, de un solo dígito porcentual, con la ventaja expresada como una resolución más rápida en lugar de menor número de agentes.
Residuo no sustituible. Gestión de relaciones con cuentas estratégicas, casos límite inéditos que no encajan en ningún patrón previo, correspondencia regulatoria o legal, incidentes de crisis (redes de fraude, gestión de caídas masivas, quejas sensibles para la reputación). La IA puede estar en el bucle como herramienta de investigación, pero la ruta de resolución es totalmente humana y a menudo abarca a varias personas (un agente, un responsable, a veces el área legal). Coste: 50–200 $+ por ticket según la duración y la antigüedad. No hay una referencia de IA con la que compararse porque la probabilidad de sustitución es efectivamente cero con las capacidades actuales. La recontratación parcial de agentes humanos de Klarna en 2025 ocurrió sobre todo dentro de esta clase y en el borde superior del Aumento — exactamente la clase donde la confianza de la IA era más baja y el coste de una respuesta equivocada era más alto.
La referencia humana, con coste totalmente cargado
Las cifras de coste por ticket anteriores se apoyan en una referencia humana que a su vez merece una banda de confianza. Los datos de 2025 de ZipRecruiter para «Customer Support Representative» en EE. UU. muestran una base anual media de aproximadamente 42.000 $, con una banda del percentil 25 al 75 de 34.000–50.000 $ según la geografía y la antigüedad. Con el coste totalmente cargado — beneficios, impuestos sobre la nómina, equipamiento, gastos generales de gestión, coste de reposición por rotación, amortización de la formación — el multiplicador típico es de 1,35–1,55×, situando el coste anual cargado en aproximadamente 57.000–77.000 $. Divide entre 1.800–2.000 horas productivas al año y obtienes 28–43 $ por hora-agente cargada. A un tiempo de gestión típico del sector de 8–14 minutos por ticket sobre el conjunto de la mezcla, eso produce la cifra de 15–25 $ por ticket para el trabajo rutinario de nivel 1 y la cifra de 25–60 $ para los tickets complejos citada arriba.
Los precios del BPO externalizado — la guía publicada por Crescendo, los indicadores de mercado intermedio de las firmas de análisis de centros de contacto — son más bajos que esto en la base de coste por ticket (6–15 $ para voz o chat de nivel 1 en geografías de menor coste) pero no deberían leerse como la referencia humana salvo que la alternativa de IA se compare con el mismo arreglo en el extranjero. La comparación económicamente honesta empareja lo comparable con lo comparable: interno contra interno, BPO contra BPO, e IA contra el coste humano que en realidad está desplazando dentro de esa organización. Mezclar las comparaciones es como se obtienen las afirmaciones de reducción de coste de 10× que no sobreviven al primer trimestre de operación.
La implicación para el cálculo por clase de sustitución: en un entorno interno de coste alto, la proporción de 3–5× de la Sustitución total se amplifica porque la referencia humana es alta. En un entorno BPO de coste bajo, la misma tecnología produce una proporción de 1,5–2,5× porque la referencia humana ya es baja. La tecnología es constante; los ahorros no lo son.
Por qué bandas de confianza, y no estimaciones puntuales
Una única cifra en dólares por ticket es la respuesta más limpia posible, y casi siempre es errónea. Por dos razones.
Primero, la distribución de entrada a cada clase varía enormemente entre empresas. Una mezcla de tickets de fintech de consumo se inclina fuertemente hacia la Sustitución total en la parte alta del embudo; una cola de soporte de SaaS B2B está cargada de Aumento porque los tickets hacen referencia a configuraciones específicas del cliente. La misma afirmación de «un agente de IA reemplaza a un humano» puede corresponder a una reducción de coste de 4× en una empresa y de 1,2× en otra, no porque la tecnología sea distinta sino porque la distribución del trabajo lo es.
Segundo, los precios de la IA se están moviendo. El coste por token de los modelos de vanguardia ha caído aproximadamente 10× desde principios de 2024 hasta mediados de 2025. Los envoltorios de proveedor no han bajado al mismo ritmo, porque la estructura de coste de un Intercom Fin o un Ada no es inferencia pura de modelo — es recuperación de información, margen del proveedor, esfuerzo comercial e integración. El extremo bajo de cada banda sigue la inferencia bruta; el extremo alto sigue los precios del proveedor. La brecha entre ambos se estrecha con el tiempo pero no es cero.
Publicamos bandas de confianza porque las estimaciones puntuales crean la ilusión de certeza que el caso Klarna contradijo explícitamente. La cifra de 700 agentes era una estimación puntual, y no sobrevivió al contacto con la distribución de tickets residuales.
La metodología Wagecard detrás de estas cifras
La Wagecard de Wagecore trata los puestos de atención al cliente como trata cualquier otro puesto: como una media ponderada entre clases de sustitución, con cada clase puntuada en capacidad, fiabilidad, coste de error y coste de supervisión. Las cuatro clases anteriores encajan en nuestra frontera estándar — la Sustitución total corresponde a nuestra celda Replaceable, la Sustitución supervisada a AI-augmented, el Aumento a Human-led-AI-assisted, el Residuo no sustituible a Human-critical.
La Vista de Inversión sobre una función de atención al cliente se lee por tanto como un cálculo de VAN, no como una única proporción. Entradas: distribución del volumen de tickets entre las cuatro clases, coste actual solo humano por clase, coste esperado IA-más-humano por clase con una política de auditoría elegida, costes de cambio (incorporación del proveedor, construcción del índice de recuperación, contratos de reentrenamiento), y una tasa de descuento ajustada al riesgo que tiene en cuenta la posibilidad de que los precios o la calidad del proveedor cambien a mitad de contrato. La TIR en colas cargadas de sustitución total es alta — típicamente 80 %+ en un horizonte de un año a las bandas anteriores. La TIR en colas cargadas de aumento es modesta. El periodo de recuperación varía desde menos de un trimestre hasta más de dos años según qué clase domine.
Esto no es una caja negra. Las clases de sustitución, las bandas de coste y la ponderación están todas publicadas en nuestra metodología. No rellenamos retroactivamente las cifras anteriores cuando nuestra metodología se revisa: una Wagecard calculada bajo la v1 sigue siendo una Wagecard v1, con las cifras de la v1, aunque la v2 actualice las bandas. La razón es que el coste de una decisión de sustitución se paga contra las cifras conocidas en el momento de decidir — rellenar reescribe la historia de un modo que hace que las decisiones anteriores parezcan mejores o peores de lo que fueron cuando se tomaron.
Leer el arco de Klarna a través de las clases
Con las cuatro clases en mano, la secuencia anuncio-escalada-repliegue parcial de Klarna se lee con claridad:
Las cifras de 700 y 853 agentes capturaban el desplazamiento de la Sustitución total y de la mayor parte de la Sustitución supervisada. Esas son reales, el cálculo se sostiene, y la proporción es aproximadamente la que los precios públicos de Intercom Fin y proveedores equivalentes predecirían para una mezcla de tickets de fintech de consumo de alto volumen.
La recontratación parcial de 2025 capturaba el Aumento y el Residuo no sustituible. Klarna dirigió inicialmente esos tickets también por la IA, chocó con un muro de calidad, y ajustó. Eso no es un fallo de la IA — es el mapa de sustitución leído correctamente en el segundo intento. Las fronteras entre clases son reales, y cruzarlas con supuestos optimistas cuesta dinero en insatisfacción del cliente más rápido de lo que lo ahorra en salarios.
Lo que el caso no muestra es el encuadre binario que domina la mayoría de los comentarios: la IA o reemplaza la atención al cliente o no. Ambas lecturas son erróneas. La IA reemplaza una fracción medible del trabajo a una proporción de coste conocida, dependiendo la fracción de la distribución de tickets y de la política de auditoría elegida. La otra fracción sigue siendo humana, y se vuelve más valiosa a medida que el trabajo sustituible se comprime a su alrededor.
Qué hacer con esto
De aquí se siguen tres cosas.
Primero, antes de calcular cualquier coste de «la IA reemplaza la atención al cliente», clasifica los tickets. La proporción de Sustitución total importa más porque domina la proporción global. Una cola que es 70 % Sustitución total se comporta de forma muy distinta de una que es 30 % Sustitución total y 40 % Aumento — y las cifras de titular de los competidores rara vez te dicen cuál tienen.
Segundo, trata la política de auditoría como una variable de primer orden. La banda de coste de la Sustitución supervisada es más amplia que las demás porque la elección de auditoría cambia el coste unitario en casi 3×. La mayoría de los análisis se saltan esto y citan el extremo que favorece la conclusión.
Tercero, no tarifiques el Residuo no sustituible contra una referencia de IA. No la hay. Esos tickets siguen siendo humanos, y la comparación correcta es humano-contra-humano (agente sénior contra júnior, interno contra externalizado), no humano-contra-IA. Tarifar el residuo contra una referencia de IA fantasma es lo que hizo que la primera pasada de Klarna sobrestimara los ahorros — y lo que hace que la mayoría de los casos de negocio internos de «la IA reemplaza la atención al cliente» prometan de más en un 30–50 % antes incluso de llegar al piloto.
Cuarto, versiona el análisis. Las bandas aquí reflejan los precios de inferencia y los precios de proveedor tal como se observaron hasta mediados de 2025. Se moverán. Una decisión tomada hoy debería registrar contra qué cifras se tomó, porque los próximos doce meses de cambios de precios parecerán ahorros solo frente a una referencia inalterada. Las Wagecards llevan una versión de metodología en el anverso de la tarjeta precisamente por esta razón: una Wagecard es una instantánea de una decisión, no un pronóstico.
Si quieres el mismo análisis aplicado a tu propio puesto o función, con clases de sustitución, bandas de confianza y una Vista de Inversión, eso es lo que hace Wagecore. La metodología está abierta en wagecore.ai/methodology y una Wagecard gratuita está en wagecore.ai/start.
Fuentes
- Anuncio conjunto de Klarna y OpenAI, febrero de 2024 — asistente de IA resolviendo 2,3 M de conversaciones, equivalente a ~700 agentes.
- Cobertura de Yahoo Finance, 2025 — asistente de IA de Klarna realizando trabajo equivalente a 853 agentes a tiempo completo.
- Cobertura del Financial Times sobre la recontratación parcial de agentes humanos por Klarna, mayo de 2025.
- Datos salariales de ZipRecruiter para representantes de atención al cliente, 2025 — media de EE. UU. sobre una base de coste totalmente cargado por ticket.
- Precios públicos de Intercom Fin AI — indicadores de coste por resolución hasta 2025.
- Guía de precios de centros de llamadas externalizados de Crescendo — rangos de coste por ticket del BPO, desde nivel 1 hasta niveles complejos.