# Caso · Pablo, lead de customer service en e-commerce

## Perfil

- **Edad:** 36 años
- **Rol:** Lead de soporte al cliente en e-commerce de productos para mascotas (~80 personas total, 8 en su equipo)
- **Ciudad:** Guadalajara
- **Background técnico:** intermedio. Sabe SQL básico para reportes. Power user de Zendesk. Casual de ChatGPT.
- **Equipo:** 8 agentes de soporte (turnos rotativos para cubrir 7am-11pm)

## El dolor

El equipo de Pablo tenía **dos problemas que se alimentaban entre sí**:

1. **Volumen.** ~600 tickets al día. 70% eran preguntas frecuentes de los mismos 15 temas (estatus de pedido, cambios de talla, reembolsos, info de productos, problemas de pago). Sus agentes pasaban el 60% del tiempo escribiendo respuestas similares.

2. **Calidad inconsistente.** Cada agente respondía un poco diferente. A veces la respuesta era técnicamente correcta pero el tono no embonaba con la marca. Cuando un agente estaba cansado al final del turno, los reviews bajaban en NPS.

Su equipo estaba quemado. Tres agentes habían renunciado en 6 meses citando "no aguantamos contestar lo mismo cada día".

## Lo que montó

Pablo armó **un sistema de 3 niveles** con human-in-the-loop:

**Nivel 1 — Auto-resolución (40% de tickets):**
- Make conecta Zendesk con Claude vía MCP
- Tickets sobre temas obvios (estatus de pedido, info de producto del catálogo) los resuelve Claude solo, con respuesta personalizada al cliente
- Si la respuesta requiere data en tiempo real (estatus de envío), Claude consulta el sistema de logística vía MCP

**Nivel 2 — Borrador para agente (45% de tickets):**
- Claude redacta un borrador de respuesta basado en la base de conocimiento del equipo
- El agente humano revisa, ajusta tono si necesita, y manda en 60-90 segundos en lugar de los 4-5 minutos de antes
- El agente queda con criterio para no mandar borradores que no se sienten bien

**Nivel 3 — 100% humano (15% de tickets):**
- Reclamaciones complejas, devoluciones disputadas, clientes molestos, situaciones legales
- Nunca pasan por el agente — directo al humano
- Pablo y su lead técnico revisan estos casos personalmente cada lunes

## El resultado

| | Antes | Después |
|---|---|---|
| Tickets resueltos / agente / día | 50 | 95 |
| Tiempo promedio de respuesta | 47 min | 8 min |
| NPS (Net Promoter Score) | 52 | 71 |
| Quejas por tono frío/robótico | n/a | 4 en 3 meses |
| Renuncias del equipo | 3 en 6 meses | 0 en 6 meses |

El cambio en NPS fue lo que más sorprendió. La gente esperaba que los clientes se quejaran de "te contesta una IA". Pasó lo contrario: respuestas más rápidas + tono consistente + agentes humanos con tiempo para casos difíciles = clientes más felices.

## Lo que NO automatizó

Pablo NO automatizó:

- **Reclamaciones formales** (refunds grandes, disputas)
- **Conversaciones con clientes molestos** — cuando el agente detecta lenguaje agresivo, escala inmediatamente a humano
- **Decisiones de excepción** (refund fuera de política, descuento especial) — siempre humano con autoridad
- **Comunicación pública en redes sociales** — eso pasa por marketing, no por soporte
- **Coaching del equipo** — Pablo lee transcripciones manualmente y da feedback semanal

El agente toma lo predecible. El humano toma lo importante.

## Lo que él dice del cambio

> "El miedo más grande era el rechazo del cliente — pensábamos que se iban a quejar de hablar con una IA. Pero entendimos algo: el cliente no quiere hablar con un humano, quiere su problema resuelto. Si el agente lo resuelve bien y rápido, el cliente está feliz. Si requiere humano, escalada inmediata. Lo importante es no fingir que el agente es humano y no hacer al humano fingir que es máquina." — Pablo

## Tu paralelo si eres customer service

Si tu trabajo se parece al del equipo de Pablo, tu primer experimento probablemente es uno de estos:

1. **Auto-respuesta de FAQs simples** (estatus de pedido, info de producto) — el quick win obvio
2. **Borrador de respuesta para temas medios** (cambios, política de devoluciones)
3. **Categorización automática de tickets** entrantes para routing al agente correcto
4. **Resumen de calls de soporte** para training del equipo
5. **Detección de sentimiento** — flag de cliente molesto para escalar antes

**Lo que NO te recomiendo:**
- Aprobar refunds grandes automático (alto impacto financiero)
- Responder a quejas en redes sociales sin revisión (riesgo reputacional)
- Manejar clientes en crisis sin humano (requiere empatía)

---

> **Una nota crucial sobre human-in-the-loop.** El sistema de Pablo funciona porque la **escalada está bien diseñada**. El agente sabe cuándo NO sabe. Detecta:
>
> - Lenguaje emocional agresivo → escala
> - Pregunta sobre algo que no está en su base → escala
> - Cliente menciona "abogado" / "voy a demandar" / "Profeco" → escalada inmediata
> - El cliente pide explícitamente humano → escala
>
> Sin esa lógica, el sistema falla en los momentos que más importan.
>
> — Academia Agentes de IA