Por qué la IA en producción casi siempre necesita humanos
Un modelo en una demostración funciona el 95% de las veces. Un proceso en producción tiene que aguantar el 5% restante sin romper la confianza del cliente, sin enviar un correo equivocado, sin escribir un dato incorrecto en el ERP. Esa diferencia entre demostración y producción es donde aparece la revisión humana.
La revisión humana no nace de la desconfianza ciega hacia el modelo. Es asumir que la IA generativa comete errores con confianza, que las consecuencias de algunos errores son caras o irreversibles, y que el coste de revisar un borrador es mucho menor que el coste de retractar una respuesta enviada. Para procesos sensibles — comunicación con clientes, escritura sobre el CRM, decisiones con impacto regulatorio — tener una persona dentro del proceso es lo que hace que el agente sea apto para producción.
Tres patrones de revisión humana que funcionan
La revisión no siempre tiene la misma forma. Tres patrones cubren la mayoría de los casos que vemos en producción:
- Revisión antes de enviar. El agente genera el borrador, una persona lo aprueba con un clic. Es el patrón de partida para correos a clientes, respuestas a reseñas, propuestas comerciales y cualquier mensaje que salga con la marca. La velocidad la pone el agente; el riesgo lo absorbe el humano.
- Revisión según confianza. El modelo evalúa su propia confianza en la respuesta. Por encima de un umbral, actúa solo. Por debajo, deriva a una persona. Útil para clasificación, triaje de incidencias o enriquecimiento de datos donde la mayoría de casos son fáciles y solo el residual requiere ojo humano.
- Derivación de excepciones. El agente actúa solo en el flujo normal pero detecta señales de excepción — queja, urgencia, dato ambiguo, política sensible — y pasa el caso a una persona con todo el contexto. Es el patrón típico de concierge, soporte y agentes de ventas.
Los tres se pueden combinar dentro del mismo proceso. Lo importante es que el patrón esté elegido a propósito y no por descuido.
Diseñar la revisión: cuándo, quién, con qué información
Una revisión mal diseñada se convierte en un cuello de botella. Una revisión bien diseñada parece invisible. La diferencia está en tres preguntas:
- ¿Cuándo? Antes de que el resultado afecte a un cliente, modifique un sistema externo o escriba sobre un dato sensible. No después.
- ¿Quién? La persona con autoridad y contexto para decidir, no el primero disponible. Asignar al equipo equivocado convierte la revisión en un trámite que nadie hace bien.
- ¿Con qué información? El borrador, las fuentes que usó el agente, el contexto del caso y la acción concreta que se propone. Sin esto, la persona aprueba a ciegas — que es peor que no tener revisión.
La revisión también necesita un canal claro: dónde llega la notificación, qué pasa si nadie la atiende, cuánto tiempo tiene la persona para decidir y qué se hace si vence el plazo. Sin esto, la cola crece y el proyecto se cae solo.
Cuándo se puede quitar al humano (y cuándo no)
La revisión humana no es para siempre. La pregunta correcta no es ¿lo dejamos sin revisión? sino ¿qué tendría que ser cierto para quitar la revisión?. Tres condiciones razonables:
- La tasa de aprobación sin cambios lleva semanas por encima del 95% en un volumen significativo.
- El coste de un error individual es bajo y reversible — un borrador interno, una clasificación que se puede corregir, un dato no crítico.
- Existe un mecanismo de auditoría a posteriori: muestreo, alertas, paneles. El humano sale del flujo en tiempo real, no de la supervisión.
Para procesos con impacto regulatorio, financiero o de seguridad, el humano se queda. No por miedo: por diseño. El Reglamento de IA europeo reconoce explícitamente la supervisión humana como mecanismo de mitigación para sistemas de alto riesgo, y los sectores regulados (sanidad, finanzas, legal) lo dan por hecho.