«Queremos un chatbot». Esta frase la oímos cada semana en encuadre. Y nueve de cada diez veces hay que escarbar: detrás de la palabra chatbot se esconde a veces un verdadero chatbot —sistema de preguntas/respuestas sobre conocimiento—, pero a menudo un agente de IA, es decir, un sistema capaz de tomar decisiones y ejecutar acciones en herramientas externas.
La diferencia no es cosmética. Condiciona el coste (del simple al quíntuple), la complejidad de implementación, el perfil de riesgo y la estrategia de roll-out. Este artículo propone un método claro para arbitrar, basado en lo que observamos en nuestros proyectos DevHighWay 2025-2026.
Chatbot vs agente: una frontera técnica clara
Un chatbot moderno es un sistema de Q/R que se apoya en RAG (Retrieval-Augmented Generation). El usuario hace una pregunta, el sistema recupera los pasajes relevantes en una base vectorial (Qdrant, Pinecone, pgvector), los pasa al LLM con la pregunta y devuelve una respuesta sintética. Perímetro cerrado, criticidad de error baja, arquitectura madura.
Un agente de IA opera de manera distinta. Recibe un objetivo, planifica una secuencia de acciones, llama a herramientas (API, bases de datos, funciones de negocio), evalúa los resultados intermedios e itera hasta alcanzar el objetivo — o fallar limpiamente. Patrones típicos: ReAct, Plan-and-Execute, multiagente. El perímetro es abierto, el árbol de decisión combinatorio, el riesgo operativo real.
Paso 1 — Listar las interacciones deseadas
La prueba decisiva se resume en una pregunta: ¿el usuario saldrá de la interacción con una información o con una acción ejecutada? «¿Cuáles son vuestros plazos de entrega?» es una pregunta de información. «Mueve mi entrega al sábado» es una solicitud de acción. Si el 90 % de las interacciones caen en el primer grupo, tienes un caso de chatbot.
Muchos proyectos mezclan los dos. En ese caso, el buen enfoque no es sistemáticamente un agente único que haga ambas cosas: a menudo es un chatbot RAG que detecta las solicitudes de acción y las escala hacia un workflow dedicado — más simple de construir, más predecible de explotar.
Paso 2 — Identificar las manipulaciones de estado externas
Si la interacción modifica un estado en un sistema de terceros (crear un ticket Zendesk, actualizar un deal Salesforce, lanzar un pago Stripe, disparar un workflow n8n), estás en territorio de agente. El tool use —capacidad del LLM para llamar a funciones externas— se vuelve central. La arquitectura, la observabilidad y el perfil de riesgo cambian radicalmente.
- Lectura sola: mostrar un estado de pedido, recuperar una factura — gestionable en chatbot con RAG enriquecido con API de lectura
- Escritura simple: crear un ticket, añadir una nota — agente ligero tipo OpenAI Assistants API
- Escritura compleja multietapa: encadenar 4-5 llamadas con dependencias y rollback — LangGraph o AutoGen
- Acción crítica: transferencia, eliminación, contrato — agente obligatorio con validación humana durante los primeros meses
Paso 3 — Evaluar la criticidad de error
El coste de un error define el nivel de inversión en barreras de seguridad. Un chatbot de atención al cliente que responde mal cuesta una frustración del usuario y una llamada humana. Un agente contable que se equivoca cuesta un asiento erróneo, a veces difícilmente auditable. A volumen equivalente, el impacto no es comparable.
Nuestra regla práctica: por debajo de 50 € de impacto medio por error, un agente autónomo bien diseñado es defendible. Entre 50 y 500 €, imponemos un modo asistido por humano al menos durante los primeros 90 días. Por encima de 500 €, validación humana permanente o perímetro restringido. Estos umbrales protegen tanto al proyecto como a los usuarios finales.
Paso 4 — Elegir el framework adecuado
El mercado de los frameworks se ha estabilizado en 2025-2026 en torno a unos pocos actores. Para un chatbot RAG: LangChain o LlamaIndex para la orquestación, Qdrant o Pinecone para el vector store, Cohere Rerank para la relevancia, RAGAS para la evaluación. LLM a elegir: GPT-4 Turbo, Claude 3.7 Sonnet, Mistral Large 2 para la soberanía.
Para un agente, la elección depende de la complejidad del workflow. OpenAI Assistants API para arrancar rápido en un caso simple. LangGraph para workflows con estados complejos con bifurcaciones y retomas. AutoGen para el multiagente con especialización por rol. Anthropic tool use para la robustez en producción en un agente monolítico. vLLM para servir un modelo autoalojado si lo exige la soberanía.
- Chatbot 5-15 k€ de implementación: RAG + LLM cloud, despliegue 4-8 semanas, OPEX 100-500 €/mes
- Agente simple 20-35 k€: 2-5 tools, OpenAI Assistants API o LangGraph ligero, despliegue 8-12 semanas
- Agente complejo 35-60 k€: workflow multietapa, observabilidad completa, multiagente eventual — 12-20 semanas
- Consumo de tokens: un agente consume de 2 a 5 veces más tokens que un chatbot equivalente — factor clave del OPEX
Paso 5 — Diseñar la observabilidad desde el día 0
La observabilidad no es un nice-to-have, es un prerrequisito. Para un chatbot, LangSmith u OpenAI Evals cubren lo esencial: traza de los prompts, scores de calidad automatizados, CSAT post-conversación, alertas sobre derivas. Para un agente, se añade un audit log estructurado de cada tool call (entrada, salida, duración, estado) y un replay de las sesiones para depurar.
Sin observabilidad, un agente en producción se convierte en una caja negra ingobernable al cabo de unas semanas. Los incidentes se acumulan sin diagnóstico posible, los usuarios pierden la confianza, el proyecto muere. Cuenta entre el 10 y el 15 % del presupuesto de implementación para la observabilidad — es una inversión defensiva, no un gasto anexo.
Paso 6 — Plan de roll-out progresivo
Ningún agente de IA debe pasar directamente de la demo al modo autónomo. El roll-out se hace en tres fases distintas. Primero silencioso: el agente funciona en paralelo a los humanos, sus decisiones se loguean sin ejecutarse, se compara. Después asistido: el agente propone una acción, un humano valida con un clic. Por último autónomo: el agente actúa solo, con escalada automática en los casos en los que su confianza es baja.
Esta progresión durante 8 a 16 semanas cuesta calendario, pero evita los incidentes en producción que matan la confianza interna. En nuestros proyectos de agentes, es la fase silenciosa —a menudo descuidada— la que revela los defectos de razonamiento más estructurales. Mejor verlos offline que en facturación al cliente.
¿Qué presupuesto real a 24 meses?
Más allá de la implementación inicial, el coste de explotación de un agente de IA supera con frecuencia al de un chatbot por un factor de 3 a 5 a 24 meses. Tres partidas lo explican. El consumo de tokens en primer lugar: un agente multietapa puede consumir de 5.000 a 20.000 tokens por sesión frente a los 1.500 a 4.000 de un chatbot RAG equivalente — la diferencia se cuantifica rápido en miles de euros al mes en una volumetría seria.
La observabilidad y la seguridad representan la segunda partida. Un agente en producción necesita un audit log estructurado, replay de sesión, alertas por etapa, evaluaciones automatizadas de calidad de razonamiento — el equivalente a una plataforma MLOps ligera. Cuenta entre 8 y 15 k€ adicionales en el año 1, y entre 200 y 600 €/mes recurrentes en tooling (LangSmith, Langfuse, Datadog). La tercera partida es el humano en el bucle, especialmente en las fases asistidas: un operador que valida 100 decisiones al día a 30 segundos por decisión son 0,5 ETC adicionales que aprovisionar.
- Chatbot RAG a 24 meses: 15-30 k€ impl + 3-12 k€/año OPEX = ~21-54 k€ total
- Agente simple a 24 meses: 25-45 k€ impl + 12-36 k€/año OPEX = ~49-117 k€ total
- Agente complejo con HITL a 24 meses: 40-70 k€ impl + 40-100 k€/año OPEX = ~120-270 k€ total
Las trampas que lastran los proyectos conversacionales
Más allá de los errores técnicos clásicos, dos trampas de encuadre vuelven sistemáticamente e invalidan proyectos enteros.
- Usar un agente para un caso de chatbot: sobrecoste ×3 a ×5, complejidad de explotación incrementada, riesgo operativo injustificado — cuando un RAG bien hecho respondía al 95 % de la necesidad
- Usar un chatbot para un caso de acción: el usuario pide «mueve mi entrega», el bot responde «aquí tienes nuestra política de entrega» — frustración garantizada, churn asegurado
- Saltarse la fase silenciosa: pasar directamente a modo autónomo en un agente de criticidad media o alta genera entre 3 y 5 incidentes públicos que matarán el proyecto políticamente
¿Y ahora qué?
La elección entre chatbot y agente de IA es un arbitraje de 30.000 a 100.000 € a 24 meses — merece una verdadera fase de encuadre, no una decisión en una reunión de 30 minutos. Nuestro método se sostiene en seis pasos, pero el primero —cualificar bien información vs acción— ahorra la mayoría de los errores posteriores.
- Empieza por una auditoría gratuita que incluye el encuadre de los casos de uso conversacionales
- Consulta nuestras fórmulas de acompañamiento para chatbot o agente — desde 199 €/mes
- Ponte en contacto para 30 minutos de encuadre gratuito y una recomendación argumentada chatbot vs agente
Elegir entre chatbot y agente es elegir entre la simplicidad operativa y la potencia de ejecución. Ambos tienen su lugar — solo hay que ponerlos en el sitio adecuado, en el caso adecuado, en el momento adecuado.