« Vogliamo un chatbot ». Questa frase la sentiamo ogni settimana in fase di inquadramento. E nove volte su dieci, va approfondita: dietro la parola chatbot si nasconde talvolta un vero chatbot — sistema di domanda/risposta su una base di conoscenza — ma spesso un agente IA, ovvero un sistema capace di prendere decisioni ed eseguire azioni su strumenti esterni.
La differenza non è cosmetica. Condiziona il costo (da uno a cinque), la complessità di implementazione, il profilo di rischio e la strategia di rollout. Questo articolo propone un metodo chiaro per scegliere, basato su ciò che osserviamo nei nostri progetti DevHighWay 2025-2026.
Chatbot vs agente: una frontiera tecnica netta
Un chatbot moderno è un sistema D/R basato su RAG (Retrieval-Augmented Generation). L'utente pone una domanda, il sistema recupera i passaggi pertinenti in una base vettoriale (Qdrant, Pinecone, pgvector), li passa all'LLM con la domanda e restituisce una risposta sintetica. Perimetro chiuso, criticità d'errore bassa, architettura matura.
Un agente IA opera diversamente. Riceve un obiettivo, pianifica una sequenza di azioni, chiama strumenti (API, database, funzioni di business), valuta i risultati intermedi e itera fino a raggiungere l'obiettivo — o a fallire in modo pulito. Pattern tipici: ReAct, Plan-and-Execute, multi-agente. Il perimetro è aperto, l'albero decisionale combinatorio, il rischio operativo reale.
Passo 1 — Elencare le interazioni desiderate
Il test decisivo si riassume in una domanda: l'utente uscirà dall'interazione con un'informazione, o con un'azione eseguita? « Quali sono i vostri tempi di consegna? » è una domanda di informazione. « Sposta la mia consegna a sabato » è una richiesta di azione. Se il 90% delle interazioni rientra nel primo gruppo, avete un caso chatbot.
Molti progetti mescolano i due. In questo caso, l'approccio giusto non è sistematicamente un agente unico che fa entrambe: spesso è un chatbot RAG che rileva le richieste di azione e le inoltra a un workflow dedicato — più semplice da costruire, più prevedibile da gestire.
Passo 2 — Identificare le manipolazioni di stato esterne
Se l'interazione modifica uno stato in un sistema terzo (creare un ticket Zendesk, aggiornare un deal Salesforce, lanciare un pagamento Stripe, attivare un workflow n8n), siete in territorio agente. Il tool use — capacità dell'LLM di chiamare funzioni esterne — diventa centrale. L'architettura, l'osservabilità e il profilo di rischio cambiano radicalmente.
- Sola lettura: visualizzare lo stato di un ordine, recuperare una fattura — gestibile in chatbot con RAG arricchito da API read
- Scrittura semplice: creare un ticket, aggiungere una nota — agente leggero tipo OpenAI Assistants API
- Scrittura complessa multi-step: concatenare 4-5 chiamate con dipendenze e rollback — LangGraph o AutoGen
- Azione critica: bonifico, cancellazione, contratto — agente obbligatorio con validazione umana nei primi mesi
Passo 3 — Valutare la criticità d'errore
Il costo di un errore definisce il livello di investimento in guardrail. Un chatbot di assistenza che risponde male costa una frustrazione utente e una chiamata umana. Un agente contabile che sbaglia costa una scrittura errata, talvolta difficilmente verificabile. A volume equivalente, l'impatto non è paragonabile.
La nostra regola pratica: sotto i 50 € di impatto medio per errore, un agente autonomo ben progettato è difendibile. Tra 50 e 500 €, si impone una modalità assistita umana almeno per i primi 90 giorni. Sopra i 500 €, validazione umana permanente o perimetro ristretto. Queste soglie proteggono tanto il progetto quanto gli utenti finali.
Passo 4 — Scegliere il framework adatto
Il mercato dei framework si è stabilizzato nel 2025-2026 attorno ad alcuni attori. Per un chatbot RAG: LangChain o LlamaIndex per l'orchestrazione, Qdrant o Pinecone per il vector store, Cohere Rerank per la pertinenza, RAGAS per la valutazione. LLM a scelta: GPT-4 Turbo, Claude 3.7 Sonnet, Mistral Large 2 per la sovranità.
Per un agente, la scelta dipende dalla complessità del workflow. OpenAI Assistants API per partire rapidamente su un caso semplice. LangGraph per workflow a stati complessi con branching e ripresa. AutoGen per il multi-agente con specializzazione per ruolo. Anthropic tool use per la robustezza in produzione su agente monolitico. vLLM per servire un modello self-hosted se la sovranità lo esige.
- Chatbot 5-15 k€ di implementazione: RAG + LLM cloud, deploy 4-8 settimane, OPEX 100-500 €/mese
- Agente semplice 20-35 k€: 2-5 tool, OpenAI Assistants API o LangGraph leggero, deploy 8-12 settimane
- Agente complesso 35-60 k€: workflow multi-step, osservabilità completa, multi-agente eventuale — 12-20 settimane
- Consumo token: un agente consuma 2-5 volte più token di un chatbot equivalente — fattore chiave di OPEX
Passo 5 — Progettare l'osservabilità fin dal Giorno 0
L'osservabilità non è un nice-to-have, è un prerequisito. Per un chatbot, LangSmith o OpenAI Evals coprono l'essenziale: tracciamento dei prompt, punteggi di qualità automatizzati, CSAT post-conversazione, alerting su derive. Per un agente, si aggiunge un audit log strutturato di ogni tool call (input, output, durata, stato) e un replay delle sessioni per il debug.
Senza osservabilità, un agente in produzione diventa una scatola nera ingestibile nel giro di qualche settimana. Gli incidenti si accumulano senza diagnosi possibile, gli utenti perdono fiducia, il progetto muore. Conteggiate il 10-15% del budget di implementazione per l'osservabilità — è un investimento difensivo, non una spesa accessoria.
Passo 6 — Piano di rollout progressivo
Nessun agente IA deve passare direttamente dalla demo alla modalità autonoma. Il rollout avviene in tre fasi distinte. Prima silenzioso: l'agente gira in parallelo agli umani, le sue decisioni vengono loggate senza essere eseguite, si confronta. Poi assistito: l'agente propone un'azione, un umano valida con un clic. Infine autonomo: l'agente agisce da solo, con escalation automatica sui casi in cui la sua confidenza è bassa.
Questa progressione su 8-16 settimane costa in termini di calendario ma evita gli incidenti in produzione che uccidono la fiducia interna. Nei nostri progetti agente, è la fase silenziosa — spesso trascurata — a rivelare i difetti di ragionamento più strutturali. Meglio vederli offline che a carico del cliente.
Quale budget reale su 24 mesi?
Al di là dell'implementazione iniziale, il costo operativo di un agente IA supera spesso quello di un chatbot di un fattore 3-5 su 24 mesi. Tre voci lo spiegano. Il consumo di token anzitutto: un agente multi-step può consumare 5 000-20 000 token per sessione contro 1 500-4 000 per un chatbot RAG equivalente — la differenza si quantifica rapidamente in migliaia di euro al mese su volumi seri.
L'osservabilità e la sicurezza rappresentano la seconda voce. Un agente in produzione necessita di un audit log strutturato, di replay di sessione, di alert per fase, di valutazioni automatizzate della qualità di ragionamento — l'equivalente di una piattaforma MLOps leggera. Conteggiate 8-15 k€ aggiuntivi nell'anno 1, e 200-600 €/mese ricorrenti in tooling (LangSmith, Langfuse, Datadog). La terza voce è l'umano nel loop, in particolare nelle fasi assistite: un operatore che valida 100 decisioni al giorno a 30 secondi per decisione equivale a 0,5 FTE aggiuntivo da prevedere.
- Chatbot RAG 24 mesi — 15-30 k€ impl + 3-12 k€/anno OPEX = ~21-54 k€ totali
- Agente semplice 24 mesi — 25-45 k€ impl + 12-36 k€/anno OPEX = ~49-117 k€ totali
- Agente complesso con HITL 24 mesi — 40-70 k€ impl + 40-100 k€/anno OPEX = ~120-270 k€ totali
Le trappole che affossano i progetti conversazionali
Oltre agli errori tecnici classici, due trappole di inquadramento tornano sistematicamente e invalidano interi progetti.
- Usare un agente per un caso chatbot: sovraccosto ×3-×5, complessità operativa accresciuta, rischio operativo ingiustificato — quando un RAG ben fatto soddisfaceva il 95% del bisogno
- Usare un chatbot per un caso azione: l'utente chiede « sposta la mia consegna », il bot risponde « ecco la nostra politica di consegna » — frustrazione garantita, churn assicurato
- Saltare la fase silenziosa: passare direttamente in autonomo su un agente a criticità media o alta genera 3-5 incidenti pubblici che uccideranno il progetto politicamente
E adesso?
La scelta chatbot vs agente IA è un arbitrato da 30 000-100 000 € su 24 mesi — merita una vera fase di inquadramento, non una decisione presa in una riunione di 30 minuti. Il nostro metodo si riassume in sei passi, ma il primo — qualificare bene informazione vs azione — evita la maggior parte degli errori successivi.
- Iniziare con un audit gratuito che include l'inquadramento dei casi d'uso conversazionali
- Consultare le nostre formule di accompagnamento per chatbot o agente — a partire da 199 €/mese
- Contattateci per 30 minuti di inquadramento gratuito e una raccomandazione argomentata chatbot vs agente
Scegliere tra chatbot e agente significa scegliere tra la semplicità operativa e la potenza di esecuzione. Entrambi hanno il loro posto — basta collocarli nel punto giusto, sul caso giusto, al momento giusto.