« On veut un chatbot. » Cette phrase, nous l'entendons chaque semaine en cadrage. Et neuf fois sur dix, il faut creuser : derrière le mot chatbot se cache parfois un véritable chatbot — système de questions/réponses sur connaissance — mais souvent un agent IA, c'est-à-dire un système capable de prendre des décisions et d'exécuter des actions dans des outils externes.
La différence n'est pas cosmétique. Elle conditionne le coût (du simple au quintuple), la complexité d'implémentation, le profil de risque et la stratégie de roll-out. Cet article propose une méthode claire pour arbitrer, basée sur ce que nous observons sur nos projets DevHighWay 2025-2026.
Chatbot vs agent : une frontière technique nette
Un chatbot moderne, c'est un système Q/R s'appuyant sur RAG (Retrieval-Augmented Generation). L'utilisateur pose une question, le système retrouve les passages pertinents dans une base vectorielle (Qdrant, Pinecone, pgvector), les passe au LLM avec la question, et renvoie une réponse synthétique. Périmètre fermé, criticité d'erreur faible, architecture mature.
Un agent IA opère différemment. Il reçoit un objectif, planifie une séquence d'actions, appelle des outils (API, bases de données, fonctions métier), évalue les résultats intermédiaires, et itère jusqu'à atteindre l'objectif — ou échouer proprement. Patterns typiques : ReAct, Plan-and-Execute, multi-agent. Le périmètre est ouvert, l'arbre de décision combinatoire, le risque opérationnel réel.
Étape 1 — Lister les interactions désirées
Le test décisif tient en une question : l'utilisateur sortira-t-il de l'interaction avec une information, ou avec une action effectuée ? « Quels sont vos délais de livraison ? » est une question d'information. « Décale ma livraison à samedi » est une demande d'action. Si 90 % des interactions tombent dans le premier groupe, vous avez un cas chatbot.
Beaucoup de projets mixent les deux. Dans ce cas, la bonne approche n'est pas systématiquement un agent unique faisant les deux : c'est souvent un chatbot RAG qui détecte les demandes d'action et les escalade vers un workflow dédié — plus simple à construire, plus prévisible à exploiter.
Étape 2 — Identifier les manipulations d'état externes
Si l'interaction modifie un état dans un système tiers (créer un ticket Zendesk, mettre à jour un deal Salesforce, lancer un paiement Stripe, déclencher un workflow n8n), vous êtes en territoire agent. Le tool use — capacité du LLM à appeler des fonctions externes — devient central. L'architecture, l'observabilité et le profil de risque changent radicalement.
- Lecture seule : afficher un statut de commande, retrouver une facture — gérable en chatbot avec RAG enrichi d'API read
- Écriture simple : créer un ticket, ajouter une note — agent léger type OpenAI Assistants API
- Écriture complexe multi-étapes : enchaîner 4-5 appels avec dépendances et rollback — LangGraph ou AutoGen
- Action critique : virement, suppression, contrat — agent obligatoire avec validation humaine sur les premiers mois
Étape 3 — Évaluer la criticité d'erreur
Le coût d'une erreur définit le niveau d'investissement en garde-fous. Un chatbot SAV qui répond mal coûte une frustration utilisateur et un appel humain. Un agent comptable qui se trompe coûte une écriture erronée, parfois auditable difficilement. À volume équivalent, l'impact n'est pas comparable.
Notre règle pratique : sous 50 € d'impact moyen par erreur, un agent autonome bien conçu est défendable. Entre 50 et 500 €, on impose un mode assisté humain au moins sur les 90 premiers jours. Au-dessus de 500 €, validation humaine permanente ou périmètre restreint. Ces seuils protègent autant le projet que les utilisateurs finaux.
Étape 4 — Choisir le framework adapté
Le marché des frameworks s'est stabilisé en 2025-2026 autour de quelques acteurs. Pour un chatbot RAG : LangChain ou LlamaIndex pour l'orchestration, Qdrant ou Pinecone pour le vector store, Cohere Rerank pour la pertinence, RAGAS pour l'évaluation. LLM au choix : GPT-4 Turbo, Claude 3.7 Sonnet, Mistral Large 2 pour la souveraineté.
Pour un agent, le choix dépend de la complexité du workflow. OpenAI Assistants API pour démarrer vite sur un cas simple. LangGraph pour des workflows à états complexes avec branchements et reprises. AutoGen pour le multi-agent avec spécialisation par rôle. Anthropic tool use pour la robustesse en production sur agent monolithique. vLLM pour servir un modèle auto-hébergé si la souveraineté l'exige.
- Chatbot 5-15 k€ d'implémentation : RAG + LLM cloud, déploiement 4-8 semaines, OPEX 100-500 €/mois
- Agent simple 20-35 k€ : 2-5 tools, OpenAI Assistants API ou LangGraph léger, déploiement 8-12 semaines
- Agent complexe 35-60 k€ : workflow multi-étapes, observabilité complète, multi-agent éventuel — 12-20 semaines
- Consommation tokens : un agent consomme 2 à 5 fois plus de tokens qu'un chatbot équivalent — facteur clé d'OPEX
Étape 5 — Concevoir l'observabilité dès J0
L'observabilité n'est pas un nice-to-have, c'est un prérequis. Pour un chatbot, LangSmith ou OpenAI Evals couvrent l'essentiel : trace des prompts, scores de qualité automatisés, CSAT post-conversation, alerting sur dérives. Pour un agent, on ajoute un audit log structuré de chaque tool call (entrée, sortie, durée, statut) et un replay des sessions pour debug.
Sans observabilité, un agent en production devient une boîte noire ingérable au bout de quelques semaines. Les incidents s'accumulent sans diagnostic possible, les utilisateurs perdent confiance, le projet meurt. Compter 10 à 15 % du budget d'implémentation pour l'observabilité — c'est un investissement défensif, pas une dépense annexe.
Étape 6 — Plan de roll-out progressif
Aucun agent IA ne doit passer directement de la démo au mode autonome. Le roll-out se fait en trois phases distinctes. D'abord silencieux : l'agent tourne en parallèle des humains, ses décisions sont loguées sans être exécutées, on compare. Puis assisté : l'agent propose une action, un humain valide en un clic. Enfin autonome : l'agent agit seul, avec escalade automatique sur les cas où sa confiance est faible.
Cette progression sur 8 à 16 semaines coûte du calendrier mais évite les incidents en production qui tuent la confiance interne. Sur nos projets agent, c'est la phase silencieuse — souvent négligée — qui révèle les défauts de raisonnement les plus structurants. Mieux les voir hors-ligne qu'en facturation client.
Quel budget réel sur 24 mois ?
Au-delà de l'implémentation initiale, le coût d'exploitation d'un agent IA dépasse souvent celui d'un chatbot par un facteur 3 à 5 sur 24 mois. Trois postes l'expliquent. La consommation de tokens d'abord : un agent multi-étapes peut consommer 5 000 à 20 000 tokens par session contre 1 500 à 4 000 pour un chatbot RAG équivalent — la différence se chiffre rapidement en milliers d'euros par mois sur de la volumétrie sérieuse.
L'observabilité et la sécurité représentent le deuxième poste. Un agent en production nécessite un audit log structuré, du replay de session, des alertes par étape, des évaluations automatisées de qualité de raisonnement — soit l'équivalent d'une plateforme MLOps légère. Comptez 8 à 15 k€ supplémentaires en année 1, et 200 à 600 €/mois récurrents en tooling (LangSmith, Langfuse, Datadog). Le troisième poste est l'humain dans la boucle, particulièrement sur les phases assistées : un opérateur qui valide 100 décisions par jour à 30 secondes par décision, c'est 0,5 ETP supplémentaire à provisionner.
- Chatbot RAG 24 mois — 15-30 k€ impl + 3-12 k€/an OPEX = ~21-54 k€ total
- Agent simple 24 mois — 25-45 k€ impl + 12-36 k€/an OPEX = ~49-117 k€ total
- Agent complexe avec HITL 24 mois — 40-70 k€ impl + 40-100 k€/an OPEX = ~120-270 k€ total
Les pièges qui plombent les projets conversationnels
Au-delà des erreurs techniques classiques, deux pièges de cadrage reviennent systématiquement et invalident des projets entiers.
- Utiliser un agent pour un cas chatbot : surcoût ×3 à ×5, complexité d'exploitation accrue, risque opérationnel injustifié — alors qu'un RAG bien fait répondait à 95 % du besoin
- Utiliser un chatbot pour un cas action : l'utilisateur demande « décale ma livraison », le bot répond « voici notre politique de livraison » — frustration garantie, churn assuré
- Sauter la phase silencieuse : passer directement en autonome sur un agent à criticité moyenne ou haute génère 3 à 5 incidents publics qui tueront le projet politiquement
Et maintenant ?
Le choix chatbot vs agent IA est un arbitrage à 30 000-100 000 € sur 24 mois — il mérite une vraie phase de cadrage, pas une décision en réunion de 30 minutes. Notre méthode tient en six étapes, mais la première — bien qualifier information vs action — économise la majorité des erreurs ultérieures.
- Démarrer par un audit gratuit incluant cadrage des cas d'usage conversationnels
- Consulter nos formules d'accompagnement pour chatbot ou agent — à partir de 199 €/mois
- Prenez contact pour 30 minutes de cadrage gratuit et une recommandation argumentée chatbot vs agent
Choisir entre chatbot et agent, c'est choisir entre la simplicité opérationnelle et la puissance d'exécution. Les deux ont leur place — encore faut-il les placer au bon endroit, sur le bon cas, au bon moment.