"Bir sohbet botu istiyoruz." Bu cümleyi çerçevelemede her hafta duyuyoruz. Ve on kez dokuzunda derinleşmek gerekir: sohbet botu kelimesinin arkasında bazen gerçek bir sohbet botu — bilgi tabanı üzerinde soru/cevap sistemi — gizlidir, ancak genellikle bir AI ajanı, yani dış araçlarda kararlar verme ve eylemler yürütme yeteneğine sahip bir sistem.

Fark kozmetik değildir. Maliyeti (basitten beş katına), uygulama karmaşıklığını, risk profilini ve roll-out stratejisini belirler. Bu makale, DevHighWay 2025-2026 projelerimizde gözlemlediklerimize dayalı olarak karar vermek için net bir yöntem önermektedir.

Sohbet botu vs ajan: net bir teknik sınır

Modern bir sohbet botu, RAG (Retrieval-Augmented Generation) üzerine kurulu bir S/C sistemidir. Kullanıcı bir soru sorar, sistem ilgili pasajları bir vektör veri tabanında (Qdrant, Pinecone, pgvector) bulur, soruyla birlikte LLM'ye geçirir ve sentetik bir yanıt döndürür. Kapalı kapsam, düşük hata kritikliği, olgun mimari.

Bir AI ajanı farklı çalışır. Bir hedef alır, bir eylem dizisi planlar, araçları (API, veri tabanları, iş fonksiyonları) çağırır, ara sonuçları değerlendirir ve hedefe ulaşana — veya temiz şekilde başarısız olana — kadar yineler. Tipik desenler: ReAct, Plan-and-Execute, multi-agent. Kapsam açık, karar ağacı kombinatoryal, operasyonel risk gerçek.

Adım 1 — İstenen etkileşimleri listeleyin

Belirleyici test tek bir soruda yatar: kullanıcı etkileşimden bir bilgiyle mi yoksa gerçekleştirilmiş bir eylemle mi çıkacak? "Teslimat süreleriniz nedir?" bir bilgi sorusudur. "Teslimatımı cumartesiye ertele" bir eylem talebidir. Etkileşimlerin %90'ı ilk gruba düşerse, bir sohbet botu vakanız var.

Birçok proje ikisini karıştırır. Bu durumda, doğru yaklaşım sistematik olarak ikisini de yapan tek bir ajan değildir: genellikle eylem taleplerini tespit eden ve özel bir workflow'a yönlendiren bir RAG sohbet botudur — inşa etmesi daha basit, işletmesi daha öngörülebilir.

Adım 2 — Dış durum manipülasyonlarını belirleyin

Etkileşim üçüncü taraf bir sistemdeki durumu değiştiriyorsa (Zendesk ticket'ı oluşturmak, Salesforce deal'i güncellemek, Stripe ödemesi başlatmak, n8n workflow'unu tetiklemek), ajan bölgesindesiniz. Tool use — LLM'nin dış fonksiyonları çağırma yeteneği — merkezi hale gelir. Mimari, gözlemlenebilirlik ve risk profili radikal olarak değişir.

  • Yalnızca okuma: bir sipariş durumunu göstermek, bir faturayı bulmak — okuma API'li zenginleştirilmiş RAG sohbet botunda yönetilebilir
  • Basit yazma: ticket oluşturmak, not eklemek — OpenAI Assistants API tipi hafif ajan
  • Çok adımlı karmaşık yazma: bağımlılıklar ve rollback ile 4-5 çağrıyı zincirlemek — LangGraph veya AutoGen
  • Kritik eylem: transfer, silme, sözleşme — ilk aylar üzerinde insan doğrulamalı zorunlu ajan

Adım 3 — Hata kritikliğini değerlendirin

Bir hatanın maliyeti, koruma bariyerlerine yapılan yatırım seviyesini tanımlar. Kötü yanıt veren bir SAV sohbet botu bir kullanıcı hayal kırıklığına ve bir insan çağrısına mal olur. Yanlış yapan bir muhasebe ajanı hatalı bir kayda, bazen zor denetlenebilen bir kayda mal olur. Eşit hacimde, etki karşılaştırılabilir değildir.

Pratik kuralımız: hata başına ortalama 50 € etkinin altında, iyi tasarlanmış otonom bir ajan savunulabilirdir. 50 ile 500 € arasında, en azından ilk 90 günde insan yardımlı mod dayatıyoruz. 500 €'nun üzerinde, kalıcı insan doğrulama veya kısıtlı kapsam. Bu eşikler hem projeyi hem de son kullanıcıları korur.

Adım 4 — Uygun framework'ü seçin

Framework pazarı 2025-2026'da birkaç oyuncu etrafında istikrar kazandı. Bir RAG sohbet botu için: orkestrasyon için LangChain veya LlamaIndex, vektör deposu için Qdrant veya Pinecone, alaka için Cohere Rerank, değerlendirme için RAGAS. LLM seçenekleri: GPT-4 Turbo, Claude 3.7 Sonnet, egemenlik için Mistral Large 2.

Bir ajan için seçim workflow karmaşıklığına bağlıdır. Basit bir vakada hızlı başlamak için OpenAI Assistants API. Dallanma ve devam etme ile karmaşık durumlu workflow'lar için LangGraph. Role göre uzmanlaşmış çoklu ajan için AutoGen. Monolitik ajan üzerinde üretimde sağlamlık için Anthropic tool use. Egemenlik gerekiyorsa kendi sunucusunda barındırılan bir modeli sunmak için vLLM.

  • Uygulamada sohbet botu 5-15 bin €: RAG + bulut LLM, 4-8 hafta devreye alma, 100-500 €/ay OPEX
  • Basit ajan 20-35 bin €: 2-5 araç, OpenAI Assistants API veya hafif LangGraph, 8-12 hafta devreye alma
  • Karmaşık ajan 35-60 bin €: çok adımlı workflow, tam gözlemlenebilirlik, olası çoklu ajan — 12-20 hafta
  • Token tüketimi: bir ajan eşdeğer bir sohbet botundan 2 ila 5 kat daha fazla token tüketir — OPEX'in anahtar faktörü

Adım 5 — J0'dan itibaren gözlemlenebilirliği tasarlayın

Gözlemlenebilirlik bir nice-to-have değildir, bir ön koşuldur. Bir sohbet botu için LangSmith veya OpenAI Evals temeli kapsar: istem izleme, otomatik kalite skorları, konuşma sonrası CSAT, sapmalarda uyarı. Bir ajan için, her tool call'un yapılandırılmış denetim logu (giriş, çıkış, süre, durum) ve hata ayıklama için oturum replay'i eklenir.

Gözlemlenebilirlik olmadan, üretimdeki bir ajan birkaç hafta sonra yönetilemez bir kara kutu haline gelir. Olaylar tanı imkanı olmadan birikir, kullanıcılar güvenini kaybeder, proje ölür. Gözlemlenebilirlik için uygulama bütçesinin %10 ila %15'ini hesaplayın — bu bir savunma yatırımıdır, ek harcama değil.

Adım 6 — Kademeli roll-out planı

Hiçbir AI ajanı doğrudan demodan otonom moda geçmemelidir. Roll-out üç farklı aşamada yapılır. Önce sessiz: ajan insanlara paralel çalışır, kararları uygulanmadan loglanır, karşılaştırılır. Sonra yardımlı: ajan bir eylem önerir, bir insan tek tıklamayla doğrular. Son olarak otonom: ajan tek başına hareket eder, güveninin düşük olduğu vakalarda otomatik yönlendirme ile.

8 ila 16 hafta üzerinde bu ilerleme takvim maliyeti yaratır ancak iç güveni öldüren üretim olaylarını önler. Ajan projelerimizde, genellikle ihmal edilen sessiz aşama, en yapısal akıl yürütme kusurlarını ortaya çıkaran aşamadır. Onları müşteri faturalandırmasında değil, çevrimdışı görmek daha iyidir.

24 ay üzerinde gerçek bütçe nedir?

İlk uygulamanın ötesinde, bir AI ajanının işletme maliyeti 24 ay üzerinde bir sohbet botununkini sıklıkla 3 ila 5 kat aşar. Bunu üç kalem açıklar. Önce token tüketimi: çok adımlı bir ajan oturum başına 5.000 ila 20.000 token tüketebilirken, eşdeğer bir RAG sohbet botu için 1.500 ila 4.000 — fark ciddi bir hacimde hızla ayda binlerce avroya ulaşır.

Gözlemlenebilirlik ve güvenlik ikinci kalemi temsil eder. Üretimdeki bir ajan yapılandırılmış denetim logu, oturum replay'i, adım başına uyarılar, akıl yürütme kalitesinin otomatik değerlendirmeleri gerektirir — yani hafif bir MLOps platformunun eşdeğeri. 1. yılda ek 8 ila 15 bin €, araçlamada tekrarlayan 200 ila 600 €/ay hesaplayın (LangSmith, Langfuse, Datadog). Üçüncü kalem özellikle yardımlı aşamalarda döngüdeki insandır: günde 100 karar onaylayan bir operatör, karar başına 30 saniye, sağlanması gereken 0,5 ek ETP demektir.

  • 24 ay RAG sohbet botu — 15-30 bin € uygulama + 3-12 bin €/yıl OPEX = ~21-54 bin € toplam
  • 24 ay basit ajan — 25-45 bin € uygulama + 12-36 bin €/yıl OPEX = ~49-117 bin € toplam
  • HITL ile 24 ay karmaşık ajan — 40-70 bin € uygulama + 40-100 bin €/yıl OPEX = ~120-270 bin € toplam

Konuşma projelerini baltalayan tuzaklar

Klasik teknik hataların ötesinde, iki çerçeveleme tuzağı sistematik olarak geri döner ve tüm projeleri geçersiz kılar.

  • Bir sohbet botu vakası için ajan kullanmak: ×3 ila ×5 ek maliyet, artan işletme karmaşıklığı, haksız operasyonel risk — iyi yapılmış bir RAG ihtiyacın %95'ini karşılarken
  • Bir eylem vakası için sohbet botu kullanmak: kullanıcı "teslimatımı ertele" diye sorar, bot "işte teslimat politikamız" diye yanıt verir — hayal kırıklığı garantili, churn garantili
  • Sessiz aşamayı atlamak: orta veya yüksek kritiklikli bir ajanda doğrudan otonom moda geçmek, projeyi politik olarak öldürecek 3 ila 5 kamuya açık olay üretir

Şimdi ne yapmalı?

Sohbet botu vs AI ajanı seçimi 24 ay üzerinde 30.000-100.000 €'luk bir hakemliktir — 30 dakikalık bir toplantı kararı değil, gerçek bir çerçeveleme aşamasını hak eder. Yöntemimiz altı adıma sığar, ancak ilki — bilgi vs eylemi iyi nitelendirmek — sonraki hataların çoğunluğunu tasarruf eder.

Sohbet botu ile ajan arasında seçim yapmak, operasyonel basitlik ile yürütme gücü arasında seçim yapmaktır. İkisinin de yeri vardır — yine de doğru yerde, doğru vakada, doğru zamanda konumlandırmak gerekir.