2026 akzeptiert kein Vorstand mehr, ein KI-Projekt ohne beziffertes Business Case zu finanzieren. Die Zeiten, in denen das bloße Versprechen „das wird uns Zeit sparen“ ausreichte, sind vorbei — und das ist gesund. Dennoch stolpern viele Teams zwischen anfänglicher Begeisterung und rigoroser Messung an denselben Hindernissen: keine Baseline, unterschätzte Kosten, doppelt gezählter Nutzen.

Dieser Artikel beschreibt die Methode, die wir in unseren DevHighWay-Projekten zur Berechnung eines belastbaren ROI anwenden. Ziel ist nicht, die Zahlen aufzublasen, sondern eine Analyse zu erstellen, die ein CFO, ein CIO und ein Operativer mit demselben Stift unterschreiben. Die Folge: weniger sterile Debatten, klare Entscheidungen und Projekte, die ihre Versprechen halten.

Der KI-ROI ist kein Mythos — er ist eine Disziplin

Man hört regelmäßig, KI sei „immateriell“ und ihr ROI nicht messbar. Das ist falsch. Wahr ist, dass die meisten Projekte sich nicht die Mittel geben, ihn zu messen: keine Baseline, keine Instrumentierung, keine Review nach dem Deployment. Der KI-ROI gehorcht denselben Gesetzen wie jede industrielle Investition — nur dass die Variablen (verbrauchte Tokens, Adoptionsrate, Qualität der Antworten) neu sind.

Konkret zerfällt ein gut aufgesetztes KI-Projekt in drei Nutzenfamilien: direkter Nutzen (gesparte Stunden, zusätzliche Konversionen, automatisierter Support), indirekter Nutzen (Time-to-Market, wahrgenommene Qualität, Kundenerlebnis) und defensiver Nutzen (gehaltene Marktanteile gegenüber Wettbewerbern, die sich rüsten). Die ersten beiden lassen sich in Euro beziffern, der dritte in vermiedenem Risiko.

Schritt 1 — Vor allem die Baseline festlegen

Die Baseline ist die präzise Momentaufnahme Ihrer Tätigkeit vor dem KI-Projekt. Ohne sie können Sie keinen Nutzen belegen. Die zu fixierenden KPIs hängen vom Anwendungsfall ab: Für den Kundensupport sind das die durchschnittliche Bearbeitungszeit, die Kosten pro Ticket, die First-Contact-Resolution-Rate. Für einen Vertriebsfunnel die Lead-Qualifizierungsrate, die Kosten pro Opportunity, die durchschnittliche Reaktionszeit.

Der klassische Fehler: die Zahlen vom letzten Steering Committee nehmen. Unzureichend. Mindestens 90 Tage konsolidierte Historie sind nötig, idealerweise 12 Monate, um die Saisonalität auszugleichen. Und vor allem muss die Baseline vom Fachteam validiert werden — nicht nur von der IT. Ohne dieses gemeinsame Commitment werden die Zahlen beim ersten Streit um den Nutzen angefochten.

  • Quantitative KPIs: bearbeitetes Volumen, Einzelzeit, Stückkosten — das Rohmaterial der Berechnung
  • Qualitative KPIs: CSAT, NPS, Eskalationsrate — um das Erlebnis zu erfassen
  • Referenzzeitraum: 90 bis 365 Tage, datiert, unterschrieben, archiviert
  • Source of Truth: ein einziges Tool pro KPI (CRM, Helpdesk, Analytics), um Doppelzählungen zu vermeiden

Schritt 2 — Den infrage kommenden Scope quantifizieren

Nicht alle Prozesse kommen für KI infrage. Der richtige Reflex: Volumen und Einzelzeit kreuzen, um Aufgaben mit hohem Potenzial zu identifizieren. 500 Tickets pro Monat zu je 20 Minuten ergeben 167 automatisierbare Monatsstunden — ein glaubwürdiger Scope. 50 ultraspezifische Anfragen zu 3 Minuten sind kein KI-Projekt, das ist eine statische FAQ.

Schätzen Sie für jede infrage kommende Aufgabe die realistisch erreichbare Automatisierungsrate. Ein gut gebauter RAG-Chatbot absorbiert 40 bis 70 % der Fragen auf Level 1, selten mehr. Ein KI-Agent auf strukturierten Aufgaben kann 80-90 % erreichen. Aber ein Fall mit 95 % Automatisierung verbirgt oft eine übertriebene Vereinfachung des Scopes.

Schritt 3 — Die Gesamtkosten schätzen

Der häufigste Fehler: nur die Implementierung zu zählen. In Wirklichkeit kostet ein KI-Projekt auf vier Posten. Die Implementierung (15-60 k€ je nach Komplexität), den monatlichen LLM-Verbrauch (50-2 000 € pro Monat je nach Volumen und Modell — Claude 3.7 Sonnet, GPT-4 Turbo oder Mistral Large 2 rechnen nicht gleich ab), die technische Wartung (RAG neu indexieren, Prompts anpassen, Modelle aktualisieren) und das Change Management.

Letzterer Posten wird systematisch unterschätzt. 30 interne Nutzer in einem neuen Tool zu schulen, neue Prozesse zu dokumentieren, die ersten Wochen der Adoption zu begleiten, Widerstände zu managen: rechnen Sie mit 20 bis 30 % der Implementierungskosten, manchmal mehr. Ein technisch perfektes, aber schlecht adoptiertes Projekt erzeugt keinen ROI.

  • CAPEX Implementierung: Konzeption, Dev, Integrationen, Wissensbasis, Tests
  • OPEX LLM: Input-/Output-Tokens × Monatsvolumen × Modellpreis (Staffelungen prüfen)
  • Wartung: 15-25 % des CAPEX pro Jahr, mehr bei selbst gehosteten Modellen (vLLM, GPU)
  • Change Management: Schulung, Dokumentation, Adoptionsbegleitung — 20-30 % des CAPEX

Schritt 4 — Den Nutzen in drei Szenarien beziffern

Eine einzige Nutzenzahl ist verdächtig. Erstellen Sie immer drei Szenarien — pessimistisch, realistisch, optimistisch — basierend auf expliziten Annahmen zu Automatisierungs-, Adoptions- und Qualitätsraten. Diese Triangulation erzwingt Klarheit: Ein Projekt, das nur im optimistischen Szenario rentabel ist, signalisiert eine fragile Akte.

Konkretes Beispiel für einen Support-Chatbot: pessimistisch 30 % absorbierter Tickets, realistisch 50 %, optimistisch 70 %. Wenn selbst das pessimistische Szenario die Rentabilitätsschwelle überschreitet, ist das Projekt solide. Andernfalls muss entweder der Scope überarbeitet oder akzeptiert werden, dass der ROI marginal ausfällt — bewusst entscheiden.

Schritt 5 — Payback und ROI auf 12 und 24 Monate berechnen

Zwei Indikatoren genügen. Die Payback Period (kumulierte Gesamtkosten / durchschnittlicher monatlicher Nutzen) beantwortet die Frage „in wie vielen Monaten habe ich meinen Einsatz wieder herein?“. Der ROI 24 Monate ((Nutzen − Kosten) / Kosten) beantwortet „wie viel gewinne ich insgesamt?“. Ein gesundes KI-Projekt weist einen Payback zwischen 6 und 18 Monaten und einen ROI 24 Monate über 100 % aus.

Über 24 Monate Payback ist das Projekt exponiert: Modelle entwickeln sich weiter, geschäftliche Anforderungen ebenfalls, und das Obsoleszenzrisiko wird real. Genau deshalb empfehlen wir modulare Architekturen, die einen Wechsel des LLM oder Frameworks aufnehmen können, ohne alles neu zu bauen.

Schritt 6 — Nach dem Deployment messen und anpassen

Der ROI ist keine im Kickoff fixierte Zahl. Er ist eine lebendige Metrik. An T+30, T+90 und T+180 nehmen Sie die Baseline-KPIs erneut und vergleichen. Dokumentieren Sie Abweichungen, identifizieren Sie die Hebel (mangelnde Adoption? Antwortqualität? zu breiter Scope?) und passen Sie an. Diese Verbesserungsschleife trennt einen aufgegebenen POC von einem skalierenden Produkt.

Nützliche Werkzeuge für die kontinuierliche Messung: LangSmith oder OpenAI Evals für die Antwortqualität, ein CSAT-Dashboard nach dem Gespräch, Produkt-Analytics (Mixpanel, Amplitude) für die Adoption. Ohne diese Instrumente bleibt der im Komitee präsentierte ROI eine bloße Behauptung.

Welchen Messzeitraum für den ROI wählen?

Die Wahl des Zeithorizonts ändert alles. Über 12 Monate belegen Sie die unmittelbare Tragfähigkeit und sichern das Budget des Folgejahres; das ist die Mindestdauer, um das Projekt im Komitee verteidigen zu können. Über 24 Monate erfassen Sie die zusammengesetzten Effekte — verbreitete Adoption, sinkende LLM-Rechnung dank Optimierungen, Scope-Erweiterung —, die im ersten Jahr selten sichtbar sind. Das ist das Standardfenster, das wir für die Entscheidung empfehlen.

Über 36 Monate hinaus: Vorsicht. Die Geschwindigkeit der Modellentwicklung (Major-Update alle 6 bis 12 Monate) und der kontinuierliche Rückgang der Tokenpreise (-30 bis -50 % pro Jahr 2024-2026) machen jede Projektion über 3 Jahre wenig verlässlich. Bei Projekten mit hoher Hardwareinvestition — Self-Hosting, dedizierte GPUs — kann ein längerer Horizont gerechtfertigt sein, vorausgesetzt, ein Reinvestitionsszenario nach 36 Monaten ist eingeplant und die Qualitätsannahme wird jährlich neu validiert.

Die drei Stolperfallen, die eine KI-ROI-Berechnung kippen

In unseren Audits kehren systematisch drei Fehler wieder, die ganze Business Cases entkräften. Sie ab dem Scoping zu vermeiden, spart Monate interner Debatten.

  • Hypothetischen Nutzen ohne Baseline zählen: „wir schätzen, 30 % Zeit zu sparen“ ohne Anfangsmessung hält in der Post-Project-Review nicht stand
  • Change-Management-Kosten vergessen: die Technik funktioniert, aber 40 % der Nutzer setzen sie nicht ein — realer ROI halbiert
  • An einer nicht repräsentativen Stichprobe messen: an den 10 einfachsten Fällen testen und auf den gesamten Scope extrapolieren garantiert eine Enttäuschung

Wie geht es weiter?

Den ROI eines KI-Projekts zu berechnen ist keine theoretische Übung: Er entscheidet, ob eine Investition im Vorstand verteidigt wird oder in sechs Monaten als POC vergessen ist. Die Methode hält in sechs Schritten, aber die Rigorosität des initialen Scopings macht 80 % des Endergebnisses aus.

  • Mit einem kostenlosen Audit beginnen, um die KI-Bereiche mit dem höchsten ROI in Ihrem Geschäft zu identifizieren
  • Unsere Begleitpakete ab 199 €/Monat entdecken, um die Messung zu strukturieren
  • Kontakt aufnehmen für 30 Minuten kostenloses Scoping zu Ihrem KI-Projekt

Ein KI-Projekt ohne gemessenen ROI ist ein Projekt, das beim nächsten Budgetreview stirbt. Messen Sie früh, messen Sie korrekt, passen Sie häufig an — das ist die einzige Art, anfängliche Begeisterung in nachhaltigen Wert zu verwandeln.