MIT-Studie „State of AI in Business 2025 – Scheitern wirklich fast alle?

von | Sep. 5, 2025 | KI im Personalwesen, News

zuletzt aktualisiert 25. November 2025

Eine neue Studie des MIT rüttelt Unternehmen mit Ergebnissen zum Return on Investment bei der Einführung Künstlicher Intelligenz auf: 95 % der generativen KI-Pilotprojekte in Unternehmen sollen scheitern und lieferten keinerlei messbare Kapitalrendite. Der Bericht mit dem Titel „The GenAI Divide“ legt nahe, dass trotz 30 bis 40 Milliarden Dollar an Investitionen die überwältigende Mehrheit der Firmen feststeckt – unfähig, echten Wert aus ihren KI-Initiativen zu ziehen. Diese Zahlen gingen natürlich schnell viral und befeuern die Erzählung, dass wir uns in einer KI-Blase befinden und die Technologie massiv überbewertet ist. Aber ist das wirklich so?

Inhaltsverzeichnis

Abstract

Die Einführung generativer Künstlicher Intelligenz (GenAI) in Unternehmen gilt als einer der größten Transformationsprozesse der Gegenwart. Die empirische Evidenz ist jedoch ernüchternd: Trotz hoher Adoptionsraten erzielen nur wenige Organisationen messbare Produktivitätsgewinne. Der Beitrag fasst die Ergebnisse der MIT-Studie State of AI in Business 2025 zusammen, reflektiert kritisch deren methodische Grenzen und diskutiert die praktischen Folgen. Während sich ein „GenAI Divide“ zwischen erfolgreichen und stagnierenden Unternehmen abzeichnet, wird deutlich, dass die Ursachen weniger in der Modellqualität liegen als vielmehr in fehlender Integration, mangelnder Lernfähigkeit und organisationalem Design. Ergänzend werden mögliche, interpretativ abgeleitete Implikationen für das Personalwesen vorgestellt.

Der GenAI Divide: Während einige Unternehmen durch Künstliche Intelligenz bereits messbare Erfolge erzielen, bleiben andere in Pilotphasen stecken.

Einleitung

Generative KI ist 2025 in vielen Unternehmen im Einsatz. Tools wie ChatGPT oder Microsoft Copilot steigern bereits die Produktivität einzelner Mitarbeitender. Dennoch zeigen empirische Analysen, dass die Technologie bislang selten zu einer tiefgreifenden Transformation von Geschäftsprozessen geführt hat. Dieses Spannungsfeld wird als „GenAI Divide“ bezeichnet: Während ein kleiner Teil der Organisationen signifikante Wertschöpfung erzielt, verbleibt die Mehrheit in der Phase experimenteller Pilotprojekte.

Die Studie State of AI in Business 2025 des MIT

Die Studie des MIT Project NANDA basiert auf einer Multi-Method-Strategie:

  • Analyse von über 300 dokumentierten KI-Initiativen,
  • 52 Interviews mit Unternehmensvertretern,
  • 153 Befragungen von Führungskräften auf internationalen Konferenzen.

Das zentrale Ergebnis: „95 % of organizations see no return on investment from GenAI, and only 5 % of pilots make it into scaled production.“ Entscheidend ist weniger die Leistungsfähigkeit der Modelle als vielmehr die Fähigkeit, bestehende Prozesse zu integrieren und Feedback zu verarbeiten.

Methodische Limitationen

Die Autoren verweisen auf mehrere Einschränkungen:

  • Der Beobachtungszeitraum von sechs Monaten ist kurz und erfasst langfristige Effekte nicht.
  • Teilnehmende Firmen sind tendenziell experimentierfreudiger, wodurch ein Selektionsbias entstehen kann.
  • Erfolgsdefinitionen variieren zwischen Organisationen, was Vergleiche erschwert.

Kritische Ergänzung: Die Messbarkeit des ROI wird zusätzlich durch die informelle Nutzung von Schatten-KI erschwert. Viele Mitarbeitende nutzen private Tools wie ChatGPT, ohne dass dies offiziell erfasst wird. Dadurch ist unklar, wie stark diese Effekte das Gesamtbild verzerren. ROI-Aussagen könnten daher systematisch ungenau sein.

Status Quo: Hohe Adaption, geringe Transformation

Mehr als 80 % der Organisationen haben generative Tools getestet, rund 40 % haben diese offiziell eingeführt. Dennoch bleibt die Wirkung auf die Wertschöpfung gering.

Branchendifferenzen

  • Technologie und Medien erreichen im AI Market Disruption Index Werte von über 2,0 (Skala 0–5) und zeigen strukturelle Veränderungen.
  • Unternehmensnahe Dienstleistungen, Konsumgüter & Einzelhandel, Finanzdienstleistungen erzielen Effizienzgewinne, aber keine grundlegenden Umbrüche.
  • Gesundheitswesen, Hightech-Industrien, Energie & Materialien bleiben nahezu unverändert, mit Indexwerten um 0,5.

Diese Ergebnisse widersprechen der Annahme, dass KI in allen Branchen gleichermaßen disruptiv wirkt. Unterschiede ergeben sich u. a. durch Datenverfügbarkeit und regulatorische Rahmenbedingungen: Während Technologie- und Medienunternehmen auf reichhaltige Daten zugreifen und weniger Regulierung unterliegen, hemmen Auflagen, Sicherheitsanforderungen und fragmentierte Datenlandschaften den Einsatz in Sektoren wie Healthcare oder Energie.

Ursachen für das Scheitern

Die Studie benennt drei zentrale Mechanismen:

  • Pilot-to-Production Chasm: Generische Chatbots werden in 83 % der Fälle implementiert, aber nur 5 % maßgeschneiderter Lösungen schaffen es in den produktiven Betrieb.
  • Learning Gap: Systeme verfügen über kein Gedächtnis, speichern kein Feedback und lernen nicht aus wiederkehrenden Prozessen. Ein CIO kommentierte: „It is useful in the first week, but then repeats the same mistakes over and over.“
  • Schattenwirtschaft der KI: Diese Schatten-Ökonomie schafft nicht nur Produktivität, sondern erschwert auch die Messbarkeit offizieller ROI-Daten und unterminiert Vergleiche zwischen Unternehmen. Nur 40 % der Firmen besitzen offizielle Lizenzen, während Mitarbeitende in über 90 % der Fälle private Tools regelmäßig einsetzen. Ein Interviewpartner bemerkte: „Our employees use ChatGPT privately every day for work. Officially, it doesn’t exist, but in practice it is more effective than our licensed tools.“

Erfolgsfaktoren für Unternehmen

Erfolgreiche Unternehmen zeichnen sich durch bestimmte Muster aus:

  • Partnerschaften statt Eigenentwicklung: Externe Kooperationen sind zu 66 % erfolgreich, Eigenentwicklungen nur zu 33 %.
  • Dezentrale Strategie: Erfolgreiche Projekte entstehen häufig in Fachbereichen, nicht in zentralen Innovationslaboren.
  • Budgetverteilung: Laut Studie „Around 50 % of corporate AI budgets currently go to marketing and customer-facing use cases, while high-ROI back-office functions remain underfunded.“ Marketing liefert Sichtbarkeit, aber nur begrenzte Wertschöpfung. Höhere ROI-Effekte entstehen im Back-Office (z. B. Finance, Procurement), das bislang unterfinanziert bleibt.
  • Prosumers: Mitarbeitende mit privater KI-Erfahrung bringen Wissen ein und treiben Projekte von unten nach oben voran.

Erfolgsfaktoren für Anbieter

Erfolgreiche Anbieter beginnen mit klar abgegrenzten Use Cases wie Vertragsprüfung oder Gesprächsnotizen und bauen dann diesen nachweislich erzielten Mehrwert aus. Entscheidend sind tiefe Workflow-Integration und Vertrauen. Ein Head of Procurement formulierte es so: „If it’s not integrated into Salesforce, no one will use it.“ Ein weiterer Befragter ergänzte: „Trust matters more than flashy demos. Without trust in the outputs, adoption stops immediately.“

Auswirkungen auf den Arbeitsmarkt

Die Studie widerspricht Annahmen massiver kurzfristiger Arbeitsplatzverluste. Stattdessen zeigt sich ein selektiver Abbau in standardisierten Tätigkeiten, insbesondere in Support- und Administrationsfunktionen, wo zwischen 5 und 20 % der Stellen reduziert wurden. Diese Effekte sind bislang vor allem in Tech- und Medienbranchen sichtbar. In regulierten Bereichen wie Healthcare bleiben Veränderungen aus.

Langfristig ist das Potenzial erheblich: Für die USA wird eine Automatisierungsexposition von 2,3 Billionen USD Arbeitswert geschätzt, die rund 39 Millionen Stellen betreffen könnte. Die Autoren betonen: „This figure represents potential exposure, not actual job loss, and should be read as a projection dependent on future agentic systems.“ Es handelt sich also um ein theoretisches Szenario, das methodisch unsicher bleibt.

Agentische Systeme und das „Agentic Web“

Als Zukunftsszenario skizzieren die Autoren die Entwicklung hin zu agentischen Systemen, die persistent lernen und Workflows autonom steuern. Standards wie MCP, A2A und NANDA bilden die Grundlage für ein „Agentic Web“, in dem spezialisierte Agenten koordiniert agieren.

Gerade in diesem Bereich findet die aktuelle zweite globale ROI-of-AI-Studie 2025 von Google bei den Agentic AI Early Adopters überdurchschnittliche Ergebnisse. Hier findet sich eine Gegenüberstellung der beiden Studien, die zeigt, dass sich diese Ergebnisse keineswegs widersprechen müssen.

Fazit und Handlungsempfehlungen

Erfolg mit GenAI hängt weniger von der Qualität der Sprachmodelle ab als von Integrationstiefe, Lernfähigkeit und organisatorischem Design. Unternehmen sollten Partnerschaften eingehen, Fachbereiche einbinden und Mitarbeitende qualifizieren.

Besonders relevant ist das Zeitfenster: Laut Studie schließen sich bis 2026 viele Optionen, da Systeme durch Feedback-Lernen hohe Wechselkosten erzeugen. Hat sich ein Unternehmen einmal auf eine Lösung eingespielt, wird ein späterer Wechsel teuer und riskant. Wer zu spät handelt, bleibt daher womöglich dauerhaft auf der falschen Seite des Divide. Es ist jedoch wichtig zu betonen, dass diese Frist keine gesicherte Tatsache darstellt, sondern eine Projektion der Autoren – ein Warnsignal, das Unternehmen zum Handeln bewegen soll, aber keine belastbare Prognose.

Implikationen für das Personalwesen

Die Studie konzentriert sich auf Technik und Organisation, liefert aber indirekt wichtige Hinweise für HR. So zeigt die Budgetallokation in Marketing bei gleichzeitig geringen ROI-Effekten, dass Unternehmen Gefahr laufen, produktivere Bereiche wie das Back-Office oder die Kompetenzentwicklung zu vernachlässigen. HR kann hier gegensteuern, indem es Fähigkeiten in jenen Bereichen priorisiert, die höhere Produktivität versprechen.

  • Umschulung und interne Mobilität: GenAI führt bislang nicht zu Massenabbau, sondern zu Verlusten in standardisierten Tätigkeiten. HR muss hier Übergänge gestalten.
  • AI Literacy: KI-Kompetenz entwickelt sich zur Schlüsselqualifikation. Unternehmen bevorzugen bereits heute Bewerbende mit KI-Erfahrung. Schulungsprogramme sind entscheidend.
  • Change-Management: Vertrauen und Akzeptanz in der Belegschaft bestimmen den Erfolg von KI-Einführungen.

Diese HR-Schlussfolgerungen sind keine direkten Ergebnisse der Primärstudie, sondern autorengetragene Interpretationen, die an die Befunde zu Budgetverteilung und ROI anschließen.

Schlussfolgerung

Die Einführung von GenAI in Unternehmen ist weniger eine technische als eine organisatorische und kulturelle Aufgabe. Die Empirie zeigt eine deutliche Kluft zwischen Experiment und Wertschöpfung. Ob Unternehmen den „GenAI Divide“ überwinden, hängt davon ab, wie sie Partnerschaften gestalten, Lernprozesse institutionalisieren und ihre Belegschaften mitnehmen. Das Personalwesen ist dabei ein entscheidender Hebel – nicht als Kostenstelle, sondern als Treiber der Transformation.

Neueste Artikel & Insights über den Einsatz von KI im Personalwesen

Wenn KI-Trainer vor Chatbots warnen

Einleitung: Die paradoxe Vertrauenskrise im KI-Ökosystem Generative KI wird in Organisationen und im Alltag immer präsenter. Unternehmen versprechen Effizienzgewinne und setzen zunehmend auf Automatisierung – teils verbunden mit Stellenabbau. Ein...

mehr lesen

Personalplanung mit KI: Eine Übersicht

Summary In der Personalplanung vollzieht sich ein Wandel durch Künstliche Intelligenz (KI), der sämtliche Branchen und Unternehmensgrößen umfasst. KI-gestützte Workforce-Planning-Lösungen werden branchenübergreifend – etwa im Gesundheitswesen,...

mehr lesen

Impressum & Datenschutz