KI-Agenten ersetzen keine Mitarbeiter. Sie ersetzen das Statusmeeting, die vierte Anpassung des dritten Entwurfs und die fünfzehnte Excel-Tabelle des Monats. Wer 2026 trotzdem entlässt, entscheidet sich aktiv für die teurere Variante — und kann das mit der Forschungslage nicht mehr begründen.
1. Die seltsame Diskrepanz
KI-Einführung in deutschen Unternehmen folgt erstaunlich oft demselben Drehbuch.
Phase eins: Vorstand oder Geschäftsführung beschließt, „etwas mit KI zu machen”. Phase zwei: Drei Workshops, ein Strategie-PowerPoint, zwei externe Berater. Phase drei: Stille. Und dann, irgendwann zwischen Quartalsende und Sommerpause, stellt jemand fest, dass die Praktikantin ChatGPT schon seit Monaten nutzt, ihre Texte besser sind als die der Abteilung und der Vertriebskollege seinen halben Tag bereits in Claude eintippt — gegen die offizielle IT-Richtlinie, versteht sich.
Parallel dazu laufen in den Wirtschaftsteilen der Zeitungen Schlagzeilen über KI-bedingten Personalabbau bei Allianz, Commerzbank und SAP. Auf Konferenzen wird über „die nächste Welle” gesprochen. Beratungsfirmen verkaufen Studien, die suggerieren, dass die halbe Belegschaft demnächst überflüssig wird.
Zwischen diesen beiden Welten — der unaufgeregten betrieblichen Realität und der dramatischen öffentlichen Erzählung — klafft eine Lücke. In dieser Lücke werden gerade jeden Tag betriebswirtschaftliche Entscheidungen getroffen. Viele davon falsch.
Der bestehende LABBORN-Artikel Substitution oder Halt hat die gesellschaftliche Wahl beschrieben, vor der Deutschland steht. Dieser Artikel zoomt eine Ebene tiefer: Was bedeutet die Halt-Strategie operativ im Unternehmen — und was sagt die belastbare Forschung über Zeitgewinn, Qualität und Beschäftigung, wenn KI-Agenten klug eingesetzt werden?
2. Wo KI-Agenten 2026 wirklich greifen
Nicht alles, was auf LinkedIn als „transformativ” gefeiert wird, funktioniert produktiv. Die folgenden Bereiche der Wertschöpfungskette sind dagegen heute in der Praxis erprobt — vorausgesetzt, das Endergebnis wird von einem Menschen verantwortet.
Marketing und Content. Recherche-Agenten konsolidieren Marktberichte und Wettbewerberauftritte in Stunden statt Tagen. Draft-Agenten erstellen Erstfassungen für Blogartikel, Newsletter, Social Posts. Die Endredaktion bleibt menschlich. Realistisch: 50–70 % Zeitersparnis im Erstentwurf — bei deutlich besserer Quellenlage.
Vertrieb und Lead-Bearbeitung. Lead-Qualifizierung, CRM-Anreicherung, kontextspezifische Erst-Outreach. Ein Agent recherchiert 200 Leads sauber, segmentiert sie und bereitet personalisierte Anschreiben auf. Der Vertriebler entscheidet, wen er anspricht. Die Beziehung bleibt menschlich, die Vorarbeit nicht.
Kundenservice. First-Level-Support für wiederkehrende Anfragen, Ticket-Triage, automatische Eskalation komplexer Fälle. Der Agent klassifiziert und schlägt vor — der Mensch entscheidet bei allem, was nicht trivial ist. Kein Chatbot-Frust für Kunden.
Buchhaltung und Finanzen. Belegerfassung, Kategorisierung, Vorerfassung in DATEV oder Lexoffice, Plausibilitätsprüfung von Rechnungen. Steuerberater oder Buchhaltung prüfen und geben frei. 80 % der Tipparbeit fällt weg.
Projektmanagement und Operations. Statusberichte aus ClickUp, Jira oder Plane. Meeting-Transkripte mit Action-Item-Extraktion. Kontextualisierte Erinnerungen. Der Projektleiter führt das Projekt — dokumentiert es aber nicht mehr selbst von Hand.
Wissensmanagement. RAG-basierte Suche über interne Dokumente, Wikis, Mailverläufe. Neue Mitarbeiter werden in Wochen statt Monaten produktiv, weil sie nicht mehr jeden Kollegen einzeln fragen müssen.
Entwicklung und Technik. Code-Reviews als zweite Stimme. Testfall-Generierung. Technische Dokumentation aus dem Code heraus. Senior-Entwickler verbringen wieder mehr Zeit mit Architektur — und weniger mit Boilerplate.
Die gemeinsame Logik dieser Anwendungen: KI übernimmt die mechanische Vorarbeit. Der Mensch bleibt am Endergebnis verantwortlich. Genau in dieser Konstellation funktioniert sie heute zuverlässig.
3. Produktivität: Was die Zahlen zeigen
Die methodisch sauberste Untersuchung zum Thema kommt von Brynjolfsson, Li und Raymond, publiziert im Quarterly Journal of Economics (Vol. 140, Issue 2, 2025). Sie begleiteten über 5.000 Kundenservice-Mitarbeiter eines US-Softwareunternehmens bei der Einführung eines generativen KI-Assistenten.
Das Ergebnis: +15 % gelöste Anfragen pro Stunde im Durchschnitt. +34 % bei unerfahrenen Mitarbeitern. Erfahrene Mitarbeiter profitierten kaum.
Die KI hob also das Niveau der weniger Geübten — ohne die Top-Performer auszubremsen. Ein bemerkenswerter Befund für jeden, der Personalentwicklung ernst nimmt. Wer zuerst seine schwächsten Mitarbeiter entlässt, verspielt die Gruppe, bei der KI den größten Hebel hat.
Eine sechsmonatige randomisierte Studie von Microsoft Research und Harvard Business School (NBER Working Paper 33795, Mai 2025) bestätigt das Bild in der Breite: 7.137 Teilnehmer aus 66 Unternehmen, Microsoft 365 Copilot im Feldeinsatz. Ergebnis: 31 % weniger Zeit für E-Mail-Bearbeitung — durchschnittlich 3,6 Stunden pro Mitarbeiter und Woche. 12 % schnellere Fertigstellung von Dokumenten. Bei Meetings: kein signifikanter Effekt.
Ein nüchterner Befund. KI greift nicht überall.
Und dann gibt es noch eine Studie, die man kennen muss, wenn man die Hype-Kurve nicht für Realität halten will: Das METR-Experiment (Juli 2025) untersuchte erfahrene Open-Source-Entwickler an komplexen, realen Codebases. KI-Werkzeuge verlangsamten die Arbeit um 19 %. Die Entwickler selbst glaubten, 20 % schneller geworden zu sein.
Diese Wahrnehmungslücke ist der eigentlich beunruhigende Befund: KI fühlt sich produktiver an, als sie ist. Wer ROI nur auf Basis von Selbsteinschätzung der Mitarbeiter misst, misst Stimmung — nicht Wirkung.
4. Qualität: Wo KI Niveau hebt — und wo sie es senkt
Die methodisch stärkste Studie zur Qualitätsfrage kommt aus dem Marketing. Ju und Aral (MIT Sloan, 2025/2026) kombinierten ein randomisiertes Kontrollexperiment mit über 2.200 Teilnehmern und ein Feldexperiment auf X mit rund 5 Millionen echten Ad-Impressions.
Mensch-KI-Teams produzierten 50–60 % mehr Anzeigen pro Bearbeiter als reine Mensch-Mensch-Teams. Bei der Qualität ein gespaltenes Bild: Anzeigentexte wurden mit KI messbar besser (höhere Click-Through-Raten in der echten Kampagne), Bilder dagegen blieben in den reinen Menschen-Teams stärker (besserer Cost-per-Click).
Zwei Befunde aus dieser Studie sind für die Praxis wichtiger als die Durchschnittszahlen.
Erstens: Die Wirkung hängt stark von der Persönlichkeitsstruktur der Beteiligten ab. Gewissenhafte Menschen mit „offener” KI lieferten bessere Bilder; extrovertierte Menschen mit gewissenhafter KI lieferten schlechtere Texte, Bilder und Klickraten. KI ist kein neutrales Werkzeug — sie verändert Teamdynamiken, und nicht jede Kombination funktioniert.
Zweitens: Mensch-KI-Teams produzierten messbar homogeneren Output. Mehr Anzeigen, ähnlich klingend. Für ein Unternehmen, das Markenvielfalt und Originalität als Wettbewerbsvorteil braucht, ist das ein systemisches Risiko, das bewusst gegengesteuert werden muss.
Eine peer-reviewte Studie von CodeScene und der Universität Lund (FORGE 2026, 5.000 refaktorierte Python-Dateien) zeigt denselben Mechanismus in einer ganz anderen Domäne: KI verbessert Qualität in sauberen Codebasen, erhöht aber in legacy-belasteten Codebasen die Fehlerrate um mindestens 30 %.
Die domänenübergreifende Lehre: KI verstärkt, was schon da ist. Auf gutem Fundament wirkt sie als Multiplikator. Auf schlechtem als Beschleuniger des Verfalls.
5. Beschäftigung: Adopter wachsen, sie schrumpfen nicht
Hier wird es interessant — und für die strategische Entscheidung im Unternehmen wichtig.
Hampole, Papanikolaou, Schmidt und Seegmiller (Yale, Northwestern Kellogg, MIT Sloan, NBER Working Paper 33509, 2025) tracken die KI-Adoption in US-Unternehmen von 2010 bis 2023. Sie unterscheiden präzise zwischen zwei Konstellationen: KI automatisiert einige Aufgaben einer Rolle, oder KI automatisiert die meisten Aufgaben einer Rolle.
Das Ergebnis ist eindeutig: Wenn KI nur einige Aufgaben übernimmt, wächst die Beschäftigung in dieser Rolle — die Mitarbeiter konzentrieren sich auf das, was KI (noch) nicht kann. Wenn KI die meisten Aufgaben übernimmt, sinkt die Beschäftigung um rund 14 %.
Die Pointe: Unternehmen mit hoher KI-Adoption zeigten über fünf Jahre 6 % mehr Beschäftigungswachstum und 9,5 % mehr Umsatzwachstum als Nicht-Adopter. Anwaltskanzleien gewannen am meisten — ein prognostizierter Anstieg um 6,4 %, weil KI die Recherchearbeit übernimmt und Anwälte sich stärker auf Beratung konzentrieren.
Schmidts Kernsatz: „Firmen, die KI einsetzen, müssen nicht zwingend Mitarbeiter abbauen; sie können wachsen und mehr produzieren und ihre Mitarbeiter effizienter einsetzen als andere Firmen.”
Dem steht ein zweiter, beunruhigender Befund gegenüber. Das Return on AI Institute (Studie mit 1.006 C-Level-Führungskräften aus 11 Ländern, März 2026) zeigt: Nur 2 % der Unternehmen haben tatsächlich größere Entlassungen vorgenommen, die direkt mit einem konkreten KI-Einsatz begründet werden konnten. Aber fast 60 % haben Einstellungen eingefroren oder reduziert — in der Erwartung künftiger KI-Produktivität, bevor diese überhaupt eingetreten ist.
Die HBR-Autoren Davenport und Srinivasan haben das im Januar 2026 in einem Satz zugespitzt: „Companies Are Laying Off Workers Because of AI’s Potential, Not Its Performance.”
Übersetzt: Der derzeitige Personalabbau im Namen der KI ist überwiegend Spekulation. Nicht Konsequenz tatsächlich gewonnener Produktivität.
Wer Mitarbeiter im Vorgriff entlässt, verliert genau die Köpfe, die er bräuchte, um KI sinnvoll einzusetzen und das nachgelagerte Wachstum mitzunehmen. Das ist nicht nur ethisch fragwürdig — es ist betriebswirtschaftlich teuer. Es kostet institutionelles Wissen, Kundenbeziehungen und die Lernkurve, die Unternehmen brauchen, um KI über die nächste Generationen-Wende hinaus profitabel zu halten.
6. Was jetzt zu tun ist
Aus der Forschungslage und unserer Beratungspraxis kristallisieren sich drei Prinzipien für die operative Einführung heraus.
Augmentation vor Substitution. Jeder Agent bekommt einen menschlichen Verantwortlichen, der das Output prüft, bevor es das Haus verlässt. Das ist nicht Misstrauen gegen die Technik. Das ist Qualitätssicherung — und in vielen Branchen außerdem regulatorisch geboten.
Kleine Schleifen, schnelle Iteration. Lieber drei Wochen mit einem funktionierenden Agenten für einen Prozess, als ein halbes Jahr Konzeptphase für „die ganzheitliche KI-Strategie”. Der rote Faden entsteht im Tun, nicht im PowerPoint. Wer das richtige Pilotprojekt wählt, lernt schneller als jede Strategie-Roadmap es vorhersagen kann.
Die gewonnene Zeit bewusst umlenken. Wenn die Buchhalterin pro Woche einen Tag spart, gehört dieser Tag in eine vorab definierte höherwertige Aufgabe — Mahnwesen, Liquiditätsplanung, Beratung der Geschäftsführung. Sonst verpufft der Gewinn in der Mitarbeiterstunde. Reallokation ist kein Selbstläufer. Sie ist eine Führungsaufgabe.
Und dann der eigentliche Schritt, der über Wachstum oder Schrumpfen entscheidet: die Wahl der Frage. Sie lautet nicht: Wo können wir Stellen einsparen? Sondern: Welche Routinearbeit blockiert unsere besten Leute davon ab, das zu tun, wofür wir sie eigentlich brauchen?
Die belastbare Forschung der letzten anderthalb Jahre zeigt: Unternehmen, die diese Frage richtig stellen, wachsen mit ihrem Personal — nicht ohne. Wer im Vorgriff entlässt, verspielt diesen Hebel zweimal. Einmal das institutionelle Wissen. Einmal die Kapazität, das nachgelagerte Wachstum überhaupt zu tragen.
Die Demografie wartet nicht. Die Konkurrenz auch nicht. Aber die Wahl, wie KI im eigenen Unternehmen wirkt, wird täglich neu getroffen — in jeder Einführungsentscheidung, jeder Pilotrunde, jeder Statusrunde mit dem Vorstand. Multiplikator oder Sparprogramm. Hebel oder Brechstange.
Wir bei LABBORN haben eine klare Position: Der Hebel ist die deutlich bessere Wette. Nicht aus normativen Gründen — sondern weil die Zahlen es zeigen.
Quellen
- Brynjolfsson, Erik / Li, Danielle / Raymond, Lindsey (2025): „Generative AI at Work”. The Quarterly Journal of Economics, Vol. 140, Issue 2, S. 889–942. https://academic.oup.com/qje/article/140/2/889/7990658
- Microsoft Research / Harvard Business School (Mai 2025): „Shifting Work Patterns with Generative AI”. NBER Working Paper 33795. https://www.nber.org/papers/w33795
- METR — Model Evaluation and Threat Research (Juli 2025): „Measuring the Impact of Early-2025 AI on Experienced Open-Source Developers”. https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
- Ju, Harang / Aral, Sinan (MIT Sloan, 2025/2026): „Collaborating with AI Agents: Field Experiments on Teamwork, Productivity, and Performance”. arXiv:2503.18238. https://arxiv.org/abs/2503.18238
- Borg, Markus / Hagatulah, Nadim / Tornhill, Adam / Söderberg, Emma (CodeScene / Lund University, FORGE 2026): „Code for Machines, Not Just Humans: Quantifying AI-Friendliness with Code Health Metrics”. arXiv:2601.02200. https://arxiv.org/abs/2601.02200
- Hampole, Menaka / Papanikolaou, Dimitris / Schmidt, Lawrence D. W. / Seegmiller, Bryan (Yale SOM / Northwestern Kellogg / MIT Sloan, 2025): „Artificial Intelligence and the Labor Market”. NBER Working Paper 33509. https://www.nber.org/papers/w33509
- Davenport, Thomas H. / Srinivasan, Laks (Januar 2026): „Companies Are Laying Off Workers Because of AI’s Potential, Not Its Performance”. Harvard Business Review. https://hbr.org/2026/01/companies-are-laying-off-workers-because-of-ais-potential-not-its-performance
- Davenport, Thomas H. / Srinivasan, Laks (Return on AI Institute, März 2026): „Economic Maturity for Artificial Intelligence: How Organizations Measure and Maximize Value from Artificial Intelligence”. Studie mit 1.006 C-Level-Führungskräften aus 11 Ländern und 32 Branchen. https://www.prnewswire.com/news-releases/thirty-times-more-companies-cut-headcount-because-they-are-anticipating-ai-value-versus-realizing-actual-value-302716119.html