DB Podcast

Serie: Human in the Loop

Human in the Loop: Der Weg vom Jobtitel zur KI-Kompetenz

< zurück

Seite: 2/2

Anbieter zum Thema

Wie Qualität, Tempo und Sicherheit messbar werden

Teams, die HITL wie in den Fallbeispielen ernst nehmen, machen Fortschritt sichtbar. Dafür braucht es wenige, dafür konsequent erhobene Metriken: die Fehlerquote bei Fakten und Compliance, die Abnahmequote im ersten Durchlauf, die Bearbeitungszeit pro Vorgang sowie die Wiederholfehlerrate vor und nach Prompt- oder Wissensbasis-Updates. Ergänzend lohnt sich eine Zufriedenheitserhebung bei Nutzern und im Team – intern wie extern. Wichtig ist die Taktung: wöchentliche Reviews bei Pilotphasen, später monatliche Retros mit klaren Änderungen im Playbook. So entsteht ein Sicherheitsnetz, das Skalierung ermöglicht, statt sie zu bremsen.

Human in the Loop: Chancen und Grenzen in der Praxis

  • Associated Press: Automatisierte Quartalszahlen mit menschlicher Kontrolle
    Seit 2014 lässt AP Routinemeldungen zu Quartalszahlen automatisch generieren – auf Basis strukturierter Daten und von Redakteurinnen entwickelter Templates. Anfangs wurde jeder Text gegengelesen, später genügten Stichproben; komplexe Fälle (Fusionen, Sondereffekte) wurden aus der Automatisierung ausgenommen. Ergebnis: Zehntausende zusätzliche Meldungen jährlich, ohne Qualitätsabstriche – und Journalistinnen gewannen Zeit für Analysen. Die Logik von Human in the Loop ist hier Vorbild: klare Kriterien, bewusste Ausnahmen, konsequentes Monitoring.
  • Unilever: KI im Recruiting – Selektion mit menschlicher Entscheidung
    Bei der Vorselektion im Volumenrecruiting setzte Unilever auf spielbasierte Assessments und KI-gestützte Videoanalyse, ließ aber grundsätzlich Menschen über Einladungen und Einstellungen entscheiden. So konnten Durchlaufzeiten massiv sinken, während Fairness- und Unternehmenspassungsfragen im Discovery Center bei realen Teams verblieben. Ein gutes Beispiel dafür, wie HR mit HITL sowohl Effizienz- als auch Governance-Ziele ausbalanciert.
  • Deutsche Telekom: „Ask Magenta“ mit nahtloser Handover-Logik
    Der Chatbot „Ask Magenta“ beantwortet Millionen Kundenanfragen. Entscheidend: Die Handover-Mechanik zur menschlichen Beratung ist integraler Bestandteil – wenn der Bot unsicher ist, der Fall komplex wird oder Kundinnen es wünschen, wechselt der Dialog nahezu nahtlos zu Mitarbeitenden. Diese Kombination aus Automatisierung, Unsicherheits-Erkennung und menschlicher Übernahme ist gelebter HITL im Kundenservice – und ein wichtiger Grund, warum Akzeptanz bei Kundschaft und Mitarbeitenden steigt.
  • Duolingo: Lernen mit GPT-4 – kuratiert von Menschen
    Mit „Duolingo Max“ führt das Unternehmen KI-gestützte Rollenspiele und Erklärungen ein. Curriculum-Designerinnen entwickeln Szenarien, prüfen Tonalität und Fakten und verarbeiten Nutzer-Feedback zurück in die Systeme. So bleibt die Ansprache motivierend und kulturell stimmig, während KI skaliert. Wieder erkennbar: Menschen definieren „gute Qualität“, KI liefert Volumen, Feedbackschleifen sorgen für Fortschritt. 
  • Klarna: Geschwindigkeit, aber nicht ohne Balance
    Bei Klarna wickelt ein KI-Assistent seit 2024 einen großen Teil der Servicechats ab – mit Erfolgen bei Reaktionszeit und Kostenseite. Gleichzeitig zeigte die öffentliche Debatte, wie wichtig Eskalations- und Qualitätsmechanismen bleiben: Dort, wo Empathie, Kulanzspielräume oder komplexe Sachverhalte zählen, braucht es verlässliche Mensch-Übernahmen und Qualitätsmonitoring. Lehre für alle: Effizienzgewinne überzeugen, wenn Governance und Experience mithalten.
  • BMW Group: Visuelle Qualitätsprüfung mit menschlicher Verifikation
    In Werken wie Regensburg unterstützt KI die visuelle Inspektion von Oberflächen und Bauteilen. Die Systeme erkennen Anomalien in Echtzeit, doch die Entscheidung über Nacharbeit oder Freigabe liegt bei qualifizierten Mitarbeitenden. So entstehen robuste Qualitätsprozesse: KI reduziert Blindspots und Müdigkeitsfehler, Menschen sichern Relevanz und Priorisierung.

Mini-Playbook für HR und Mitarbeiter

HR: Rollenprofile auf Kompetenzen umstellen (Briefing, Review, Datenkompetenz), Schulungsbausteine und RACI-Templates bereitstellen, Betriebsrat früh beteiligen.

Führung: Ein bis zwei Use-Cases mit klarem Geschäftsnutzen auswählen, Kriterien und Sampling festlegen, KPIs sichtbar machen, Lernrhythmus verankern.

Mitarbeiter: Täglich kurze HITL-Übungen, Korrekturen begründen und dokumentieren, Verbesserungsvorschläge aktiv in Prompt/Wissensbasis einspeisen.

Der Weg in 90 Tagen – vom Einstieg zur Sichtbarkeit

Die ersten vier Wochen gehören dem Fundament: Verstehen, was aktuelle KI-Modelle leisten und wo typische Fehler liegen; Datenschutzregeln praktisch anwenden; einen kleinen, klar messbaren Use-Case auswählen; Qualitätskriterien schriftlich fixieren; ein einfaches Review-Template bauen und täglich üben. In den Wochen fünf bis acht folgt der strukturierte Pilot: Risikobasiertes Sampling etablieren, ein kleines KPI-Set loggen, wöchentliche Reviewrunden einführen und Prompt- sowie Wissensbasis-Änderungen dokumentieren. In den Wochen neun bis zwölf wird skaliert: Das Playbook scharfstellen, eine kurze Team-Schulung durchführen, Automatisierungsschwellen definieren (zum Beispiel ab 95 Prozent Abnahmequote im Erstlauf) und einen leichten Audit-Rhythmus festlegen. Damit ist HITL nicht mehr Experiment,  sondern direkt im Betrieb.

Typische Fallstricke – und wie man sie vermeidet

Dort, wo KI gefühlt „meistens“ richtig liegt, schleicht sich Automations-Bias ein: Menschen übernehmen ungeprüft. Abhilfe schaffen dabei Pflichtbegründungen je Qualitätskriterium und sichtbare Ampellogik im Review. „Ghost Work“ ist ein weiteres Problem: unsichtbare Reviewlast im Team. Hier helfen klare Zeitbudgets, Rotationspläne und Anerkennung im Zielsystem. Große Risiken lauern im Umgang mit Daten – personenbezogene Informationen gehören nicht in Prompts, wo immer möglich wird pseudonymisiert oder mit internen Modellen gearbeitet.

Und schließlich: Jede Automatisierung braucht definierte Eskalationswege. Ein kurzes Incident-Playbook (Was passiert bei Fehlversand? Wer informiert wen?) ist Gold wert.

Quintessenz

Human in the Loop macht Menschen nicht zum Gegenpol der KI, sondern zum Qualitätsmotor. Wer Fachwissen mit Bewertungs- und Prozesskompetenz verbindet, beschleunigt sein Team – und schützt das Unternehmen vor Reputations- und Compliance-Schäden. 
Für HR ist es die Chance, Kompetenzen sichtbar zu machen und Karrierepfade neu zu denken. 
Für Führungskräfte ist es der Hebel, Tempo mit Verantwortung zu koppeln. 
Für Mitarbeiter ist es der pragmatische Weg, in 90 Tagen vom Tool-Nutzer zur unersetzlichen Instanz im Wertschöpfungsprozess zu werden.

Human in the LoopHeiner Sieger
ist Chefredakteur der Fachpublikationen Digital Business Magazin und e-commerce magazin.

Bildquelle: Heiner Sieger

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung