Die zwei Gesichter der KI: Zwischen Genie und Versagen

"KI ist genial – und erstaunlich unzuverlässig". Wer regelmässig mit ChatGPT oder anderen KI-Modellen arbeitet, kennt das irritierende Wechselbad der Gefühle: An einem Tag wirkt die Technologie wie ein intellektueller Turbo. Sie fasst komplexe Texte in Sekunden zusammen, strukturiert Präsentationen, liefert Ideen und schreibt Code. Und kurz darauf scheitert sie an einer banalen Aufgabe, verwechselt einfache Fakten oder erfindet eine Antwort, statt einzugestehen, dass sie es nicht weiss oder nicht kann.

Die "Jagged Frontier"

Diese Gleichzeitigkeit von Brillanz und Blamage ist kein vorübergehender Fehler im System, der sich mit dem nächsten Update erledigt. Sie ist eine strukturelle Eigenschaft dieser Technologie. In Fachkreisen spricht man von der "Jagged Frontier", einer zerklüfteten Grenze dessen, was KI zuverlässig beherrscht. Diese nichtlineare Grenze beschreibt schwer vorhersagbare Leistungsprofile: Modelle können bei bestimmten Aufgaben überragend sein, bei anderen ähnlicher oder sogar geringerer Komplexität jedoch deutlich scheitern.

Der Grund liegt im Funktionsprinzip. Grosse Sprachmodelle sind keine klassischen Expertensysteme mit festen Regeln. Sie generieren Antworten probabilistisch, auf Basis statistischer Wahrscheinlichkeiten für Sprachmuster im Kontext. Das macht sie stark bei Aufgaben, in denen Sprache, Mustererkennung und Kontext dominieren, etwa bei Entwürfen, Varianten, Strukturierung, Übersetzungen oder Zusammenfassungen. Sie sind ideale "Erstversions-Maschinen".

Problematisch wird es dort, wo exakte Korrektheit und eindeutige Verantwortung zählen. Wenn Daten fehlen, Prozesse viele Ausnahmen enthalten oder Fehler reale Kosten verursachen – etwa bei Zahlungen, Vertragsklauseln, regulatorischer Kommunikation oder medizinischen Aussagen – wird aus dem Genie schnell ein Risiko.

Für Unternehmen ergeben sich daraus zwei zentrale Erkenntnisse:

  1. Die entscheidende Frage lautet nicht "KI ja oder nein", sondern: Für welche Aufgabe, mit welchen Fehlerkosten und welcher Kontrolle?
  2. Der eigentliche Aufwand liegt nicht im perfekten Prompt, sondern im Betriebsmodell. Entscheidend ist, wie Arbeitsschritte, Daten, Freigaben, Verantwortlichkeiten und Kontrollmechanismen ausgestaltet und umgesetzt werden.

Vorgehen in der Praxis

Drei Prinzipien helfen bei der Navigation entlang der gezackten Kante.

  1. Aufgaben nach Fehlerfolgen sortieren. Wo Fehler tolerierbar sind, etwa bei internen Entwürfen, Brainstormings oder Zusammenfassungen, bringt KI sofort Tempo. Wo Fehler kritisch sind, braucht es klare Leitplanken: Pflichtquellen, standardisierte Templates mit vordefinierten Formulierungen, Audit Trail oder bewusst den Verzicht auf KI.
  2. "Human in the loop" als Designprinzip. Menschen sollten nicht erst am Ende flüchtig kontrollieren, sondern gezielt jene Schritte übernehmen, in denen KI schwächelt: Fakten prüfen, Quellen einfordern, Ausnahmen beurteilen, Entscheidungen verantworten. Die KI wird zum Sparringpartner oder Co-Analysten, nicht zum Entscheider.
  3. Verlässlichkeit messbar machen. KI-Einführung ist ein Lernprozess mit klar definierten Referenzfällen, Monitoring und kontinuierlicher Verbesserung. Nur so lässt sich realistisch beurteilen, ob der Einsatz von KI sinnvoll ist. Andernfalls werden hohe Erwartungen geweckt und erhebliche Mittel investiert, doch der Nutzen bleibt aus. Ursache ist meist nicht die Technologie selbst, sondern ihre unzureichende Integration in Prozesse, Datenarchitektur und Governance.

Fazit

Wir werden noch lange mit dieser Dualität leben. KI wird spektakuläre Fortschritte machen und zugleich in bestimmten Ecken überraschend stolpern. Sie macht Fehler, die kein Mensch machen würde und leistet Dinge, die kein Mensch leisten kann. Wer beides ignoriert, zahlt den Preis. Wer beides versteht und seine Prozesse danach ausrichtet, verschafft sich einen komparativen Vorteil.

Die Gewinner der KI-Ära werden jene sein, die die gezackte Grenze der KI-Fähigkeiten präzise kartieren und ihre Organisation so gestalten, dass Genialität skaliert und Fehler systematisch kontrolliert werden.

Quellen:

DE