Cluster B – Prüfungsadministrationsinnovation – Next Gen Admin

Cluster B: Prüfungsadministrationsinnovation

KI-Einsatz im kaufmännischen Prüfungswesen

Die Nutzung generativer (=erzeugender/schaffender/kreierender) Künstlicher Intelligenz (KI) an kaufmännischen Arbeitsplätzen hat das Potential, die Ausbildung zu revolutionieren. Das schafft neue Anforderungen an Ausbilder:innen und Auszubildende, um Kompetenzen im Umgang mit Technologien zu entwickeln und anzuwenden. Die Einführung von KI erfordert das Bewusstsein für rechtliche Rahmenbedingungen, die sicherstellen, dass die Technologie verantwortungsvoll eingesetzt wird, ohne ethische Standards und Datenschutzrichtlinien zu gefährden. Es lassen sich im Umgang mit KI-Systemen drei Punkte identifizieren, die von besonderer Bedeutung für das berufliche Ausbildungssystem sind:

  • Pflicht zur Vermittlung: Die gesetzliche Pflicht zur Vermittlung von KI-Kompetenz erfordert, dass Ausbilder:innen fundierte Kenntnisse über Künstliche Intelligenz an ihre Lernenden weitergeben, um die digitale Bildung zu fördern.
  • Hochrisiko-Systeme: KI-Systeme, die zur Bewertung von Lernleistungen oder zur Zulassung zu Bildungswegen (z. B. automatisiertes Screening von Bewerbungen) eingesetzt werden, gelten als „Hochrisiko“. Sie unterliegen strengen Auflagen (Transparenz, menschliche Aufsicht, Datenqualität), sodass die Prüfungsadministration vor neue Aufgaben gestellt wird.
  • Allgemeine Kennzeichnungspflicht: Die Nutzung von KI-Systemen unterliegt einer allgemeinen Kennzeichnungspflicht. Wenn Auszubildende mit generativer KI interagieren, muss dies klar erkennbar sein. KI-generierte Inhalte müssen folglich als solche identifizierbar gemacht werden, um Täuschungen vorzubeugen.
Datengrundlage

5 untersuchte IHK-Standorte

Ludwigshafen · Erfurt · Frankfurt · Hannover · Offenbach

5 verschriftlichte Gruppengespräche

Interviews und Workshops mit Prüfungsadministration

Methodisches Vorgehen
  • Nominal Group Technique (ca. 90 min)
  • Auswertung Datenmaterial: Qualitative Inhaltsanalyse nach Kuckartz
  • 3 unabhängige Kodierende → Intercoder-Reliabilität: sehr gute Übereinstimmung (Krippendorffs α = 0,82)
Zielebene

KI-Auswirkungen auf Kompetenzen, Prüfungsorganisation, Bewertung und rechtliche Grenzen.

Spannungsverhältnis Cluster B
Entlastungspotenzial durch KI Validitäts- und Rechtsrisiko
Zentrales Steuerungsmodell: Warum KI Prüfungsadministration verändert

Ausgangspunkt

  • KI wird Teil kaufmännischer Arbeit
  • Generative KI verändert Tätigkeiten, Wertschöpfung und betriebliche Assistenzsysteme
  • Es entstehen neue Anforderungen an Ausbilder:innen und Auszubildende
Prüfungsanpassungen notwendig, damit Abschluss Aussagekraft für Arbeitsmarkt erhält.

Prüfungsadministration als Steuerungsinstanz

Sie muss drei Fragen beantworten:

  1. Welche KI-Kompetenzen müssen geprüft werden?
  2. In welchen Prüfungsteilen kann KI unterstützen?
  3. Wie bleiben Prüfungen zentral geregelt, fair und rechtssicher?

Drei Anforderungen im KI-Reglungskontext

  1. KI-Literacy vermitteln: KI-Kompetenz wird Ausbildungsgegenstand
  2. Hochrisiko beachten: Bewertung, Korrektur, Zulassung und Screening sind besonders sensible Bereiche
  3. KI Nutzung kennzeichnen: KI-generierte Inhalte und Eigenleistung müssen erkennbar bleiben

(Orientierung am EU AI Act)

Entwicklungsfeld 1:
Prüfungsformate rekonfigurieren

Von produktorientierten Formaten zu prozessualen Transferleistungen und Fachgesprächen.

Entwicklungsfeld 2:
Integritätsstandards normieren

Standardisierte Eigenständigkeitserklärungen statt kleinteiliger KI-Kontrolle.

Entwicklungsfeld 3:
Integration in Prüfungen

Zuerst administrative Prozesse stärken, danach evaluative KI-Anwendungen erproben.

Empirische Befunde
1

Befund 1: KI-Kompetenzen werden integraler Teil beruflicher Handlungsfähigkeit.

KI-Literacy und kritische Reflexion werden zur Grundvoraussetzung für Prüfungsbeteiligte.

2

Befund 2: KI bietet Entlastungspotenziale im administrativen Kern.

Insbesondere in Organisation, Zuteilung, Kommunikation und Dokumentation.

3

Befund 3: Die Kennzeichnungspflicht gilt in der Praxis als dauerhaft schwer umsetzbar.

Transparente Nachweise über KI-Nutzung sind technisch & didaktisch kaum realisierbar.

4

Befund 4: Technologische Dynamik kollidiert mit systemischer Trägheit.

Langsame Ordnungsprozesse bremsen Integration innovativer KI-Anwendungen.

KI‑Strategieberatung – Trendslop‑Effekt

KI‑Strategieberatung: Der Trendslop‑Effekt

Die zunehmende Nutzung großer Sprachmodelle (LLMs) wie ChatGPT verspricht, komplexe Sachverhalte zusammenzufassen und in Sekundenschnelle klare strategische Empfehlungen zu liefern. Doch eine empirische Studie von Angelo Romasanta, Llewellyn D. W. Thomas und Natalia Levina zeigt, dass LLMs bei strategischen Entscheidungen systematische Verzerrungen aufweisen. Sie folgen modischen Schlagworten anstatt die konkreten Umstände des Unternehmens zu berücksichtigen – ein Phänomen, das die Autor:innen „Trendslop“ nennen.

Forschungsdesign

Für die Untersuchung wurden sieben führende LLMs auf sieben grundlegende strategische Spannungsfelder getestet. Die Modelle mussten sich jeweils zwischen zwei Alternativen entscheiden. Variiert wurden sowohl die Unternehmenskontexte (z. B. Startup vs. Konzern) als auch die Prompts (offene Frage vs. Pro‑/Contra‑Anweisung). Die sieben Spannungsfelder lauteten:

  • Exploration vs. Exploitation
  • Zentralisierung vs. Dezentralisierung
  • Kurzfristig vs. Langfristig
  • Wettbewerb vs. Kooperation
  • Radikal vs. Inkrementell
  • Differenzierung vs. Kommodifizierung
  • Automatisierung vs. Augmentierung

Schlüsselbefunde

Die Analysen ergaben, dass LLMs bei den meisten Spannungsfeldern konsistent dieselbe Option bevorzugen, unabhängig von Kontext und exakter Fragestellung. Unten werden die wichtigsten Verzerrungen kompakt dargestellt.

Differenzierung > Kommodifizierung

Fast alle LLMs empfehlen Unternehmen, sich durch einzigartige Leistungen und Marken zu differenzieren, statt über niedrige Kosten zu konkurrieren. Die Modelle ignorieren damit die etablierte strategische Option der Kostenführerschaft.

Augmentierung > Automatisierung

Die Systeme befürworten nahezu ausnahmslos die Ergänzung menschlicher Arbeit durch KI, anstatt Prozesse vollständig zu automatisieren. Dies spiegelt die positive Konnotation von „Augmentierung“ im aktuellen Diskurs.

Langfristig > Kurzfristig

LLMs bevorzugen langfristige Strategien – auch in Situationen, in denen kurzfristige Maßnahmen überlebenswichtig sein können. Dadurch verstärken sie den Trend zu langfristigem Denken.

Exploration vs. Exploitation

Nur bei diesem Spannungsfeld zeigen sich spürbare Unterschiede zwischen den Modellen. ChatGPT tendiert beispielsweise zum explorativen Ansatz, während andere Modelle stärker auf die Ausbeutung bestehender Kompetenzen setzen.

Die Hybrid‑Falle

Werden die Modelle nicht zu einer Entscheidung gezwungen, empfehlen sie häufig „alles zugleich“: z. B. Differenzierung und Kostenführerschaft. Solche Hybride gelten in der Strategie‑Literatur als riskant und führen zu unklaren Prioritäten.

Ursachen der Verzerrungen

LLMs werden auf riesigen Mengen öffentlich verfügbarer Texte trainiert. Begriffe wie „Differenzierung“, „Augmentierung“ oder „Kollaboration“ besitzen im zeitgenössischen Wirtschafts­diskurs eine positive Aura, während „Kommodifizierung“ oder „Hierarchie“ eher negativ besetzt sind. Da LLMs Worte anhand ihrer statistischen Attraktivität auswählen, reproduzieren sie diese kulturell verankerten Vorlieben. Zusätzlich verarbeiten sie bevorzugt moderne Management‑Narrative und ignorieren klassische Strategietheorien wie Michael Porters Empfehlung der Kostenführerschaft.

Empfehlungen für die Nutzung von LLMs

  • LLMs als Ideenquelle nutzen: Die Modelle eignen sich zur Generierung von Alternativen, Risiken und Stakeholder­perspektiven, dürfen aber nie die endgültige Entscheidung ersetzen.
  • Bias bewusst kontern: Fordern Sie das Modell explizit auf, auch die weniger trendigen Optionen (z. B. Kommodifizierung, kurze Fristen) ausführlich zu begründen.
  • Hybrid‑Empfehlungen hinterfragen: Wenn das Modell zu Mischstrategien rät, behandeln Sie dies als Warnsignal. Erarbeiten Sie für jede Option getrennt eine Risiko‑/Nutzen‑Analyse.
  • Kontext reicht nicht aus: Detaillierte Unternehmensbeschreibungen reduzieren die Verzerrungen nur geringfügig; das Modell bleibt bei seinen modisch geprägten Vorlieben.
  • Strategische Urteilsfähigkeit bewahren: Führungskräfte müssen die Entscheidungshoheit behalten und sich der kulturellen Prägungen von LLMs bewusst sein.

Quelle: Romasanta, Angelo / Thomas, Llewellyn D. W. / Levina, Natalia (2026): „Researchers Asked LLMs for Strategic Advice. They Got ‘Trendslop’ in Return.“ in: Harvard Business Review, 16. März 2026.

Cluster‑Zuordnung

Passend zu Cluster B – Prüfungsadministrationsinnovation / Next Gen Admin.

Die Studie zur „Trendslop“‑Verzerrung zeigt, dass LLMs moderne Management‑Trends ungeprüft reproduzieren. Damit unterstreicht sie zentrale Anliegen des Cluster B: Ausbilder:innen müssen Lernende für KI‑Literacy sensibilisieren, rechtliche Rahmenbedingungen (Transparenz, menschliche Aufsicht, Datenqualität) einhalten und die Kennzeichnungspflicht von KI‑Systemen beachten. Gleichzeitig ist eine kritische Urteilskompetenz erforderlich, um KI‑Outputs zu bewerten und Fehlleistungen zu identifizieren. Die Ergebnisse belegen somit die Relevanz von Governance, rechtlicher Absicherung und menschlichem Ermessen, wie sie im Cluster B diskutiert werden.

KI‑Rechtsgrundlagen in der beruflichen Bildung

Rechtsgrundlagen für KI in der beruflichen Bildung

Das Rechtsgutachten von Heckmann, Paschke und Rachut beleuchtet die vielfältigen Gesetzesquellen, die den KI‑Einsatz im beruflichen Bildungswesen strukturieren. Von Verfassungsnormen über EU‑Regulierungen bis hin zu Datenschutz‑ und Urheberrecht müssen Prüfer:innen und Bildungsträger eine Vielzahl von Vorgaben beachten. Diese Übersicht systematisiert die wichtigsten Artikel und Paragraphen und zeigt auf, wie sie in die Prüfungsadministration einfließen.

Juristische Fundamente

Grundgesetz & Berufsbildungsrecht

Das Grundgesetz (GG) garantiert in Art. 12 Abs. 1 GG die Freiheit der Berufsausübung und verlangt laut Art. 3 Abs. 1 GG die Gleichbehandlung aller Prüflinge. Die Handwerksordnung und das Berufsbildungsgesetz (BBiG) regeln, dass Prüfungen den Ausbildungsstand korrekt abbilden müssen. Prüfungsaufgaben dürfen niemanden unbillig benachteiligen und müssen staatlich legitimiert sein (Grundsatz der Wesentlichkeit). Diese Normen bilden den verfassungsrechtlichen Rahmen für die Gestaltung KI‑gestützter Prüfungen.

EU‑KI‑Verordnung (AI Act)

Die Verordnung definiert KI‑Systeme in Art. 3 und unterscheidet unter anderem „hochrisikoreiche“ Anwendungen (Kapitel II). Artikel 6 und 8 benennen Anforderungen an Risikomanagement, Transparenz und menschliche Aufsicht. Artikel 52 beschreibt Kennzeichnungspflichten, wenn generative KI Inhalte erstellt. Diese Bestimmungen bestimmen den Einsatz von KI‑Assistenten bei Prüfungen und verpflichten Anbieter und Betreiber zu Dokumentation und Konformitätserklärung.

Datenschutz & DSGVO

Die Datenschutz‑Grundverordnung (DSGVO) regelt im Art. 5 die Grundsätze der Datenverarbeitung (Rechtmäßigkeit, Zweckbindung, Datenminimierung). Art. 6 erläutert die Zulässigkeit der Verarbeitung, und Art. 25 verpflichtet zur „Privacy by Design“. Für KI‑Prüfungen bedeutet dies: personenbezogene Daten müssen sparsam erhoben, in der EU verarbeitet und gegen unbefugten Zugriff geschützt werden. Betroffene haben Rechte auf Auskunft, Berichtigung und Widerspruch (Art. 15–17 DSGVO).

Urheber‑, Vertrags- & Haftungsrecht

Das Urheberrechtsgesetz (UrhG) schützt kreative Werke und regelt das Verhältnis von Original und KI‑generiertem Inhalt. Die Nutzung von Trainingsdaten und die Veröffentlichung von Prüfungsmaterial müssen Rechte Dritter respektieren. Vertragliche Regelungen (BGB) sichern die Beziehung zwischen Bildungsträgern und KI‑Anbietern. Zudem sind Haftungsfragen zu klären: Wer trägt Verantwortung bei Fehlern des Systems? Das Gutachten mahnt zur klaren Vertragsgestaltung und Haftungsbegrenzung.

Risikoklassen & Akteursrollen

Das Gutachten empfiehlt, KI‑Systeme nach ihrer kritischen Wirkung einzuordnen: peripher (z. B. Kalenderdienste), niedrig (Sprachmodelle zur Inspiration), mittel (Assistenz in der Prüfungsvorbereitung), hoch (automatisierte Bewertungs- und Zulassungsverfahren) und sehr hoch (vollautomatische Entscheidungsfindung). Je höher das Risiko, desto strenger die Pflichten für Anbieter und Betreiber – inklusive Transparenz, Auditierung, menschlicher Kontrolle und Dokumentationspflicht.

Prüfungsprinzipien & Fairness

Prüfungen sollen die Eigenleistung der Kandidat:innen abbilden. Prüfungsordnungen müssen Transparenz über erlaubte Hilfsmittel bieten und die Chancengleichheit wahren. Der Einsatz von KI‑Detektoren wird abgelehnt, da er auf statistischen Wahrscheinlichkeiten basiert und diskriminierungsanfällig ist. Stattdessen fordert das Gutachten Aufgabenformen, die Kontext, Transfer und argumentative Begründung verlangen. Prüfungsinstitutionen sollten klare Vorgehensweisen für Fälle vermuteter Manipulation definieren, die auf persönlicher Anhörung statt auf rein technischen Tests beruhen.

Gestaltungsempfehlungen & Governance

  • Juristische Einbettung sicherstellen: Verankern Sie KI‑Prüfungen explizit in den Prüfungsordnungen und berufen Sie sich auf die relevanten Artikel des AI Acts, der DSGVO und des Grundgesetzes.
  • Transparenz und Kennzeichnung: Verpflichten Sie Anbieter zur Offenlegung von Trainingsdaten und Funktionsweisen (Art. 52 AI Act) und machen den KI‑Einsatz für Prüflinge und Prüfer:innen eindeutig kenntlich.
  • Risikoangepasste Verfahren: Definieren Sie für jede Risikoklasse spezifische Abläufe – von der Risikoanalyse über die Konformitätsbewertung bis zur menschlichen Aufsicht bei hochkritischen Anwendungen.
  • Datenschutzorientierte Architektur: Implementieren Sie „Privacy by Design“ (Art. 25 DSGVO), speichern Sie Daten in EU‑Infrastrukturen und minimieren Sie personenbezogene Daten. Schaffen Sie klare Einwilligungsprozesse.
  • Rechtskenntnis stärken: Schulen Sie Prüfungsadministratoren in relevanten Rechtsgebieten (AI Act, DSGVO, UrhG, Haftungsrecht), damit sie rechtssichere Entscheidungen treffen können.
  • Integritätsorientierte Aufgaben: Gestalten Sie Prüfungen so, dass reflexive, argumentationsintensive und kontextuelle Leistungen im Vordergrund stehen. Prüfen Sie nicht nur das Ergebnis, sondern auch den Weg dorthin.

Quelle: Heckmann, Dirk / Paschke, Anne / Rachut, Sarah (2026): „Künstliche Intelligenz in der beruflichen Bildung: Wissenschaftliches Rechtsgutachten mit Praxisempfehlungen“. Institut für Rechtswissenschaften, TU Braunschweig.

Cluster‑Zuordnung

Cluster B – Prüfungsadministrationsinnovation / Next Gen Admin.

Diese juristische Übersicht richtet sich an Prüfungsinstitutionen und Verwaltungseinheiten. Sie verdeutlicht, wie Verfassungsrecht, EU‑Regulierungen und Datenschutzvorgaben zusammenwirken, um den Einsatz von KI in Prüfungsprozessen zu steuern. Damit bildet sie eine fundierte Grundlage für Cluster B, das sich auf Innovationen in der Prüfungsadministration und Governance konzentriert.