Prüfungen stehen seit Langem im Zentrum des Bildungssystems, weil sie Wissen und Fähigkeiten sichtbar machen und vergleichen sollen. Heute aber rückt stärker die Frage in den Vordergrund, wie diese Funktionen im Zeitalter generativer KI überhaupt noch zuverlässig erfüllt werden können. Doch mit dem Aufkommen generativer KI geraten diese Funktionen ins Wanken. KI-Sprachmodelle können Aufgaben wie Recherchieren, Zusammenfassen oder Ausformulieren schneller und präziser lösen als viele Lernende. Lehrende wie auch Studierende fragen sich: Wie ernst zu nehmend sind Prüfungsleistungen noch, wenn KI sie unterstützen oder sogar übernehmen kann?
Klassische Prüfungsformate unter Druck
Essays oder Hausarbeiten geraten durch den Einsatz von KI zunehmend an ihre Grenzen. Mit wenigen Eingaben lassen sich heute komplette Texte generieren, was nicht nur Eigenständigkeitserklärungen fragwürdig erscheinen lässt, sondern vor allem die Frage aufwirft, ob solche Aufgaben den Bildungsansprüchen noch gerecht werden. Prüfungsformate geraten dadurch insgesamt unter Druck: Einige Hochschulen in Deutschland haben bereits das Format der Bachelorarbeit abgeschafft, weil nicht mehr nachvollziehbar ist, wer diese Arbeiten geschrieben hat. Bildungsanbieter reagieren mit unterschiedlichen Strategien – von Dokumentationspflichten über Reglementierungen bis hin zu Verboten der KI-Nutzung.
Zudem ist die emotionale Belastung vieler Lernenden hoch: Oft stehen sie unter dem Verdacht[1], ihre Arbeiten nicht selbst verfasst zu haben. Der Druck steigt zusätzlich, wenn Lehrkräfte auf unzuverlässige KI-Detektoren[2] vertrauen, die falsche Ergebnisse liefern und so zu ungerechten Bewertungen führen. Für Prüfungen stellt sich daher die Frage, wie Täuschungen vermieden und gleichzeitig faire Bedingungen gesichert werden können.
Eine mögliche Antwort auf diese Herausforderung liegt in einem grundlegenden Paradox: Wir messen den Erfolg einer revolutionären Technologie an einem Kompetenzmodell, das vor ihrer Entstehung entwickelt wurde. Die aktuellen Bildungsstandards entstanden zwischen 2003 und 2005 als Reaktion auf PISA 2000 – basierend auf einer Kompetenzdefinition von 2001. Diese Standards spiegeln die Anforderungen einer analogen Welt wider und erfassen nur bedingt die Herausforderungen einer KI-geprägten Realität. Das Problem ist dabei weniger technologischer als vielmehr struktureller Natur. Wenn Schüler*innen heute bei Hausauf-gaben oder Tests „nur noch KI bedienen“ anstatt eigenständig zu denken, dann ist das nicht zwangsläufig ein Versagen der Technologie – sondern ein Hinweis darauf, dass unser Bewertungssystem nicht mehr zeitgemäß ist und die falschen Aufgaben gestellt wurden.
Neue Anforderungen an Prüfungen im KI-Zeitalter
Wenn generative KI Routinetätigkeiten übernimmt, verschiebt sich der Fokus stärker auf andere Kompetenzen: die kritische Bewertung und Einordnung von Quellen, die Fähigkeit, Informationen im Kontext zu reflektieren sowie die Entwicklung einer eigenen Urteilsfähigkeit. Ebenso unverzichtbar ist der bewusste und reflektierte Umgang mit KI-gestützten Werkzeugen. „AI Literacy“ bedeutet daher weit mehr, als nur Prompts zu formulieren. Sie umfasst auch das Erkennen von Grenzen, der eigenen und technischen Möglichkeiten, das kritische Prüfen von Ergebnissen und das bewusste Dokumentieren des eigenen Vorgehens.
Prüfungen im KI-Zeitalter müssen daher über reine Wissensabfrage hinausgehen und auf umfassende, digitale und überfachliche Kompetenzrahmen Bezug nehmen. Sie sollen nicht nur technische Fähigkeiten, sondern vor allem reflexive, ethische und gestaltende Kompetenzen der Lernenden sichtbar machen. Dazu gehören unter anderem:
- Digitale Basiskompetenzen (z. B. nach EU DigComp 2.2, dem Referenzrahmen für digitale Kompetenzen der Europäischen Kommission): Informations- und Datenkompetenz, digitale Kommunikation und Zusammenarbeit, das Erstellen digitaler Inhalte, Sicherheit im Umgang mit Daten und digitale Problemlösefähigkeiten.
- AI Literacy und Data Literacy: Grundverständnis für KI-Systeme, kritische Ergebnisprüfung, Transparenz durch Dokumentation z. B. kritische Ergebnisprüfung und datenethische Sensibilität.
- Kritisches Denken und Problemlösekompetenz: Quellenkritik, Argumentationsfähigkeit und Kontextbewusstsein.
- Selbstreguliertes Lernen und Metakognition: Planung und Bewertung eigener Lernprozesse, Reflexionsfähigkeit und Motivation.
- Ethische und gesellschaftliche Verantwortung: Fairer Zugang zu Technologien, nachhaltige und diskriminisierungsfreie Nutzung sowie aktive Mitgestaltung.
- Kommunikations- und Präsentationskompetenz: Multimodales Präsentieren sowie verständliches Visualisieren komplexer Inhalte.
Ein Aspekt, der dabei nicht übersehen werden darf, ist die Gefahr des sogenannten Skill Skipping: Lernende könnten geneigt sein, wichtige Lernschritte zu überspringen, weil KI viele Aufgaben schneller und scheinbar effizienter übernimmt – noch bevor ein grundlegendes Verständnis aufgebaut wurde. Hier braucht es eine bewusste Balance: Auch im Zeitalter leistungsfähiger Assistenzsysteme bleiben Basiskompetenzen zentral – etwa das strukturierte Argumentieren, das eigenständige Gliedern von Texten oder grundlegende mathematische Denkfähigkeiten. Prüfungen sollten daher nicht nur den Umgang mit KI sichtbar machen, sondern auch belegen, dass Lernende grundlegende Kompetenzen selbstständig aufbauen, anwenden und kritisch reflektieren können.
Ein weiterer zentraler Punkt ist die Fairness und damit die Frage nach Bildungsgerechtigkeit. Damit alle Lernenden gleiche Chancen haben, braucht es auch einen gleichwertigen Zugang zu den eingesetzten KI-Tools. Eine Recherche[3] des Chaos Computer Clubs aus dem Jahr 2024 hat beispielsweise gezeigt, dass ein in Rheinland-Pfalz eingesetztes KI-System Arbeiten, die mit einer Bezahlversion von ChatGPT erstellt wurden, systematisch besser benotete als solche, die mit frei zugänglichen Modellen verfasst waren. Das stellt einen klaren Verstoß gegen den Anspruch auf Bildungsgerechtigkeit dar und verdeutlicht, dass Prüfungen nur dann fair sein können, wenn Transparenz über den KI-Einsatz besteht und keine ökonomischen oder gesellschaftlichen Hürden zu ungleichen Bewertungen führen.
Lösungsansätze: Prüfungen neu denken
Die aktuellen Entwicklungen sind eine Chance, Prüfungen grundlegend weiterzuentwickeln. Das derzeitige Bildungs- und Prüfsystem ist bereits viele Jahrzehnte alt und stößt an seine Grenzen: Verbote oder bloße Reglementierungen reichen nicht mehr aus, um mit digitalen Veränderungen Schritt zu halten. Deshalb ist es unabdingbar, Prüfungsformate und Methoden grundlegend zu verändern. Im Folgenden werden vier zentrale Ansätze vorgestellt, die als Leitlinien dienen können, wie Prüfungen neu gedacht und umgesetzt werden können:
- Projektbasiertes Lernen und Prüfen: Reale, komplexe Problemstellungen können im Mittelpunkt stehen. Projekte, die fachübergreifend angelegt sind, fördern Zusammenarbeit, Kreativität und Problemlösungskompetenz. In Prüfungen lassen sich so nicht nur Ergebnisse, sondern auch die Fähigkeit bewerten, Wissen in neuen Kontexten anzuwenden.
- Prozessorientiertes Prüfen: Prüfungen müssen den Lernprozess stärker einbeziehen. Feedback-Schleifen, Peer-Reviews (Begutachtungsprozess, bei dem Experten aus demselben Fachgebiet die Qualität, Methodik und Validität von Arbeiten oder Handlungen bewerten) oder Lernjournale eröffnen Einblicke in Denkwege und Strategien. Das Ergebnis zählt, aber ebenso die Entwicklung dahin. So wird sichtbar, welche Kompetenzen aufgebaut wurden, auch wenn das Endprodukt nicht perfekt ist.
- Integration von KI ins Prüfungssetting: Statt KI zu verbieten, könnte sie Teil der Prüfung sein. Lernende dürfen Tools nutzen – jedoch mit der Verpflichtung, den Einsatz offenzulegen und kritisch zu reflektieren. Prüfungen könnten so nicht nur den fachlichen Output bewerten, sondern auch den verantwortungsvollen und transparenten Umgang mit KI.
- Mündliche und kontextbezogene Prüfungen: Auch stärker mündlich geprägte Formate, Verteidigungen oder Präsentationen bieten Chancen. Sie ermöglichen Lernenden, ihre Arbeit zu erläutern und zu reflektieren. Aufgaben mit persönlichem oder regionalem Bezug können KI-Einsatz erschweren und zugleich authentische Lerngelegenheiten schaffen.
Perspektive: Prüfungen als Lerngelegenheiten
Wenn Prüfungen mehr sein sollen als reine Kontrolle, müssen sie stärker als Lerngelegenheiten verstanden und gestaltet werden. Sie sollten nicht in erster Linie Defizite aufzeigen, sondern vielmehr Lernfortschritte sichtbar machen und würdigen. So können Prüfungen zu Räumen werden, in denen Lernende Selbstwirksamkeit erfahren – weil sie ihre Fähigkeiten zeigen, reflektieren und weiterentwickeln können. Entscheidend ist dabei eine stärkere Betonung von Lernbegleitung und individuellen Lernwegen, statt am starren Format einer klassischen Abschlussarbeit festzuhalten.
Transferleistungen, mündliche Elemente und kontinuierliches Feedback müssen stärker in den Vordergrund treten. Das erfordert nicht nur neue Prüfungsauf-gaben, sondern auch strukturelle Veränderungen in den Bildungseinrichtungen. Anpassungen an Curricula, Prüfungsordnungen, Gruppengrößen, Personaldichte und rechtliche Rahmenbedingungen sind notwendig, um diese Transformation zu ermöglichen. Der Gewinn kann jedoch groß sein: Prüfungen werden zu Spiegeln des Lernens, die Lernende nicht klein machen, sondern sie stärken und motivieren. Gleichzeitig eröffnet die individuelle Begleitung des Lernweges durch KI das Potenzial, den Bildungsbereich sogar menschlicher zu gestalten – weil sie Freiräume für persönliche Zuwendung, passgenaues Feedback und individuelle Förderung schafft.
[1] Stone, A. (2022): Student Perceptions of Academic Integrity: A Qualitative Study of Understanding, Consequences, and Impact. Journal of Academic Ethics. Verfügbar unter: https://pmc.ncbi.nlm.nih.gov/articles/PMC9702763 [Zugriff: 19.09.2025].
[2] Coldwell, W. (2024): ‘I received a first but it felt tainted and undeserved’: inside the university AI cheating crisis. The Guardian. Verfügbar unter: https://www.theguardian.com/technology/2024/dec/15/i-received-a-first-but-it-felt-tainted-and-undeserved-inside-the-university-ai-cheating-crisis [Zugriff: 19.09.2025].
[3] Mühlhoff, R. & Henningsen, M. (2024): Chatbots im Schulunterricht!? media.ccc.de, 29.12.2024. Verfügbar unter: https://media.ccc.de/v/38c3-chatbots-im-schulunterricht [Stand: 19.09.2025].
von Tobias Albers-Heinemann & Lukas Spahlinger




