Skip to main content
Erschienen in: HMD Praxis der Wirtschaftsinformatik 2/2024

Open Access 29.02.2024 | Schwerpunkt

ChatGPT als Unterstützung von Lehrkräften – Einordnung, Analyse und Anwendungsbeispiele

verfasst von: Laura Hein, Malte Högemann, Katharina-Maria Illgen, Daniel Stattkus, Enrico Kochon, Maja-Gwendoline Reibold, Jannick Eckle, Lena Seiwert, Jan Heinrich Beinke, Julia Knopf, Oliver Thomas

Erschienen in: HMD Praxis der Wirtschaftsinformatik | Ausgabe 2/2024

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Seit seiner Veröffentlichung gewinnt das Large Language Model (Großes Sprachmodell) ChatGPT zunehmend an Bedeutung in der deutschen Bildungslandschaft. Während Schülerinnen und Schüler dieses Large Language Model bereits aktiv nutzen, herrscht unter Lehrkräften noch Uneinigkeit darüber, wie ChatGPT sie effektiv in ihrer alltäglichen Arbeit unterstützen kann. Mithilfe einer qualitativen Untersuchung werden verschiedene Aufgabenbereiche von Lehrkräften anhand konkreter Beispiele veranschaulicht und analysiert, wie ChatGPT in diesen Bereichen Unterstützung bieten kann – und in welchen der Einsatz von ChatGPT weniger geeignet ist. Durch das Large Language Model können Anregungen für alle identifizierten Aufgabenbereiche gegeben werden. Große Potenziale werden bei routinemäßigen Aufgaben, wie beispielsweise der schnellen Zusammenfassung von Informationen, gesehen. ChatGPT sollte eher nicht für pädagogische Aufgaben eingesetzt werden, wie z. B. die Arbeit mit herausforderndem Verhalten. Da Künstliche Intelligenz-basierte Tools wie ChatGPT in Zukunft voraussichtlich weiter an Bedeutung gewinnen werden, ist es notwendig, Lehrkräften eine konkrete Hilfestellung zur effektiven Nutzung dieser Tools zu geben. Dementsprechend wird in diesem Artikel ein Leitfaden hinsichtlich der Nutzung von ChatGPT im Unterricht durch Lehrkräfte bereitgestellt. Diese umfassen unter anderem die Bereiche Prompting, Interpretation, Reflexion und Datenschutz und liefern Lehrkräften so eine wertvolle Unterstützung bei dem Einsatz von ChatGPT.
Hinweise

Zusatzmaterial online

Zusätzliche Informationen sind in der Online-Version dieses Artikels (https://​doi.​org/​10.​1365/​s40702-024-01052-9) enthalten.

Hinweis des Verlags

Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.

1 Zwischen (Wirtschafts‑)Informatik und Didaktik: ChatGPT im Klassenzimmer

Mit der Veröffentlichung von ChatGPT, einem auf Künstlicher Intelligenz (KI) basierenden, großen Sprachmodell (Large Language Model; kurz: LLM) des US-amerikanischen Unternehmens OpenAI im November 2022, eröffneten sich eine Vielzahl neuer Möglichkeiten. ChatGPT ermöglicht Nutzenden eine interaktive und natürliche Kommunikation über textbasierte Nachrichten, die kaum von menschlich generierten Texten zu unterscheiden ist (MacNeil et al. 2022). Das LLM macht es möglich, natürlichsprachliche Fragen zu beantworten und Informationen bereitzustellen (Liu et al. 2021). Zahlreiche Schülerinnen und Schüler machen sich dies bereits zunutze und verwenden ChatGPT aktiv für verschiedene Aufgabenstellungen im Schulkontext. So gehen aktuelle Schätzungen davon aus, dass etwa 20 % von ihnen ChatGPT bereits als Informationsquelle, zur Erstellung und Übersetzung von Texten nutzen – aber nicht nur sie können von dem Tool profitieren (Füller 2023; SWK 2023). Bildungsexperten sehen viele Möglichkeiten (Unterrichtsplanung oder personalisierte bzw. differenzierte Erstellung von Tests und Unterrichtsmaterialien), wie Lehrkräfte ChatGPT nutzen können (Pölert 2023; SWK 2023). Thyssen (2023) und andere argumentieren, dass ChatGPT das Potenzial hat, im Bildungsbereich als wertvolles Werkzeug für Lehrkräfte eingesetzt zu werden, um deren Arbeitsbelastung zu reduzieren. So könnte es möglicherweise bei der Erstellung von Unterrichtsmaterialien oder der Entwicklung von Lerninhalten unterstützen. Darüber hinaus betonen Farrokhnia et al. (2023), dass ChatGPT nicht nur die Arbeitsbelastung der Lehrkräfte verringert, sondern auch den Zugang zu Informationen verbessert, und personalisiertes sowie komplexes Lernen erleichtert. Dadurch lassen sich wichtige Prozesse und Aufgaben effizienter gestalten.
In diesem Artikel wird das Potenzial von ChatGPT für den schulischen Bildungsbereich untersucht, wobei der Fokus auf der Entlastung und Unterstützung von Lehrkräften liegt. Dies ist insbesondere relevant, da durch mehrere Studien in verschiedenen Bundesländern festgestellt wurde, dass zwischen 53–59 % der Lehrkräfte Mehrarbeit leisten und bis zu 36 % der Befragten mehr als 48 Stunden Arbeitszeit pro Woche investieren (Mußmann et al. 2016; 2023; MK 2016). Vor allem unterrichtsnahe Lehrarbeit (Vor- und Nachbereitung, Korrekturen), Kommunikationsaufgaben (mit Erziehungsberechtigten, dem Kollegium, Schülerinnen und Schülern), sonstige organisatorische Aufgaben (Veranstaltungen, Arbeitsraum Schule) sowie persönliche Weiterbildung sind Faktoren, die Mehrarbeit notwendig machen (Mußmann et al. 2023). In weiteren Studien zeigt sich weiterhin, dass die Arbeit mit Erziehungsberechtigten und die Zunahme der pädagogischen Aufgaben besondere Belastungsfaktoren darstellen (Cordes et al. 2022). Mußmann et al. (2023) zeigen demnach, dass erhöhte Mehrarbeit bei Lehrkräften sowohl zu einer schlechteren Work-Life-Balance als auch zu einem erhöhten Burnout-Risiko führen kann. Um für Entlastung zu sorgen reduzieren 38 % der befragten Lehrkräfte den Aufwand für Vor- und Nachbereitung des Unterrichts. Dieser Artikel liefert hierzu einen Beitrag und evaluiert, ob eine zeit- und aufwandsparende Unterstützung für Lehrkräfte durch ChatGPT bestätigt werden kann. Aktuell herrscht bei Lehrkräften an Schulen noch kein Konsens darüber, ob und inwieweit ChatGPT in der Bildung unterstützen kann. Diese Studie greift diese Thematik auf und geht näher auf die potenziellen Chancen bzw. Nutzungsmöglichkeiten dieses LLMs ein und leistet damit einen wertvollen Beitrag zur Entlastung im Lehralltag. Darüber hinaus werden die konkreten Einsatzmöglichkeiten von ChatGPT in verschiedenen Aufgabenbereichen der Lehrkräfte an deutschen Schulen in der Sekundarstufe beleuchtet. Im Vordergrund des Beitrags steht daher die Forschungsfrage:
Welche Aufgabenbereiche von Lehrkräften können durch den Einsatz von ChatGPT unterstützt werden?
Vor diesem Hintergrund werden die Vor- und Nachteile sowie potenzielle Herausforderungen der Nutzung von ChatGPT diskutiert, um ein umfassendes Verständnis für den Einsatz dieser Technologie im schulischen Kontext zu erlangen. Chancen und Risiken einer solchen Nutzung sind sorgfältig abzuwägen, um sicherzustellen, dass Bildungsinhalte und Kompetenzen weiterhin angemessen vermittelt werden. Dabei ist es wichtig, die Grenzen von ChatGPT zu erkennen und kritisch zu hinterfragen. Die Datengewinnung zur Beantwortung der Forschungsfrage erfolgte in Form von semi-strukturierten Interviews mit verschiedenen Lehrkräften. Um alle Aufgabenbereiche der Lehrkräfte abzudecken (siehe Kap. 3), wurden diese zunächst auf Basis fachwissenschaftlicher Erkenntnisse erfasst und in Form von Anwendungsbeispielen in die Studie miteinbezogen. Anhand von diesen konkreten Anwendungsbeispielen war es den Lehrkräften möglich, die Szenarien individuell zu beurteilen und bewerten. Die resultierenden Ergebnisse der Interviews werden innerhalb dieser Studie zusammengefasst und diskutiert. Auch wird in diesem Rahmen ein Empfehlungsrahmen für Lehrkräfte zur Verfügung gestellt, der eine wertvolle Unterstützung bei dem Einsatz von ChatGPT liefern soll.

2 Wie Large Language Models den Bildungsbereich transformieren

LLMs sind eine Klasse von Deep-Learning-Modellen, die entwickelt wurden, um natürlichsprachliche Eingaben zu interpretieren und auf diese reagieren zu können, indem menschenähnliche Texte generiert und ausgegeben werden. Diese Modelle werden mit großen Mengen von Textdaten trainiert und sind in der Lage, das folgende Wort in einer Sequenz auf Grundlage vorausgegangener Wörter mit einer gewissen Wahrscheinlichkeit vorherzusagen. Diese Fähigkeit zur Vorhersage und Generierung von Texten hat dazu geführt, dass sie in verschiedenen Bereichen wie der Verarbeitung natürlicher Sprache, der maschinellen Übersetzung und dem kreativen Schreiben, eingesetzt werden (Kasneci 2023). LLMs arbeiten nach dem Prinzip der statistischen Sprachmodellierung: Sie nutzen eine als „Transformer-Architektur“ bekannte Methode, um die Beziehungen zwischen Wörtern in einer Sequenz zu erfassen – dabei wird auf Grundlage der Folge einer Eingabe diese in eine andere Folge (die Ausgabe) übersetzt (Vaswani et al. 2017). Die Generierung der Ausgabe wird durch die Parameter des Modells gesteuert, die während der Trainingsphase mit einem großen Textkorpus erlernt werden. Diese statistische Wahrscheinlichkeit führt dazu, dass LLMs historische Muster und Kontexte reproduzieren. Insbesondere größere Modelle sind anfällig für die Generierung von Plagiaten aus den Trainingsdaten (Lee et al. 2023). Ein weiteres Problem besteht in der Möglichkeit, dass LLMs gelernte Desinformationen oder aber nicht-jugendfreie Inhalte wiedergeben können (Weidinger et al. 2022), was besonders bei der Unterstützung von Bildungsprozessen bedenklich ist. Zuletzt können LLMs Stereotype und Vorurteile, die in den Trainingsdaten vorhanden sind, reproduzieren (Weidinger et al. 2022). Dies kann besonders im Bildungsbereich problematisch sein, da es hier notwendiger denn je ist, Stereotypen zu identifizieren und zu vermeiden, um so zu einem inklusiven Lernumfeld beizutragen (Göritz et al. 2022).
ChatGPT gehört zur GPT-Familie (Generative Pre-trained Transformer) von OpenAI und ist speziell für Konversationsdaten optimiert, um einen natürlichen Gesprächsverlauf zu ermöglichen. Im Bildungsbereich hat die statistische Reproduktion von Wissen durch ChatGPT zu einem tiefen und präzisen Wissensfundus für verbreitete Informationen geführt, da ChatGPT für diese besonders akkurat ist. Diese umfangreiche Wissensbasis, die allerdings nur bis zum Jahr 2021 reicht, hat es dem LLM beispielsweise ermöglicht, die „United States Medical Licensing Examination“ (Prüfung für Medizinabsolventen in den USA) erfolgreich zu bestehen (Kung et al. 2023). Darüber hinaus hat ChatGPT auch das Abitur in Bayern im zweiten Versuch bestanden (Gawlik und Schiffer 2023) oder in verschiedenen Sprachen, Sprachstile wie Gedichte oder Erörterungen imitiert (Albrecht 2023). Dieser Umstand zeigt, das ChatGPT in der Lage ist, mit Lehrmaterialien zu arbeiten und komplexes Wissen korrekt zu reproduzieren. Weitere wissenschaftliche Untersuchungen äußern Bedenken hinsichtlich der Vermittlung von Didaktik durch ChatGPT, wobei Aspekte wie Praktikabilität, Ethik, Transparenz, Datenschutz, Gleichheit und Wohlergehen thematisiert werden (Yan 2023). Ein spezifischer inhaltlicher Fokus liegt dabei auf der automatisierten Generierung von Aufgaben, wie beispielsweise Multiple-Choice-Fragen (Bitew et al. 2022) oder Programmierübungen (Sarsa et al. 2022; MacNeil et al. 2023). Innerhalb dieser Diskussionen wird betont, dass trotz der automatisierten Erstellung die Qualität der generierten Inhalte einer ständigen Kontrolle durch Fachkräfte unterliegen muss (Sarsa et al. 2022).

3 Aufgaben von Lehrkräften

Ausgehend von wissenschaftlicher Literatur und offiziellen Vorgaben der Kultusministerkonferenz (KMK) und des Niedersächsischen Kultusministeriums wurden Aufgabenbereiche von Lehrkräften an öffentlichen, allgemeinbildenden deutschen Schulen gesammelt. Anschließend wurden diese zu Aufgabenclustern zusammengefasst und nach Primär‑, Sekundär- und Tertiäraufgaben von Lehrkräften unterteilt und festgehalten. Als Primäraufgaben werden alle Aufgaben bezeichnet, die den täglichen Unterricht sowie dessen Vorbereitung, Durchführung und Nachbereitung betreffen (Böhm und Seichter 2022). Dazu gehören unter anderem die objektive Informationsbeschaffung sowie die Erstellung klarer und prägnanter Unterrichtsmaterialien (Schüpbach 2008; Wülser 2008). Im Beschluss der Kultusministerkonferenz zu den Standards in der Lehrerbildung wird die Kernaufgabe dabei als „gezielte und nach wissenschaftlichen Erkenntnissen gestaltete Planung, Organisation und Reflexion von Lehr- und Lernprozessen sowie ihre individuelle Bewertung und systemische Evaluation“ bezeichnet (KMK 2022). In einer Servicebroschüre des Niedersächsischen Kultusministeriums wird der direkte Unterricht ebenfalls als „Kerngeschäft der Lehrkräfte“ (MK 2022) beschrieben. Dabei werden diesem unter anderem die Aufgaben der Leistungsbewertung, schriftliche Arbeiten und die individuelle Lernentwicklung durch herausfordernde Lernsituationen zugewiesen.
Sekundäraufgaben hingegen zielen hauptsächlich darauf ab, soziale Aufgabenbereiche anzusprechen (Böhm und Seichter 2022). Dazu zählen beispielsweise die Beratung bei Problemen, die Reflexion von Lernergebnissen, der Umgang mit herausforderndem Verhalten sowie die Zusammenarbeit mit Erziehungsberechtigten (Schüpbach 2008; Wülser 2006, 2008). Die KMK (2022) hebt ebenfalls eine Erziehungs‑, Beurteilungs- und Beratungsaufgabe als zentralen Auftrag hervor: Die Arbeit mit Erziehungsberechtigten sowie hohe pädagogisch-psychologische und diagnostische Aufgaben stehen im Vordergrund. Die Zusammenarbeit mit Erziehungsberechtigten erfordert häufig Terminabstimmungen außerhalb der regulären Unterrichtszeiten (MK 2022). Darüber hinaus bestehen zunehmend Sprachbarrieren mit den Erziehungsberechtigten (MK 2022), die auch in der Zusammenarbeit mit den Schülerinnen und Schülern eine zentrale Rolle einnehmen. Lehrkräfte stehen somit als Ansprechpersonen für Schülerinnen und Schüler, Erziehungsberechtigte und außerschulische Akteurinnen und Akteure zur Verfügung (MK 2022). Schüpbach (2008) bezeichnet insbesondere Sekundäraufgaben als zusätzliche Belastung für Lehrkräfte, für die nur begrenzte zeitliche Kapazitäten und Ressourcen zur Verfügung stehen. Sie sind jedoch notwendig, um im deutschen Bildungssystem einen regulären Schul- und Unterrichtsbetrieb im Sinne der Primäraufgaben zu gewährleisten.1 Weitere von Lehrkräften wahrgenommene Belastungen im Bereich der Sekundäraufgaben sind die Planung, Vorbereitung und Durchführung von außerunterrichtlichen und außerschulischen Aktivitäten wie Klassenfahrten oder Schulfesten (Böhm und Seichter 2022; MK 2022). Daher wird neben der Evaluation des Einsatzes von ChatGPT bei Primäraufgaben auch eingehend evaluiert, ob der Einsatz eine zeitsparende Unterstützung bei Sekundäraufgaben bieten kann.
Neben den unterrichtsbezogenen, sozialen Aufgaben umfassen die Aufgabenbereiche von Lehrkräften am Arbeitsplatz Schule organisatorische und administrative Aufgaben (Krause et al. 2008); diese werden auch als Tertiäraufgaben bezeichnet (Nido 2011). Die KMK (2022) betrachtet die Kommunikation mit dem Kollegium und die Schulentwicklung als wichtige Aufgabenbereiche. Der Servicebroschüre des MK (2022) zufolge benötigen Lehrkräfte insbesondere zusätzliche zeitliche Ressourcen für die Schulentwicklung sowie für Termine in Form von Konferenzen oder Dienstbesprechungen. Darüber hinaus wird im Beschluss der KMK (2022) gefordert, dass Lehrkräfte ihre Lehrkompetenzen durch regelmäßige Fort- und Weiterbildungsangebote erweitern – auch außerhalb der regulären Unterrichtszeiten.
Anhand der Kriterien von Primär‑, Sekundär- und Tertiäraufgaben wurden in Abb. 1 insgesamt 27 einzelne und bereits aggregierte Aufgabenbereiche aus Fachliteratur und Vorgaben der Kultusministerien zu insgesamt 14 Aufgabenclustern aggregiert. Für diese wurden exemplarisch 17 Prompts (Anwendungsbeispiele) entwickelt, die abschließend in Form von Interviews mit Lehrkräften hinsichtlich ihrer Aufgabenerleichterung, Zeitersparnis, Umsetzbarkeit und Anwendungssicherheit im Schulkontext bewertet wurden.

4 Vorgehensweise

4.1 Prompt Engineering

Um die gewünschten Ergebnisse zu erziehen, wurde sich für die Methode des Prompt-Engineerings entschieden. Prompt-Engineering ist ein strukturierter Ansatz, der darauf abzielt, durch präzise Formulierungen das gewünschte Ergebnis direkt zu erhalten. Im Gegensatz hierzu steht der konversationsbasierte Ansatz, der durch iterative Anfragen in Form eines Dialogs das gewünschte Ergebnis schrittweise zu erreichen versucht (Mollick 2023). Um Ausgaben durch ChatGPT zu generieren, ist es zunächst notwendig, ein spezifisches, an die Zielgruppe der Lehrkräfte angepasstes, Prompt-Design zu erstellen. Das Prompt-Design stellt einen möglichen methodischen Ansatz dar, um gezielt Antworten eines LLMs zu induzieren. In einem ersten Schritt wurde das Ziel des Prompts als die Erzeugung einer eindeutigen Ausgabe definiert. Die Ziele gliedern sich, analog zu den Aufgabenclustern, in drei Hauptkategorien: Der ersten Kategorie sind Prompts zugeordnet, die das Ziel verfolgen, eine didaktisch strukturierte und angemessen aufbereitete Aufgabe oder Unterrichtsstunde zu erzeugen (Primäraufgabe). Die zweite Kategorie umfasst Prompts mit klarem pädagogischem Bezug (Sekundäraufgaben). Abschließend umfasst die dritte Kategorie Prompts mit organisatorischem Fokus, deren Hauptziel in der effizienten Unterstützung der Lehrkräfte bei organisatorischen und administrativen Angelegenheiten (Tertiäraufgaben) liegt. Die endgültige Prompt-Struktur gliedert sich in fünf Komponenten (Rolle, Kontext, Aufgabe, Restriktion, Ausgabeformat), die entweder integraler Bestandteil des Prompts sind oder optional hinzugefügt werden können. Im Folgenden werden die einzelnen Komponenten erläutert.
Rolle: Die Zuweisung einer spezifischen Rolle regt das Modell an, Informationen und Empfehlungen aus der Perspektive dieser Rolle zu generieren. Dies ermöglicht es, die Antwort präziser auf berufliche Umstände und Ziele zuzuschneiden.
Kontext (Optional): Der Kontext ermöglicht eine spezifische Anpassung der Modellausgabe an die Situation und Anforderungen der Nutzenden. Dies macht die Antworten relevanter, indem sie auf spezielle Bedarfe eingehen, im Gegensatz zu einer generischen, kontextlosen Antwort.
Aufgabe: Die Aufgabenstellung ist das Kernelement des Prompts und entscheidend für Ausrichtung und Relevanz. Eine präzise Aufgabenstellung erhöht die Wahrscheinlichkeit zielgerichteter und nützlicher Antworten, die spezifische Anforderungen und Bedarfe berücksichtigen, ein Prompt ohne Aufgabenstellung wird mit hoher Wahrscheinlichkeit ein gänzlich unbrauchbares Ergebnis liefern. Sie wirkt wie ein Filter, der den Antwortbereich eingrenzt und irrelevante Informationen ausschließt und das Modell so daran hindert, irrelevante oder unpassende Informationen in seine Antwort einzubeziehen.
Restriktion (Optional): Restriktionen beschränken die Antwort des LLMs auf das Wesentliche, führen zu präziseren und relevanteren Ausgaben und vermeiden überflüssigen Text. Sie werden verwendet, um unerwünschte Informationen, wie beispielsweise Relativierungen oder Einordnungen, auszuschließen und die Antwort fokussiert zu halten.
Ausgabeformat (Optional): Die Vorgabe eines spezifischen Formats definiert das gewünschte Ergebnis klar und vermeidet unerwünschte, zu detaillierte Antworten. Ein vorgegebenes Format strukturiert die Antwort des LLMs und verbessert so die Verständlichkeit und Organisation der gelieferten Informationen. Die Vorgabe eines Formats kann somit die Kommunikation zwischen dem Modell und den Nutzenden erheblich verbessern.
Die vorgeschlagene Prompt-Struktur basiert auf der Struktur von White et al. (2023). Wir vernachlässigen den Aspekt der Eingabesemantik, der darauf abzielt, eine spezielle Metasprache für die Kommunikation mit dem LLM zu entwickeln. Erfahrungsgemäß ist dies nicht notwendig bzw. führt dazu, dass ggf. technisch weniger versierten Lehrkräften die Kommunikation mit dem LLM eher erschwert. Da pro Arbeitsanweisung nur eine Anfrage an das LLM erfolgen soll, wird auch der Bestandteil der Interaktion vernachlässigt, die auf einer mehrstufigen Kommunikation zwischen dem LLM und dem Nutzenden basiert. Um die didaktische Qualität zu gewährleisten, wird auch das Element der Fehlererkennung durch das LLM ausgeschlossen, da die Kontrolle der Ausgabe den Lehrkräften obliegen soll. In der Struktur wird der Aspekt der Ausgabe-Anpassung in die Elemente Rolle, Aufgabe und Kontext unterteilt. Der Bestandteil der Prompt-Verbesserung wird in dem Prompt durch die Restriktionen und das Ausgabeformat erfüllt. Durch den Kontext wird schließlich der Aspekt der Kontextkontrolle abgedeckt. Die Instanziierung der definierten Bausteine wird im Folgenden anhand eines durchweg positiv bewerteten Beispiels (Abb. 2) veranschaulicht, dass auch Bestandteil der Interviews war (Prompt 8: Förderstatus).

4.2 Interviews

Um zu überprüfen, wie ChatGPT Lehrkräfte in ihrer täglichen Arbeit unterstützen kann, wurden qualitative Daten in Form von semi-strukturierten Interviews in dem Zeitraum 23.06.–17.07.2023 erhoben (siehe Online-Material Interviewleitfaden). Die Akquise der Lehrkräfte erfolgte über soziale Netzwerke wie LinkedIn und über die direkte Ansprache von Lehrkräften durch das Forschungsteam. Als Grundlage dessen dient der interpretativ-deduktive Ansatz von Benbasat et al. (1987), um Kontextinformationen aus den einzelnen Interviews herauszufiltern und eine allgemeingültige Aussage treffen zu können. Die Interviews dauerten zwischen 43 und 81 Minuten und folgten den Richtlinien von Myers und Newman (2007). Im Vorfeld erhielten die Lehrkräfte eine Datei mit 17 verschiedenen deutschsprachig, generierten Anwendungsbeispielen, die von den Versuchsleitenden mit Hilfe von ChatGPT auf Basis der aus der Fachliteratur abgeleiteten Aufgabenbereiche und schließlich der gebildeten Cluster generiert wurden (siehe Online-Material Anwendungsbeispiele). Anschließend erfolgte die Befragung der acht Lehrkräfte zu den verschiedenen Anwendungsbeispielen. Eine Übersicht der demografischen Daten ist Tab. 1 zu entnehmen. Da sich die Anwendungsbeispiele überwiegend auf eine 7. Klasse konzentrieren, wurden für die Interviews vorzugsweise Lehrkräfte ausgewählt, die u. a. diese Zielgruppe unterrichten. Das Durchschnittsalter (M= 37,63 Jahre) orientiert sich an aktuellen Zahlen, denn laut einer Umfrage des Statistischen Bundesamts (2023)waren die meisten Lehrkräfte im Schuljahr 2022/23 zwischen 35 und 39 Jahre alt. Alle Befragten kannten ChatGPT bereits vor dem Interview, allerdings hatten fünf von ihnen noch keine Erfahrung mit ChatGPT gesammelt, während die anderen drei Befragten ChatGPT bereits privat eingesetzt haben. Die Beispielszenarien bezogen sich auf verschiedene Schulfächer und Aufgaben, wie sie in deutschen Schulen vorzufinden sind, daher wurde zusätzlich darauf geachtet, Lehrkräfte zu befragen, die die abgebildeten Schulfächer unterrichten. Es gab keine Unterschiede bei der Bewertung der Anwendungsbeispiele in Hinblick auf die Vorerfahrung der Lehrkräfte. Die Information hierzu ist, aufgrund der kleinen Stichprobe, rein informativ und wird daher in den weiteren Ergebnissen nicht weiter berücksichtigt.
Tab. 1
Interviewte Lehrkräfte im Überblick
ID
Geschlecht
Alter
Schulform
Schulfächer
Erfahrungen mit ChatGPT
1
Weiblich
54
Realschule
Deutsch, Französisch
Ja
2
Weiblich
30
Gesamtschule
Englisch, Sport
Nein
3
Weiblich
40
Realschule
Mathe, Biologie, Physik, Chemie, Informatik
Nein
4
Männlich
29
Realschule
Religion, Geschichte, Englisch, Wirtschaft, Erdkunde, Politik
Ja
5
Weiblich
32
Realschule
Mathe, Religion
Nein
6
Weiblich
22
Realschule
Deutsch, Geschichte
Ja
7
Männlich
40
Oberschule
Mathe, Physik
Nein
8
Weiblich
54
Realschule
Physik, Chemie, Mathe, Informatik, Biologie
Nein

5 ChatGPT als Unterstützung von Lehrkräften

Der Großteil der Befragten würde ChatGPT, abhängig vom Anwendungsfall, in ihre tägliche Arbeit integrieren. Als Hauptgründe für die Nicht-Nutzung wurden die Komplexität der Unterrichtsinhalte bzw. der große Erfahrungsschatz der Lehrkräfte genannt. So betonte Lehrkraft 8, dass der Erfahrungsschatz der Lehrkräfte im komplexen System Schule sehr hoch sei, und es daher einfacher wäre, sich die Informationen selbst zu beschaffen, als ein System [wie ChatGPT] zu befragen. Darüber hinaus würden andere Unterstützungsmöglichkeiten genutzt werden: „Wenn, dann würde ich sowas […] wie Google benutzen […] ich habe da einfach nicht […] diesen Reiz, das zu nutzen“ (Interview 2). Alle befragten Lehrkräfte waren sich der potenziellen Risiken, wie z. B. der Unvollständigkeit der Ausgabe bei ungenauer Eingabe, im Umgang mit ChatGPT bewusst und setzen KI – wenn überhaupt – mit äußerster Vorsicht ein. Außerdem sei eine individuelle Anpassung und Überarbeitung bei der Nutzung immer wichtig. Darüber hinaus sei es für sie von großer Bedeutung, das Thema Datenschutz mit Sorgfalt zu behandeln: Es bedürfe besonderer Vorsicht im Umgang mit personenbezogenen Daten, weshalb diese in der Verwendung mit KI grundsätzlich zu vermeiden oder mindestens zu anonymisieren seien. Neben den genannten Risiken wurde auch erwähnt, dass Lehrkräfte „generell […] die Augen vor solchen Sachen nicht […] verschließen“ dürfen (Interview 2). Im Allgemeinen zeigte sich, dass alle teilnehmenden Lehrkräfte grundsätzlich neugierig gegenüber dem Einsatz von ChatGPT im Unterricht waren, aber auch eine gewisse Skepsis vorherrschte. Neben der Chance, neue Ideen zu sammeln – vor allem für Berufseinsteigende – und sich einen Überblick zu verschaffen, könne es auch eine organisatorische Entlastung sein und dabei helfen, über den eigenen Tellerrand hinauszuschauen, so heißt es.
Im Folgenden werden die Ergebnisse der 17 Anwendungsbeispiele, die verschiedene primäre, sekundäre und tertiäre Aufgaben von Lehrkräften an deutschen Schulen abbilden, näher dargestellt. Dazu wurden die Lehrkräfte nach ihrer individuellen Einschätzung der Anwendungskomplexität der einzelnen Beispiele sowie nach dem damit verbundenen Zeitaufwand befragt (siehe Online-Material Interviewleitfaden). Dafür wurden semantische Differentialen auf einer sechsstufigen Skala genutzt. Die beiden Skalen wurden wie folgt beschriftet: 1 Zeitaufwand bis 6 Zeitersparnis und 1 kompliziert bis 6 einfach. Die Ergebnisse werden in Abb. 3 dargestellt und basieren auf der Berechnung von Mittelwerten (siehe Online-Material Deskriptive Statistik). Daraus resultierend wurden vier Bereiche (Zeitfresser, Gewinner, Verlierer, Herausforderer) festgelegt.

5.1 Verlierer

Nicht alle Aufgaben sind für eine Unterstützung durch ChatGPT geeignet, das betrifft insbesondere die Beispiele 6, 11 (Sekundäraufgaben), 12 und 15 (Tertiäraufgaben) aus der Kategorie der Verlierer. Sie sind aufwendig in der Umsetzung mit ChatGPT und erfordern daher einen hohen Zeit- und Arbeitsaufwand.
In Bezug auf Beispiel 6 erwähnte unter anderem Lehrkraft 6, dass hinter sensiblen Themen, die das psychische Wohlbefinden der Schülerinnen und Schüler betreffen, immer viel mehr stecke, als dass ein Computer diese Fragen beantworten könne. „Und dass man da supervorsichtig sein sollte und nicht alles, was der [Computer] da angegeben hat […] umsetzen sollte, weil das viel zu kritisch sein könnte.“ Darüber hinaus wiesen die Lehrkräfte darauf hin, dass dieses Beispiel datenschutzrechtliche Risiken berge und immer individuell betrachtet werden müsse. Außerdem würden sie bei pädagogischen Aufgaben, wie z. B. der Arbeit mit herausforderndem Verhalten, eher auf Erfahrungswerte zurückgreifen und weniger LLMs nutzen.
Das Anwendungsbeispiel 11 wurde von den Lehrkräften als zu allgemein und offensichtlich gesehen. Der Handlungsbedarf setze viel früher an und würde tendenziell von einer Funktionsstelle oder der Berufsberatung übernommen. „das wird […] von einer Funktionsstelle mehr oder weniger […] der Berufsorientierung komplett abgedeckt. […] Aber natürlich kann es durchaus sinnvoll sein, gerade wenn es eben keine institutionalisierte Berufsorientierung an der Schule gibt“ (Interview 4).
Beispiel 12 wurde insgesamt am schlechtesten bewertet. Die Ausgabe zu diesem Beispiel sei laut der befragten Lehrkräfte sehr optimistisch gestaltet, da es viele rechtliche Probleme berge: Die Umsetzung der genannten Handlungspunkte würde sich in der Praxis als nicht realistisch erweisen, da u. a. das erforderliche, geschulte Personal dafür fehle und die Punkte aus dem Anwendungsbeispiel (z. B. Verfügbarkeit vielfältiger Lehr- und Lernmaterialen) zu oberflächlich und unspezifisch seien. So in Interview 1: „Optimistisch, dass man das in 10 kleinen Punkten hinkriegt. […], das können wir vergessen. […] hier geht es ja um Rechtssachen und darauf kann ich mich nicht verlassen.“ Darüber hinaus erwähnte Lehrkraft 2, dass es „unrealistisch [sei], alles umzusetzen […] was auf jeden Fall […] fehlt, ist [..] auch immer Personal, also wirklich die Leute zu haben. Aber es ist einfach ein generelles Problem.“
Beispiel 15 betrifft vor allem das erweiterte Arbeitsumfeld der Lehrkräfte und beinhaltet eine E‑Mail-Formulierung bei dem es um die Benotung eines Schülers/einer Schülerin geht. Die Besprechung der Note sei laut der Lehrkräfte etwas sehr Persönliches und müsse individueller formuliert werden, um besser auf die einzelnen Seiten eingehen zu können. So rät Lehrkraft 3 „eher dazu, den Telefonhörer wieder in die Hand zu nehmen“. Ergänzend heißt es in Interview 4 „Da geht […] zwischen Eltern und Lehrern […] eine ganze Menge Vertrauen flöten“ und weiter, wenn ein Brief nötig sei „dann möchte ich ihn auch selbst schreiben oder so formulieren, dass ich auf das Kind eingehe, auf die Eltern eingehe, vielleicht auch auf die Beschwerden eingehe.“

5.2 Zeitfresser

Die Beispiele 1, 5 (Primäraufgaben) und 10 (Tertiäraufgaben) der Kategorie Zeitfresser sind weniger komplex, erfordern aber ebenfalls einen hohen Zeitaufwand bei der Umsetzung mit ChatGPT und müssten laut der Lehrkräfte immer noch einmal überarbeitet werden.
In Beispiel 1 wird darauf hingewiesen: „Also ein pädagogischer, ein didaktischer Aspekt fehlt mir da […] total“ (Interview 4). Die Ausgaben müssten noch einmal komplett überarbeitet werden. Ähnlich verhält es sich mit Beispiel 5 „man kann nicht einfach sieben Punkte ausdrucken lassen und die dann wie so Schritte durchgehen und dann kommt man zum Ziel. Da braucht es halt einfach das pädagogische Fingerspitzengefühl“, so weiterhin in Interview 4. Dennoch waren sich die Lehrenden einig, dass gerade für Berufseinsteigende Listen, wie in Beispiel 5, eine gute Unterstützung liefern könnten.
Beispiel 10 betrifft, wie auch Beispiel 15, den Bereich der E‑Mail-Formulierungen zu verschiedenen schulischen Themen. Eine befragte Lehrkraft (Interview 3) äußerte Bedenken dabei, dass der von ChatGPT formulierte Brief für die Eltern unverständlich sein könnte. Die Verwendung von ChatGPT stelle daher in diesem Zusammenhang einen größeren Mehraufwand als Nutzen dar, da die E‑Mails überarbeitet werden müssten. Trotz alledem wurde das Beispiel für eine Unterstützung als hilfreich angesehen: „Die Grundidee: super. Ich arbeite an einer Schule, wo wir 27 Nationen unter einem Dach haben und wir ja auch ständig irgendwelche Übersetzer oder so haben“, heißt es (Interview 3).

5.3 Herausforderer

Eine Herausforderung seien die Beispiele 2 und 3 (Primäraufgaben) der Kategorie Herausforderer: Diese hätten einen geringen Zeitaufwand in der Umsetzung mit ChatGPT, seien aber sehr komplex in der Eingabe. Daher müsse bei diesen Beispielen immer ein kontrollierender Blick auf Eingabe und Ausgabe geworfen werden. Auch hier sei eine individuelle Anpassung an die Schülerschaft notwendig. Wichtig sei vor allem auch eine spezifischere Eingabe, damit die Operatoren (benennen, beschreiben, erklären, etc.) bzw. die damit verbundenen vorgegebenen Anforderungsbereiche (I bis III) in der von ChatGPT ausgegebenen Antwort (in der entsprechenden Reihenfolge) berücksichtigt werden können. So wurde in Interview 1 in Bezug auf Beispiel 2 geäußert, dass ChatGPT vorab keine inhaltlichen Erwartungen an die einzelnen Aufgaben stelle und die Charakterisierung der Aufgaben bereits einen Anforderungsbereich darstelle. Außerdem entspreche das Beispiel nicht den curricularen Vorgaben und erfülle nicht die Parameter, die alle berücksichtigt werden müssten.
Ähnlich verhielt es sich mit Beispiel 3. Hier hieß es: „Also da muss noch ein bisschen was reingesteckt [werden], denn da geht es um die Inhalte“ (Interview 8) oder weiter „das sind auch sehr viele Themen, die überhaupt mit reingebracht werden [müssen], da müsste man dem Programm glaub ich noch sehr viel sagen, dass er das wirklich anders machen müsste“ (Interview 5).

5.4 Gewinner

Die Beispiele 4 (Primäraufgaben), 7, 8, 9 als Teil der Sekundäraufgaben, sowie 13, 14, 16 und 17, die den Tertiäraufgaben zugeordnet sind, sind der Kategorie der Gewinner zugeordnet. Diese haben einen geringen Aufwand bei geringer Komplexität und können somit als Arbeitsentlastung und -unterstützung gesehen werden.
So könne ein Lehrplan in Listenform (Beispiel 4) hilfreich sein, um das Material zu strukturieren. Lehrkraft 2 formulierte es so: „Es macht […] auf jeden Fall Sinn. Wir haben auf einmal […] viel Material, und das muss irgendwie korrigiert werden […] du musst gucken, was willst du am Ende erreichen und arbeitest […] dann von hinten nach vorne und überlegst [eine] sinnvolle Struktur“. Trotzdem muss beachtet werden, dass der aufgeführte Lehrplan nicht vollständig übernommen werden könne: „Also man hat immer ein Lehrbuch und jede Einheit hat bestimmte Kompetenzen. Die würden hier schon mal fehlen.“ (Lehrkraft 3). Im Großen und Ganzen hieß es aber: „ich könnte mir da ein bisschen was von nehmen […] auch die Methoden, Aktivitäten […] als Ideensammlung super“ (Lehrkraft 3).
Das Ausgeben von niedrigschwelligen Listen oder Ablaufplänen zur Nachbereitung (7) oder Beispiel 14 können insbesondere für Berufseinsteigende, Quereinsteigende oder Lehramtsstudierende z. B. während eines Praktikums oder Lehrkräfte, die nicht täglich mit (Check)-Listen arbeiten, als Unterstützung dienen. Allerdings sei die Ausgabe sehr umfangreich und könne daher „auch ein bisschen reizüberflutend“ sein, „man muss [die Ausgabe] schon reduzieren, wenn man das jede Stunde machen würde […]“, so Interview 5.
Beispiel 8 sei „hilfreich für jemanden, der kein Förderschullehrer ist […]“ oder bisher wenig Erfahrung mit Förderbedarfen hat. Außerdem könne der Inhalt hilfreich sein, „um eben das Wissen wieder aufzufrischen“ (Lehrkraft 7). Allerdings solle die Liste nicht ausschließlich verwendet werden. Lehrkraft 1 machte jedoch auf eines aufmerksam: „Hörgeschädigte [sollten] nicht in Gruppenarbeit zusammenarbeiten“. Trotzdem würde sie teilweise mit einer solchen Liste arbeiten, jedoch nur als „Minimalstandard“.
Das Anwendungsbeispiel 9 wurde durchweg am besten bewertet: Die Arbeitserleichterung läge insbesondere darin, dass klare Schwerpunkte gesetzt werden können und schnell ein Orientierungsrahmen generiert werden könne, ohne die Notwendigkeit, Informationen über verschiedene Suchmaschinen zusammenzutragen. Besonders wichtig sei es, pädagogische Prinzipien zu beachten und den Plan individuell an die Interessen und Bedarfe der Schülerinnen und Schüler anzupassen.
Kontroverser waren die Meinungen der Lehrkräfte, wenn es um die Auflistung von Maßnahmen zur Konfliktbearbeitung (Beispiel 16) geht. Es „zeigt einen den Überblick, was man so machen muss. Aber […] im Großen und Ganzen ist vieles, was da steht, auch intuitiv in einer Lehrkraft drin, also das sollte es zumindest“ (Interview 7).
Einen themenspezifischen Workshop mithilfe von ChatGPT zu erstellen, z. B. über die Plattform TikTok (Beispiel 13), wurde von den Lehrkräften überwiegend als hilfreich bewertet. Lehrkraft 8 sprach davon, dass die generierte Ausgabe einfach an einen Kollegen weitergegeben werden könne. Dieses würde dann ausgedruckt und umgesetzt werden. Weiter heißt es in Interview 3: „Ich muss mir nichts großartig überlegen, ich muss vielleicht eine PowerPoint [zu den vorgebenden Inhalten] erstellen“. Auch Arbeitsblätter zum Arbeits- und Gesundheitsschutz in Schulen (17) ließen sich mit ChatGPT schnell erstellen.

6 Diskussion und Handlungsempfehlungen

Die Evaluation zeigt, dass ein sinnvoller Einsatz des LLM ChatGPT eine Chance sein kann, neue Ideen zu generieren oder nicht alltägliches Wissen aufzufrischen. Pädagogische Aufgabenstellungen, die einen zwischenmenschlichen Austausch erfordern, werden jedoch überwiegend als nicht geeignet angesehen, mit ChatGPT beantwortet bzw. bearbeitet zu werden. Große Skepsis besteht auch gegenüber Anwendungsbeispielen, die fachliche Inhalte generieren.
Generell besteht ein Risiko, wenn ChatGPT ohne kritische Reflexion der Ausgabe eingesetzt wird – die kritische Prüfung und Reflexion dessen ist daher grundlegend für den Einsatz im Bildungsbereich. Neben konversationsbasierten, iterativen Methoden, bei denen die Reflexion der Ergebnisse bereits unterstützt wird, kann weiterhin ein ausführliches und strukturiertes Prompting schneller zu verwertbaren Ergebnissen führen. Mollick (2023) kann beide Ansätze empfehlen: Der konversationsbasierte Ansatz ist intuitiv, liefert aber zum jetzigen Stand nicht die angestrebte Ergebnisqualität. Der strukturierte Ansatz liefert eine höhere Trefferquote, erfordert aber die Einhaltung der Grundstruktur. Diesbezüglich werden innerhalb dieser Studie fünf Komponenten (Rolle, Kontext, Aufgabe, Restriktion und Ausgabeformat) sowie mögliche weitere Faktoren zur erfolgreichen Umsetzung empfohlen. Dazu gehören nicht nur zielgerichtete Angaben, die die Lernenden und die Organisation betreffen, sondern auch die Berücksichtigung von Operatoren (z. B. benennen, beschreiben, erklären, etc.). Hier bleibt zu erwähnen, dass mit einer entsprechenden Weiterentwicklung der Technologie mögliche weitere Prompting-Strategien zur Anwendung kommen können – wie in jedem Fall ist auch hier immer eine kritische Reflexion der Ergebnisse die Voraussetzung. Dass das LLM in jedem Fall nur unter Vorbehalt eingesetzt werden sollte und dass jede KI-generierte Ressource kritisch zu bewerten ist, wird auch in den Arbeiten von Azaria et al. (2023) sowie von Cooper (2023) deutlich.
Weiterhin ist zu beachten, dass generative KI variieren kann: Ein in der Vergangenheit verwendeter Prompt kann bei erneuter Anwendung schlechtere oder bessere Ergebnisse liefern. Auch der datenschutzrechtliche Aspekt sei maßgeblich für den Einsatz von ChatGPT im Bildungskontext: Die Eingabe von personenbezogenen Daten muss unbedingt vermieden werden, stattdessen sollten Pseudonyme für die einzelnen Schülerinnen und Schüler verwendet werden. Zudem müssen sensible Daten wie Informationen über mögliche Leistungsdefizite oder den Förderstatus mit Vorsicht behandelt werden.
Gerade im Bereich der Sekundäraufgaben können schnell Listen erstellt werden, ohne, dass das Zusammentragen von Informationen und eine umfangreiche Suchmaschinenrecherche erfolgen muss. Es können auch Anregungen zur Unterrichtsreflexion gegeben werden: Es ist jedoch zu berücksichtigen, dass diese sehr individuell ist. In Bezug auf die Studie von Mußmann et al. (2023) zeigt sich, dass Aufgaben wie die Organisation von Veranstaltungen oder die Vor- und Nachbereitung des Unterrichts häufig zu Mehrarbeit führen. Daher könnte ChatGPT in diesen Bereichen eine zeitsparende Unterstützung bieten. Im Hinblick auf den steigenden Kommunikationsaufwand mit Erziehungsberechtigten, dem Kollegium sowie Schülerinnen und Schülern (Cordes et al. 2022; Mußmann et al. 2023) zeigte sich, dass das Schreiben von E‑Mails mit ChatGPT aus Sicht der Befragten nur bedingt eine Unterstützung sei und einer spezifischen Anleitung bedürfe. Für sie wäre es z. B. denkbar, E‑Mails in der Muttersprache vorzubereiten, um sie dann mit ChatGPT in die Zielsprache zu übersetzen. Durch entsprechendes Prompting können E‑Mails innerhalb eines passenden Kontexts sprachlich an die Adressaten und den eigenen Stil angepasst werden. Die Lehrkräfte hatten zum Zeitpunkt der Befragung unterschiedliche Erfahrungen mit ChatGPT gesammelt, teilten aber das Interesse an den Funktionsweisen des LLMs und an den Einsatzmöglichkeiten im Unterricht. Gleichzeitig war ihnen bewusst, dass ChatGPT in allen Bereichen – auch im Bildungsbereich – zunehmend an Bedeutung gewinnt. Während Schülerinnen und Schüler ChatGPT bereits vereinzelt für die Bearbeitung von Aufgaben nutzen, wird in den Interviews deutlich, dass Lehrkräfte die Anwendung noch nicht allzu häufig einsetzen und ihr gegenüber eher skeptisch sind. Es scheint, dass sich die Lehrkräfte zwar zunehmend mit ChatGPT beschäftigen, aber oft noch nicht genügend Erfahrungen sammeln konnten.

6.1 Handlungsempfehlungen für die Praxis

Basierend auf den Ergebnissen in Kap. 5 wird empfohlen, ChatGPT tendenziell für Anwendungsbeispiele einzusetzen, die der Kategorie „Gewinner“ zugeordnet sind, und eher Beispiele umzusetzen, die der Kategorie „Herausforderer“ und weniger der Kategorie „Zeitfresser“ zugeordnet sind. Für die Herausforderer ist der Zeitaufwand bei der Nutzung von ChatGPT sehr gering, sodass schnell neue Ideen präsentiert werden können. Der Einsatz von ChatGPT für die Aufgaben der Verlierer wird nicht empfohlen, da weder ein zeitlicher Mehrwert entsteht noch die Eingabe niederschwellig erfolgen kann.
Darüber hinaus lassen sich, basierend auf den Interviews, weitere Implikationen für die Lehrkräfte in ihrem Schulalltag ableiten, die in Abb. 4 zusammengefasst werden.
Es wird empfohlen, den Einsatz von ChatGPT individuell zu erproben, die Ergebnisse dann im Kollegium auszutauschen und schließlich den gemeinsamen Einsatz und die Diskussion mit den Schülerinnen und Schülern im Unterricht vorzunehmen. So heißt es in Interview 2, dass eine andere Lehrkraft das LLM bereits „versucht hat das mal einzubringen in ihrem Unterricht aber eher so, dass die Schülerinnen und Schüler das Ausprobieren und das mit ihren eigenen Texten vergleichen, […] dass sie eine Aufgabe bekommen, das Bearbeiten und dann […] die Schüler dafür zu sensibilisieren: Was kann dieses Programm? Was kann es nicht? Ist [es] sinnvoll und so weiter“.
Darüber hinaus ist der Wissensstand der Lehrkräfte über ChatGPT sehr unterschiedlich. Es bestehen zum Teil noch viele Unsicherheiten bei den Befragten, daher wird empfohlen, sich untereinander auszutauschen und voneinander zu lernen. Die gemeinsame Nutzung und Diskussion im Unterricht kann das Bewusstsein für ChatGPT bei Lehrenden und Lernenden stärken. Die kritische Auseinandersetzung mit dem LLM sollte frühzeitig erfolgen, damit die Lehrkräfte mit den Entwicklungen der Digitalisierung im Bildungsbereich und den Schülerinnen und Schülern mithalten können. Daher wird weiterhin empfohlen, dieses Thema in die Ausbildung zukünftiger Lehrkräfte zu integrieren. Qualifizierungsmaßnahmen für Studierende, Lehrende und pädagogisches Personal sollten angeboten werden, um über Chancen und Risiken aufzuklären und Hilfestellungen für den richtigen Einsatz zu geben, da mit dem Einsatz digitaler Innovationen auch neue Anforderungen an die Ausbildung des Personals einhergehen (Hüllmann et al. 2023).
Der Einsatz von ChatGPT sollte jedoch als Ergänzung gesehen werden, denn die Ergebnisse zeigen, dass es die Arbeit der Lehrenden nicht ersetzen kann, da die Kompetenzvermittlung eine Anpassung an die Lerngruppe und eine zwischenmenschliche Interaktion erfordert (siehe Kap. 5).
Bei der Prompt-Erstellung zeigte sich, dass ChatGPT nicht automatisch die Themen für spezifische Klassenstufen oder Bildungsformen filtern kann. Ein Beispiel ist die anfängliche Empfehlung, das Buch „Faust“ als Klassenarbeit für die 7. Klasse im Fach Deutsch zu verwenden, obwohl dies den curricularen Vorgaben von Niedersachsen (2016) für die gymnasiale Oberstufe entspricht. Kontextinformationen werden in dem Zusammenhang bisher unzureichend berücksichtigt und Hinweise darüber fehlen. Zudem können logische Fehler bei der Zuordnung von Schülergruppen (leistungsstarke vs. leistungsschwache) wie in Beispiel 1 auftreten. ChatGPT sollte nach Einschätzung der Lehrkräfte nicht in allen Bereichen eingesetzt werden – insbesondere bei schwerwiegenden Themen im psychologischen Bereich sollte auf professionelle Hilfe (z. B. Schulpsychologen) zurückgegriffen werden. Dies ergibt sich aus den Aussagen der befragten Lehrkräfte, die darauf hinweisen, dass Lehrkräfte möglicherweise an ihre Grenzen stoßen können.

6.2 Limitationen

Wie alle Studien hat auch diese ihre Limitationen. Kritisch zu betrachten ist zum einen, dass die Anwendungsbeispiele im Vorfeld von der Forschungsgruppe auf Basis von Literaturrecherchen entwickelt und den Lehrkräften präsentiert wurden. Die Eingabe eines umfangreichen, korrekten Prompts erfordert nicht nur technisches Know-How in Bezug auf LLMs, sondern auch ein umfassendes Verständnis für den Berufsalltag der Lehrkräfte, das über die Literaturrecherche hinausgeht. Dies wurde durch die Einbeziehung von Didaktikern und Didaktikerinnen aus dem Forschendenteam versucht abzudecken. Zum anderen sollte in Zukunft auf eine repräsentativere Zusammensetzung der befragten Lehrkräfte geachtet werden, sodass Lehrkräfte verschiedener Schulformen gleichermaßen abgebildet werden. Darüber hinaus wurden quantitative Fragen in den Leitfragebogen der Interviews aufgenommen – hier ist es in Bezug auf allgemeingültige Aussagen für weitere Forschungsarbeiten empfehlenswert, die Stichprobengröße zu erhöhen. Der Umfang der Anwendungsbeispiele ergibt sich aus den Aufgabenclustern, die von den Forschenden aus den Aufgabenbereichen zusammengefasst wurden. Um ein noch umfassenderes Ergebnis zu erzielen, sollte diese Zusammenfassung in zukünftigen Arbeiten weiterentwickelt werden. Darüber hinaus wurde nicht explizit untersucht, ob bei den Lehrkräften eventuell generelle Unsicherheiten gegenüber neuen Technologien, bzw. explizit gegenüber ChatGPT, bestehen. Gerade unter dem Aspekt, dass mit dem Einsatz von LLMs Veränderungen im Bildungssektor einhergehen können und eine Reaktanz bei den Lehrkräften nicht auszuschließen ist, sollten potenzielle Störfaktoren ausgeschlossen werden.

6.3 Fazit und Ausblick

Es wird festgehalten, dass das LLM ChatGPT zwar über ein breites Wissensspektrum verfügt, aber den menschlichen Aspekt des Lehrens und Lernens nicht vollständig ersetzen kann – insbesondere, wenn man bedenkt, dass die in unserer Studie verwendete Version nur eine Datenbasis bis 2021 hat. Dennoch werden ChatGPT und andere LLMs in Zukunft eine immer wichtigere Rolle im Bildungsbereich spielen. Gerade im Zuge der stetigen Weiterentwicklung ist zu erwarten, dass diese immer besser werden und in naher Zukunft zusätzliche Funktionen zur Verfügung stehen werden. Zum Zeitpunkt der Erstellung dieser Studie ist bereits die Generierung von Bildern mit ChatGPT möglich. Unter Berücksichtigung dieser Updates sind die Ergebnisse nur bis zum jetzigen Zeitpunkt gültig, sodass aufgrund der Dynamik das Thema weiter erforscht werden muss. Darüber hinaus liefern LLMs einen Mehrwert hinsichtlich Strukturierung, Gliederung, frühe Phasen der Texterstellung, aber: Der Einsatz von ChatGPT verleitet zur Trivialisierung von Lehr- und Lernformaten. Dies muss auch bei der (digitalen) Vorbereitung von (digitalgestütztem) Unterricht berücksichtigt werden. Somit ist die frühzeitige Auseinandersetzung von Lehrkräften und angehenden Lehrkräften mit derartigen LLM- und KI-Funktionen von entscheidender Bedeutung, um den Anschluss an die Technologie und Digitalisierung in der deutschen Bildungslandschaft nicht zu verpassen, denn, wie sich auch in dieser Studie gezeigt hat: Die Lehrkräfte sind neugierig auf die Arbeit mit ChatGPT, wissen aber noch zu wenig, ob und wie sie das LLM in ihren Unterricht integrieren können. Weitere Forschung sollte mögliche Wissenslücken im Bildungsbereich aufdecken, um diese schnellstmöglich zu schließen. Darüber hinaus sollte erforscht werden, inwieweit generative KI die Erstellung von Bildern für den Unterrichtsalltag unterstützen kann. Zudem sollte in zukünftigen Arbeiten unbedingt die Reaktanz bzw. Unsicherheit gegenüber neuen Technologien berücksichtigt werden, um weitere potenzielle Störfaktoren ausschließen zu können. Die Studie betrachtet die Seite der Lehrenden, eine weitere Betrachtung der Perspektive der Lernenden wäre ebenfalls interessant und sollte in weiteren Arbeiten untersucht werden.
Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.
Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen.
Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://​creativecommons.​org/​licenses/​by/​4.​0/​deed.​de.

Hinweis des Verlags

Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.

Unsere Produktempfehlungen

HMD Praxis der Wirtschaftsinformatik

HMD liefert IT-Fach- und Führungskräften Lösungsideen für ihre Probleme, zeigt ihnen Umsetzungsmöglichkeiten auf und informiert sie über Neues in der Wirtschaftsinformatik (WI).

Fußnoten
1
Dass diese beschriebenen Sekundäraufgaben nicht immer Aufgabe der Lehrkräfte sein müssen, beweisen anderen Bildungssysteme: In Frankreich beispielsweise obliegt die pädagogische Betreuung der Lernenden, die Kommunikation mit den Erziehungsberechtigten, die Organisation des Schullebens, etc. pädagogischen Beratenden, den sogenannten „Conseillers Principaux d’Éducation“ (kurz: CPE) (Montandon und Brégeon 2021).
 
Literatur
Zurück zum Zitat Albrecht, S. (2023). ChatGPT und andere Computermodelle zur Sprachverarbeitung – Grundlagen, Anwendungspotenziale und mögliche Auswirkungen. Büro für Technikfolgen-Abschätzung beim Deutschen Bundestag (TAB). Albrecht, S. (2023). ChatGPT und andere Computermodelle zur Sprachverarbeitung – Grundlagen, Anwendungspotenziale und mögliche Auswirkungen. Büro für Technikfolgen-Abschätzung beim Deutschen Bundestag (TAB).
Zurück zum Zitat Böhm, W. & Seichter, S. (2022). Wörterbuch der Pädagogik. Brill, Schöningh, Paderborn.CrossRef Böhm, W. & Seichter, S. (2022). Wörterbuch der Pädagogik. Brill, Schöningh, Paderborn.CrossRef
Zurück zum Zitat Cordes, M., Hurrelmann, K. & Tüysüz, S. (2022). Wie belastet sind die Lehrkräfte in Berlin? Eine Studie zur Arbeitssituation und zum Bedarf an professioneller Unterstützung. Forschungsinstitut für Bildungs- und Sozialökonomie (FiBS), Berlin. Cordes, M., Hurrelmann, K. & Tüysüz, S. (2022). Wie belastet sind die Lehrkräfte in Berlin? Eine Studie zur Arbeitssituation und zum Bedarf an professioneller Unterstützung. Forschungsinstitut für Bildungs- und Sozialökonomie (FiBS), Berlin.
Zurück zum Zitat Hüllmann, J. A. et al. (2023). Digital transformation in automotive: drivers of effective sales behaviors during servitization at a German car manufacturer. In: Proceedings of the 31st European Conference on Information Systems. 13. (https://aisel.aisnet.org/ecis2023rip/13) Hüllmann, J. A. et al. (2023). Digital transformation in automotive: drivers of effective sales behaviors during servitization at a German car manufacturer. In: Proceedings of the 31st European Conference on Information Systems. 13. (https://​aisel.​aisnet.​org/​ecis2023rip/​13)
Zurück zum Zitat Kiper, H. & Mischke, W. (2009). Unterrichtsplanung. Beltz, Weinheim, Basel. Kiper, H. & Mischke, W. (2009). Unterrichtsplanung. Beltz, Weinheim, Basel.
Zurück zum Zitat Krause, A., Bäuerle, F. & Dorsemagen, C. (2008). RHIA-Unterricht: Psychische Belastungen erfassen und reduzieren. In: Krause, A., Schüpbach, H., Ulich, E., Wülser, M. (Hrsg.), Arbeitsort Schule: Organisations- und arbeitspsychologische Perspektiven. Gabler, Wiesbaden, S 77–99. https://doi.org/10.1007/978-3-8349-9551-3_3CrossRef Krause, A., Bäuerle, F. & Dorsemagen, C. (2008). RHIA-Unterricht: Psychische Belastungen erfassen und reduzieren. In: Krause, A., Schüpbach, H., Ulich, E., Wülser, M. (Hrsg.), Arbeitsort Schule: Organisations- und arbeitspsychologische Perspektiven. Gabler, Wiesbaden, S 77–99. https://​doi.​org/​10.​1007/​978-3-8349-9551-3_​3CrossRef
Zurück zum Zitat Meyer, H. (2021). Was ist guter Unterricht? 15. Aufl. Cornelsen, Berlin. Meyer, H. (2021). Was ist guter Unterricht? 15. Aufl. Cornelsen, Berlin.
Zurück zum Zitat MK – Niedersächsisches Kultusministerium (2018). Empfehlungen zur Entwicklung arbeitszeitrechtlicher Normen für Lehrerinnen und Lehrer sowie Schulleitungen an niedersächsischen Schulen: Bericht des Expertengremiums Arbeitszeitanalyse. MK – Niedersächsisches Kultusministerium, Hannover. MK – Niedersächsisches Kultusministerium (2018). Empfehlungen zur Entwicklung arbeitszeitrechtlicher Normen für Lehrerinnen und Lehrer sowie Schulleitungen an niedersächsischen Schulen: Bericht des Expertengremiums Arbeitszeitanalyse. MK – Niedersächsisches Kultusministerium, Hannover.
Zurück zum Zitat Montandon, C. & Brégeon, M. (2021). Rekrutierung, Qualifizierung, Status und Karriereoptionen von Schulleiter*innen staatlicher Sekundarschulen in Frankreich. In DDS – Die Deutsche Schule 113(2): 161–173. Montandon, C. & Brégeon, M. (2021). Rekrutierung, Qualifizierung, Status und Karriereoptionen von Schulleiter*innen staatlicher Sekundarschulen in Frankreich. In DDS – Die Deutsche Schule 113(2): 161–173.
Zurück zum Zitat Mußmann, F., Hardwig, T. & Riethmüller, M. (2016). Niedersächsische Arbeitszeitstudie Lehrkräfte an öffentlichen Schulen 2015/2016. Kooperationsstelle Hochschulen und Gewerkschaften, Göttingen. Mußmann, F., Hardwig, T. & Riethmüller, M. (2016). Niedersächsische Arbeitszeitstudie Lehrkräfte an öffentlichen Schulen 2015/2016. Kooperationsstelle Hochschulen und Gewerkschaften, Göttingen.
Zurück zum Zitat Mußmann, F., Hardwig, T. & Riethmüller, M. (2023). Arbeitszeit und Arbeitsbelastung von Lehrkräften an Schulen in Sachsen 2022. Kooperationsstelle Hochschulen und Gewerkschaften, Göttingen. Mußmann, F., Hardwig, T. & Riethmüller, M. (2023). Arbeitszeit und Arbeitsbelastung von Lehrkräften an Schulen in Sachsen 2022. Kooperationsstelle Hochschulen und Gewerkschaften, Göttingen.
Zurück zum Zitat Nido, M. (2011). Das Engagement von Lehrpersonen: gesund und arbeitsfreudig oder ausgebrannt und reformmüde? – Verschiedene Engagement-Typen und ihr Zusammenhang mit Arbeitsbedingungen, Personen- und Schuldmerkmalen. Universität Zürich, Zürich (Dissertation). Nido, M. (2011). Das Engagement von Lehrpersonen: gesund und arbeitsfreudig oder ausgebrannt und reformmüde? – Verschiedene Engagement-Typen und ihr Zusammenhang mit Arbeitsbedingungen, Personen- und Schuldmerkmalen. Universität Zürich, Zürich (Dissertation).
Zurück zum Zitat Rothland, M. (2013). Beruf: Lehrer/Lehrerin – Arbeitsplatz: Schule: Charakteristika der Arbeitstätigkeit und Bedingungen der Berufssituation. In: Rothland, M. (Hrsg.) Belastung und Beanspruchung im Lehrerberuf – Modelle, Befunde, Interventionen, 2. Aufl. Springer VS, Wiesbaden, S 21–39. https://doi.org/10.1007/978-3-531-18990-1CrossRef Rothland, M. (2013). Beruf: Lehrer/Lehrerin – Arbeitsplatz: Schule: Charakteristika der Arbeitstätigkeit und Bedingungen der Berufssituation. In: Rothland, M. (Hrsg.) Belastung und Beanspruchung im Lehrerberuf – Modelle, Befunde, Interventionen, 2. Aufl. Springer VS, Wiesbaden, S 21–39. https://​doi.​org/​10.​1007/​978-3-531-18990-1CrossRef
Zurück zum Zitat Sarsa, S. et al. (2022). Automatic generation of programming exercises and code explanations using large language models. In: Proceedings of the 2022 ACM Conference on International Computing Education Research, Bd. 1, S 27–43. https://doi.org/10.1145/3501385.3543957 Sarsa, S. et al. (2022). Automatic generation of programming exercises and code explanations using large language models. In: Proceedings of the 2022 ACM Conference on International Computing Education Research, Bd. 1, S 27–43. https://​doi.​org/​10.​1145/​3501385.​3543957
Zurück zum Zitat Ständige Wissenschaftliche Kommission der Kultusministerkonferenz (SWK) (2023). Large Language Models und ihre Potenziale im Bildungssystem. Impulspapier der Ständigen Wissenschaftlichen Kommission (SWK) der Kultusministerkonferenz. https://doi.org/10.25656/01:28303CrossRef Ständige Wissenschaftliche Kommission der Kultusministerkonferenz (SWK) (2023). Large Language Models und ihre Potenziale im Bildungssystem. Impulspapier der Ständigen Wissenschaftlichen Kommission (SWK) der Kultusministerkonferenz. https://​doi.​org/​10.​25656/​01:​28303CrossRef
Zurück zum Zitat Weidinger, L. et al. (2022). Taxonomy of risks posed by language models. In: Proceedings of the 2022 ACM conference on fairness, accountability, and transparency, S 214–229.CrossRef Weidinger, L. et al. (2022). Taxonomy of risks posed by language models. In: Proceedings of the 2022 ACM conference on fairness, accountability, and transparency, S 214–229.CrossRef
Zurück zum Zitat Wülser, M. (2006). Fehlbeanspruchung bei personenbezogenen Dienstleistungstätigkeiten – Eine Mehr-Stichprobenanalyse zur Entstehung von emotionaler Erschöpfung, Aversionsgefühlen und Distanzierung sowie eine vertiefte Betrachtung der Lehrkräftetätigkeit. Universität Potsdam, Potsdam (Dissertation). Wülser, M. (2006). Fehlbeanspruchung bei personenbezogenen Dienstleistungstätigkeiten – Eine Mehr-Stichprobenanalyse zur Entstehung von emotionaler Erschöpfung, Aversionsgefühlen und Distanzierung sowie eine vertiefte Betrachtung der Lehrkräftetätigkeit. Universität Potsdam, Potsdam (Dissertation).
Zurück zum Zitat Göritz, L., Stattkus, D., Beinke, J. H., & Thomas, O. (2022). To Reduce Bias, You Must Identify It First! Towards Automated Gender Bias Detection. Göritz, L., Stattkus, D., Beinke, J. H., & Thomas, O. (2022). To Reduce Bias, You Must Identify It First! Towards Automated Gender Bias Detection.
Metadaten
Titel
ChatGPT als Unterstützung von Lehrkräften – Einordnung, Analyse und Anwendungsbeispiele
verfasst von
Laura Hein
Malte Högemann
Katharina-Maria Illgen
Daniel Stattkus
Enrico Kochon
Maja-Gwendoline Reibold
Jannick Eckle
Lena Seiwert
Jan Heinrich Beinke
Julia Knopf
Oliver Thomas
Publikationsdatum
29.02.2024
Verlag
Springer Fachmedien Wiesbaden
Erschienen in
HMD Praxis der Wirtschaftsinformatik / Ausgabe 2/2024
Print ISSN: 1436-3011
Elektronische ISSN: 2198-2775
DOI
https://doi.org/10.1365/s40702-024-01052-9

Weitere Artikel der Ausgabe 2/2024

HMD Praxis der Wirtschaftsinformatik 2/2024 Zur Ausgabe

Premium Partner