The issues with data
1 2023-01-04T08:48:01+00:00 Jotsna Iyer 4f2bfb514a09301de0e5275ee45bf5db41479839 10 1 plain 2023-01-04T08:48:01+00:00 Jotsna Iyer 4f2bfb514a09301de0e5275ee45bf5db41479839This page is referenced by:
-
1
2023-01-04T08:48:01+00:00
AI Speak: Datenbasierte Systeme — Teil 1
6
plain
2023-12-29T07:56:50+00:00
Entscheidungen im Klassenzimmer
Als Lehrkraft haben Sie Zugang zu vielen Arten von Daten. Dabei kann es sich um greifbare Daten wie Anwesenheits- und Leistungsnachweise handeln oder um nicht greifbare Daten wie die Körpersprache der Schülerinnen und Schüler. Denken Sie an einige der Entscheidungen, die Sie in Ihrem Berufsleben treffen: Welche Daten helfen Ihnen, diese Entscheidungen zu treffen?
Es gibt technologische Anwendungen, die Ihnen helfen können, Daten zu visualisieren oder zu verarbeiten. Systeme mit künstlicher Intelligenz nutzen Daten, um das Lernen zu personalisieren, Vorhersagen zu treffen und Entscheidungen zu treffen, die Ihnen beim Unterrichten und bei der Verwaltung des Klassenzimmers helfen könnten: Haben Sie Bedürfnisse, die die Technologie erfüllen kann? Wenn ja, welche Daten würde ein solches System benötigen, um die Aufgabe zu erfüllen?
Bildungssysteme haben schon immer Daten generiert: persönliche Daten der Schülerinnen und Schülerinnen und Schüler, akademische Aufzeichnungen, Anwesenheitsdaten und mehr. Mit der Digitalisierung und den KIED-Anwendungen werden immer mehr Daten aufgezeichnet und gespeichert: Mausklicks, geöffnete Seiten, Zeitstempel und Tastaturanschläge.1 Da datengetriebenes Denken in der Gesellschaft zur Norm geworden ist, stellt sich natürlich die Frage, wie all diese Daten verarbeitet werden können, um etwas Sinnvolles zu tun: Könnten wir Lernenden ein individuelleres Feedback geben? Könnten wir bessere Visualisierungs- und Benachrichtigungstools für Lehrkräfte entwickeln?2
Welche Technologie auch immer eingesetzt wird, sie muss einem echten Bedarf im Klassenzimmer entsprechen. Nachdem der Bedarf ermittelt wurde, können wir uns die verfügbaren Daten ansehen und fragen, was für ein gewünschtes Ergebnis relevant ist. Dabei geht es darum, Faktoren aufzudecken, die es pädagogischen Fachkräften ermöglichen, nuancierte Entscheidungen zu treffen. Können diese Faktoren mit den verfügbaren Daten erfasst werden? Sind Daten und datenbasierte Systeme der beste Weg, um den Bedarf zu decken? Welche unbeabsichtigten Folgen könnte die Verwendung von Daten auf diese Weise haben? 3
Maschinelles Lernen ermöglicht es uns, viele dieser Fragen auf die Daten selbst zu verschieben.4 ML-Anwendungen werden auf Daten trainiert. Sie funktionieren, indem sie mit Daten arbeiten. Sie finden Muster und machen Verallgemeinerungen und speichern diese als Modelle - Daten, die zur Beantwortung zukünftiger Fragen verwendet werden können.4 Ihre Entscheidungen und Vorhersagen und wie diese das Lernen der Schülerinnen und Schüler beeinflussen, sind ebenfalls Daten. Daher ist das Wissen darüber, wie Programmierende, die Maschine und die Nutzenden mit Daten umgehen, ein wichtiger Teil des Verständnisses, wie künstliche Intelligenz funktioniert.Über Daten
Daten beziehen sich im Allgemeinen auf eine Entität der realen Welt, d.h. eine Person, ein Objekt oder ein Ereignis. Jede Entität kann durch eine Reihe von Attributen (Merkmale oder Variablen) beschrieben werden.5 Beispielsweise sind Name, Alter und Klasse einige Attribute eines Lernenden. Die Menge dieser Attribute sind die Daten, die wir über den Lernenden haben, die zwar in keiner Weise mit der realen Person übereinstimmen, uns aber dennoch etwas über sie sagen. Daten, die im Bildungssystem gesammelt, verwendet und verarbeitet werden, nennt man Bildungsdaten.1
Ein Datensatz besteht aus Daten einer Sammlung von Entitäten, die in Zeilen und Spalten angeordnet sind. Die Anwesenheitsliste einer Klasse ist ein Datensatz. Jede Zeile ist der Datensatz einer Schülerin oder eines Schülers. Die Spalten können die An- oder Abwesenheit an einem bestimmten Tag oder in einer bestimmten Sitzung darstellen. Jede Spalte ist also ein Attribut.
Daten werden erstellt, indem man Attribute auswählt und sie misst: Jeder Teil der Daten ist das Ergebnis menschlicher Entscheidungen und Wahlmöglichkeiten. Daher ist die Datenerstellung ein subjektiver, partieller und unübersichtlicher Prozess, der mit technischen Schwierigkeiten verbunden ist.4, 5 Außerdem kann das, was wir messen und was wir nicht messen, einen großen Einfluss auf die erwarteten Ergebnisse haben.
Datenspuren sind Aufzeichnungen von Schüleraktivitäten, wie zum Beispiel Mausklicks, Daten über geöffnete Seiten, das Timing von Interaktionen oder Tastendrücke in einem digitalen System.1 Metadaten, das sind Daten, die andere Daten beschreiben.5 Abgeleitete Daten sind Daten, die aus anderen Daten berechnet oder abgeleitet werden: Die individuellen Noten einer jeden Schülerin oder eines jeden Schülers sind Daten. Klassendurchschnitte sind abgeleitete Daten. Abgeleitete Daten sind oft nützlicher, wenn es darum geht, nützliche Erkenntnisse zu gewinnen, Muster zu erkennen und Vorhersagen zu treffen. Anwendungen für maschinelles Lernen können abgeleitete Daten erstellen und sie mit Metadaten verknüpfen, um detaillierte Lernmodelle zu erstellen, die bei der Personalisierung des Lernens helfen.1
Damit eine datenbasierte Anwendung erfolgreich ist, sollten die Attribute sorgfältig ausgewählt und korrekt gemessen werden. Die in ihnen entdeckten Muster sollten daraufhin überprüft werden, ob sie im pädagogischen Kontext Sinn ergeben. Wenn sie richtig konzipiert und gepflegt werden, können datengesteuerte Systeme sehr wertvoll sein.
Ziel dieses Kapitels ist es, einige Grundlagen zu Daten und datengestützter Technologie zu vermitteln. Datenkompetenz ist insgesamt eine sehr wichtige Fähigkeit, die man besitzen sollte und die eine engagierte Ausbildung und kontinuierliche Unterstützung und Auffrischung verdient.1
Grundlegende Gesetzgebung
Aufgrund der drastisch gesunkenen Kosten für die Datenspeicherung werden mehr Daten und Metadaten gespeichert und länger aufbewahrt.6 Das kann zu Datenschutz- und Rechtsverletzungen führen. Gesetze, wie die Datenschutz-Grundverordnung (DSGVO), raten von solchen Praktiken ab und geben der EU-Bürgerschaft mehr Kontrolle über ihre persönlichen Daten. Sie geben rechtlich durchsetzbare Datenschutzbestimmungen für alle EU-Mitgliedstaaten vor.
Nach der DSGVO sind personenbezogene Daten alle Informationen, die sich auf eine identifizierte oder identifizierbare Person (data subject) beziehen. Schulen arbeiten nicht nur mit Unternehmen zusammen, die ihre Daten verarbeiten, sondern sie speichern auch große Mengen an persönlichen Daten über Schülerinnen und Schüler, Eltern, Personal, Management und Lieferanten. Als für die Datenverarbeitung Verantwortliche sind sie verpflichtet, die von ihnen verarbeiteten Daten vertraulich und sicher zu speichern und über Verfahren zum Schutz und zur ordnungsgemäßen Verwendung aller personenbezogenen Daten zu verfügen.1
Zu den durch die DSGVO festgelegten Rechten für die Bürgerinnen und Bürger gehören:- Das Recht auf Auskunft, das es zwingend vorschreibt, dass sie (einfach) erfahren können, welche Daten über sie gesammelt werden
- Das Recht auf Information über die Verwendung der Daten
- Das Recht auf Löschung, das es ermöglicht zu verlangen, dass Daten, die von einer Plattform erfasst wurden, aus dem von der Plattform erstellten Datensatz (der möglicherweise an andere verkauft wird) entfernt werden
- Das Recht auf Erklärung, bei dem Erklärungen gegeben werden sollten, wann immer sie Klarheit über automatisierte Entscheidungsprozesse benötigen, die sie betreffen
Bei GDPR für Dummies finden Sie die Analyse unabhängiger Experten der Civil Liberties Union for Europe (Liberties), die die Menschenrechte aller Bürgerinnen und Bürger in der Europäischen Union schützt.
------------------------------------------------------------------------------------------------------
1 Ethical guidelines on the use of artificial intelligence and data in teaching and learning for educators, European Commission, October 2022
2 du Boulay, B., Poulovasillis, A., Holmes, W., Mavrikis, M., Artificial Intelligence And Big Data Technologies To Close The Achievement Gap,in Luckin, R., ed. Enhancing Learning and Teaching with Technology, London: UCL Institute of Education Press, pp. 256–285, 2018
3 Hutchinson, B., Smart, A., Hanna, A., Denton, E., Greer, C., Kjartansson, O., Barnes, P., Mitchell, M., Towards Accountability for Machine Learning Datasets: Practices from Software Engineering and Infrastructure, Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, Association for Computing Machinery, New York, 2021
4 Barocas, S., Hardt, M., Narayanan, A., Fairness and machine learning Limitations and Opportunities, yet to be published
5 Kelleher, J.D, Tierney, B, Data Science, London, 2018
6 Schneier, B., Data and Goliath: The Hidden Battles to Capture Your Data and Control Your World, W. W. Norton & Company, 2015
7 Kant, T., Identity, Advertising, and Algorithmic Targeting: Or How (Not) to Target Your “Ideal User.”, MIT Case Studies in Social and Ethical Responsibilities of Computing, 2021
-
1
2023-01-04T08:48:01+00:00
Offen oder geschlossen?
4
A section for chapter 8
plain
2023-12-29T19:50:39+00:00
Open Educational Resources (OER) und ihre Geschichte
Unter Bildungsressourcen versteht man alle Materialien, heutzutage meist in digitaler Form, die in der Bildung eine Rolle spielen: Lehrbücher, Folien, Lehrpläne, Prüfungen, ... Sie sind offen, wenn sie frei mit anderen geteilt werden können (eine genauere Definition folgt).
Auch wenn Bildung zu verschiedenen Zeiten in der Geschichte in vielerlei Hinsicht offen war, so hat sich doch das Verständnis des Begriffs selbst entwickelt. Die folgenden Definitionen von OER und Open License wurden im Zusammenhang mit der Empfehlung vom 25. November 20191 überarbeitet:
1. Offene Bildungsressourcen (OER) sind Lern-, Lehr- und Forschungsmaterialien in jedem Format und auf jedem Medium, die gemeinfrei sind oder unter einem Urheberrecht stehen, das unter einer offenen Lizenz veröffentlicht wurde, und die den kostenlosen Zugang, die Wiederverwendung, die Umnutzung, die Anpassung und die Weiterverbreitung durch andere erlauben.
2. Eine offene Lizenz ist eine Lizenz, die die geistigen Eigentumsrechte des Urheberrechtsinhabers respektiert und der Öffentlichkeit das Recht auf Zugang, Wiederverwendung, Umwidmung, Anpassung und Weiterverbreitung von Bildungsmaterialien einräumt.
Die Begriffe offener Inhalt und OER beziehen sich auf jedes urheberrechtsfähige Werk (traditionell mit Ausnahme von Software, die mit anderen Begriffen wie Open Source beschrieben wird), das lizenziert ist, um die folgenden Rechte (auch bekannt als die 5 Rs)2 zu gewähren:
• zum Behalten: das Recht, Kopien des Inhalts anzufertigen, zu besitzen und zu kontrollieren (z. B. herunterladen, vervielfältigen, speichern und verwalten)
• zur Wiederverwendung: das Recht, den Inhalt auf vielfältige Weise zu nutzen (z. B. im Unterricht, in einer Lerngruppe, auf einer Website, in einem Video)
• zur Überarbeitung: das Recht, den Inhalt selbst anzupassen, zu verändern oder zu modifizieren (z.B. den Inhalt in eine andere Sprache zu übersetzen)
• zum Remixen: das Recht, den ursprünglichen oder überarbeiteten Inhalt mit anderem Material zu kombinieren, um etwas Neues zu schaffen (z. B. den Inhalt einzubetten)
• zur Weiterverarbeitung: das Recht, Kopien des ursprünglichen Inhalts, der Überarbeitungen oder ihrer Kombination an andere weiterzugeben
Diese Rechte sind nicht trivial. Das dritte Recht ist beispielsweise für Lehrkräfte von grundlegender Bedeutung: die Erlaubnis, das Lehrmaterial eines anderen zu übernehmen und es an den eigenen Zweck, die Dauer und das Niveau des eigenen Unterrichts anzupassen, vielleicht auch an geografische und kulturelle Besonderheiten.Warum KI offene Daten will
Auf der anderen Seite kann Bildung, wie an verschiedenen Stellen in diesem Buch und auch durch die finanziellen Investitionen der Industrie gezeigt, als Markt betrachtet werden. Und da maschinelles Lernen die treibende Kraft hinter der künstlichen Intelligenz ist, kann man mit Fug und Recht behaupten, dass die künstliche Intelligenz im Bildungsbereich Daten braucht, um zu gedeihen.Der Unterschied zwischen Nutzer- und Wissensdaten
Es gibt zwei Arten von Daten, die KI für das Bildungswesen benötigen wird.
Daten über die Nutzenden: Wie lernen sie? Was ist der Auslöser für gutes Lernen? Was ermöglicht ein besseres Lernen? Wie Daphne Koller es einmal ausdrückte: „Machen wir aus der Bildungswissenschaft eine Datenwissenschaft!"
Diese Daten können nur von den Nutzenden selbst erstellt werden. Daher ist es wichtig, dass die Unternehmen die Plattformen besitzen, mit denen die Nutzenden interagieren sollen. Dies war der Schlüssel zum Erfolg vieler KI-Unternehmen und wird auch der Schlüssel zum Erfolg im Bildungswesen sein.
Die zweite Art von Daten betrifft das Wissen. Im Bildungsbereich stellen die Kursmaterialien einen großen Teil dieses Wissens dar. Diese Daten werden geteilt oder nicht geteilt: In den meisten Fällen wissen diejenigen, die das Wissen produzieren oder sammeln, wenig über Lizenzen, und das von ihnen produzierte Material ist in Archiven, Blogs oder innerhalb bestimmter Gruppen in sozialen Netzwerken versteckt. Ein Teil dieses Wissens befindet sich natürlich hinter Bezahlschranken und ein anderer Teil auf Websites, deren Geschäftsmodell darin besteht, das Wissen kostenlos anzubieten, aber in einem Umfeld, in dem man Werbung und unerwünschte Werbung sehen muss, um Zugang zu erhalten oder zu behalten.Nutzerdaten müssen geschützt werden
Im ersten Fall müssen die Daten, die Nutzerdaten, geschützt werden. Dies gilt umso mehr, wenn es sich um Daten von minderjährigen Schülerinnen und Schülern handelt. Das bedeutet, dass die Schule oder die Lehrkraft diese Daten nicht an Plattformen weitergeben sollte, es sei denn, sie hat die ausdrückliche Erlaubnis dazu. Auch dann nicht, wenn die Plattform einen interessanten Service anbietet. Ebenso ist es nie eine gute Idee, die Namen und Adressen der Schülerinnen und Schüler für die Teilnahme an einer Aktivität zu registrieren. Bitte sehen Sie sich das Video über Daten und Re-Identifizierung an.
Die Europäische Union hat einen soliden Rahmen zum Schutz ihrer Bürgerinnen und Bürger, ihrer Privatsphäre und ihrer digitalen Rechte geschaffen. Dieser Rahmen wird als DSGVO bezeichnet. Die DSGVO schützt die Bürgerinnen und Bürger, indem sie ihnen Rechte einräumt, die von den Plattformen gewährt werden müssen, unabhängig davon, ob sie der Bildung dienen oder nicht.Wissensdaten sollten geteilt werden
Andererseits kann Wissen geteilt werden. Und es sollte geteilt werden. Natürlich ist das nur möglich, wenn man das Recht dazu hat, was bedeutet, dass man verstehen muss, wie Lizenzen funktionieren. Creative-Commons-Lizenzen eignen sich im Allgemeinen am besten für OER.
Sobald OER geteilt werden, kann künstliche Intelligenz von vielen Anwendungen genutzt werden, wie z.B. im X5-GON Projekt.
------------------------------------------------------------------------------------------------------
1Wiley, D., & Hilton, J. (2018). Defining OER-enabled pedagogy. International Review of Research in Open and Distance Learning, 19(4). https://doi.org/10.19173/irrodl.v19i4.3601
2The Access Compromise and the 5th R David Wiley, 2014. https://opencontent.org/blog/archives/3221
2UNESCO. (2021a). Open educational resources. https://en.unesco.org/themes/building-knowledge-societies/oer/recommendation
UNESCO. (2019). Recommendation on open educational resources (OER). http://portal.unesco.org/en/ev.php-URL_ID=49556&URL_DO=DO_TOPIC&URL_SECTION=201.html