This site requires Javascript to be turned on. Please enable Javascript and reload the page.

AI für Lehrer: Ein OpenTextbook

Machine learns

This page is referenced by:

AI Speak: Maschinelles Lernen Ein Algorithmus ist eine feste Abfolge von Anweisungen zur Ausführung einer Aufgabe. Er zerlegt die Aufgabe in einfache, verwirrungsfreie Schritte: wie ein gut geschriebenes Rezept.

Programmiersprachen sind Sprachen, die ein Computer befolgen und ausführen kann. Sie dienen als Brücke zwischen dem, was wir verstehen, und dem, was eine Maschine kann - letztlich Schalter, die man ein- und ausschalten kann. Für einen Computer sind Bilder, Videos und Anweisungen alles Einsen ("Schalter ist an") und Nullen ("Schalter ist aus").

In einer Programmiersprache geschrieben, wird ein Algorithmus zu einem Programm. Anwendungen sind Programme, die für Endnutzende geschrieben werden.

Herkömmliche Programme nehmen Daten auf und folgen den Anweisungen, um eine Ausgabe zu erzeugen. Viele frühe KI-Programme waren konventionell. Da sich die Anweisungen nicht an die Daten anpassen können, waren diese Programme nicht sehr gut darin, Vorhersagen auf der Grundlage unvollständiger Informationen zu treffen und natürliche Sprache zu verarbeiten (Natural Language Processing, NLP).

Eine Suchmaschine wird sowohl von herkömmlichen als auch von maschinellen (ML) Lernalgorithmen angetrieben. Im Gegensatz zu herkömmlichen Programmen analysieren ML-Algorithmen Daten auf Muster und verwenden diese Muster oder Regeln, um zukünftige Entscheidungen oder Vorhersagen zu treffen. Das heißt, auf der Grundlage von Daten - guten und schlechten Beispielen - finden sie ihr eigenes "Rezept".

Diese Algorithmen eignen sich gut für Situationen mit hoher Komplexität und fehlenden Daten. Sie können auch ihre Leistung überwachen und dieses Feedback nutzen, um sich mit der Zeit zu verbessern.

Es ist nicht viel anders als bei Menschen, insbesondere bei Babys, die sich Fähigkeiten außerhalb des traditionellen Bildungssystems aneignen. Babys beobachten, wiederholen, lernen, testen und verbessern sich. Wenn nötig, improvisieren sie.

Aber die Ähnlichkeit zwischen Maschinen und Menschen ist sehr oberflächlich. „Lernen" aus menschlicher Sicht ist etwas ganz anderes und viel nuancierter und komplexer als „Lernen" für die Maschine.
Ein Klassifizierungsproblem
Eine häufige Aufgabe, für die eine ML-Anwendung eingesetzt wird, ist die Klassifizierung: Handelt es sich um ein Foto eines Hundes oder einer Katze? Hat der Lernende Schwierigkeiten oder hat er/sie die Prüfung bestanden? Es gibt zwei oder mehr Kategorien. Und die Anwendung muss neue Daten in eine dieser Gruppen einordnen.

Nehmen wir das Beispiel eines Spielkartenstapels, der nach einem bestimmten Muster in zwei Stapel - Gruppe A und Gruppe B - unterteilt ist. Wir sollen eine neue Karte, das Karo-Ass, der Gruppe A oder der Gruppe B zuordnen.

Zunächst müssen wir verstehen, wie die Gruppen aufgeteilt sind - wir brauchen Beispiele. Ziehen wir vier Karten aus Gruppe A und vier aus Gruppe B. Diese 8 Beispielfälle bilden unsere Trainingsmenge, d.h. Daten, die uns helfen, das Muster zu erkennen. Wir „trainieren", das Ergebnis zu sehen.

Sobald uns die Anordnung auf der rechten Seite gezeigt wird, würden die meisten von uns erraten, dass das Karo-Ass zu Gruppe B gehört. Wir brauchen keine Anweisungen, das menschliche Gehirn ist ein Wunderwerk der Musterfindung. Wie würde eine Maschine dies tun?

Die Algorithmen des maschinellen Lernens beruhen auf leistungsstarken statistischen Theorien. Die verschiedenen Algorithmen beruhen auf unterschiedlichen mathematischen Gleichungen, die sorgfältig ausgewählt werden müssen, um der jeweiligen Aufgabe gerecht zu werden. Es ist die Aufgabe der programmierenden Person, die Daten auszuwählen, zu analysieren, welche Merkmale der Daten für das jeweilige Problem relevant sind, und den richtigen Algorithmus auszuwählen.
Die Wichtigkeit von Daten
Die obige Kartenziehung hätte auf verschiedene Weise schiefgehen können. Bitte sehen Sie sich das Bild an. 1 hat zu wenige Karten, eine Vermutung wäre nicht möglich. 2 hat mehr Karten, aber alle von der gleichen Farbe, daher bietet es keine Ansatzpunkte um herauszufinden, wo Karo hinkommen würde. Wenn die Gruppen nicht gleich groß sind, könnte 3 sehr wohl bedeuten, dass die Zahlenkarten in Gruppe A und die Bildkarten in Gruppe B sind.

Im Allgemeinen sind die Probleme des maschinellen Lernens offener und umfassen Datensätze, die viel größer sind als ein Kartenspiel. Die Trainingsdatensätze müssen mit Hilfe einer statistischen Analyse ausgewählt werden, da sich sonst Fehler einschleichen. Eine gute Datenauswahl ist entscheidend für eine gute ML-Anwendung, mehr noch als bei anderen Programmtypen. Maschinelles Lernen benötigt eine große Anzahl relevanter Daten. Als absolutes Minimum sollte ein grundlegendes Modell für maschinelles Lernen zehnmal so viele Datenpunkte enthalten wie die Gesamtzahl der Merkmale.¹ Darüber hinaus ist ML besonders gut geeignet, um mit "verrauschten", unklaren und widersprüchlichen Daten umzugehen.
Extraktion von Merkmalen
Bei den oben gezeigten Beispielen für Gruppe A und Gruppe B ist Ihnen vielleicht als Erstes die Farbe der Karten aufgefallen. Dann die Nummer oder den Buchstaben und die Farbe. Für einen Algorithmus müssen alle diese Merkmale speziell eingegeben werden. Er kann nicht automatisch wissen, was für das Problem wichtig ist.

Bei der Auswahl der Merkmale, die von Interesse sind, müssen sich Programmiernde viele Fragen stellen. Wie viele Merkmale sind zu wenig, um nützlich zu sein? Wie viele Funktionen sind zu viele? Welche Merkmale sind für die Aufgabe relevant? In welchem Verhältnis stehen die ausgewählten Funktionen zueinander - ist eine Funktion von der anderen abhängig? Ist es mit den gewählten Merkmalen möglich, dass die Ausgabe genau ist?
Der Prozess
Wenn die programmierende Person die Anwendung erstellt, nimmt sie Daten, extrahiert daraus Merkmale, wählt einen geeigneten Algorithmus für maschinelles Lernen (eine mathematische Funktion, die den Prozess definiert) und trainiert ihn mit markierten Daten (in dem Fall, in dem die Ausgabe bekannt ist - wie Gruppe A oder Gruppe B), so dass die Maschine das Muster hinter dem Problem "versteht".

Für eine Maschine besteht das Verständnis aus einer Reihe von Zahlen - den Gewichten -, die sie jedem Merkmal zuordnet. Durch die richtige Zuordnung der Gewichte kann die Maschine die Wahrscheinlichkeit berechnen, mit der eine neue Karte zur Gruppe A oder zur Gruppe B gehört. In der Regel hilft die programmierende Person der Maschine in der Trainingsphase, indem sie einige Werte manuell ändert - dies wird als Abstimmung (eng.: Tuning) der Anwendung bezeichnet.

Nachdem dies geschehen ist, muss das Programm getestet werden, bevor es in Betrieb genommen werden kann. Zu diesem Zweck werden dem Programm die markierten Daten, die nicht für das Training verwendet wurden, zur Verfügung gestellt. Diese Daten werden als Testdaten bezeichnet. Die Leistung des Programms bei der Vorhersage des Outputs wird dann gemessen. Sobald das Programm als zufriedenstellend eingestuft wird, kann es eingesetzt werden: Es ist bereit, neue Daten zu verarbeiten und eine Entscheidung oder Vorhersage zu treffen.

Die Echtzeitleistung wird dann kontinuierlich überwacht und verbessert (die Gewichtung der Merkmale wird angepasst, um eine bessere Leistung zu erzielen). Häufig führt die Echtzeitleistung zu anderen Ergebnissen, als wenn das maschinelle Lernen mit bereits vorhandenen Daten getestet wird. Da das Experimentieren mit realen Nutzern teuer, zeitaufwändig und oft riskant ist, werden Algorithmen immer mit historischen Nutzerdaten getestet, die möglicherweise nicht in der Lage sind, die Auswirkungen auf das Nutzerverhalten zu ermitteln.¹ Daher ist es wichtig, Anwendungen des maschinellen Lernens umfassend zu evaluieren, sobald sie in Betrieb genommen werden:
Haben Sie Lust, Machine Learning auszuprobieren? Versuchen Sie diese Aktivität.

------------------------------------------------------------------------------------------------------
¹Theobald, O. Machine Learning For Absolute Beginners: A Plain English Introduction (Second Edition) (Machine Learning From Scratch Book 1) (p. 24). Scatterplot Press. Kindle Edition.
²Konstan, J., Terveen, L., Human-centered recommender systems: Origins, advances, challenges, and opportunities, AI Magazine, 42(3), 31-42, 2021
AI Speak: Wie Youtube über Sie lernt — Teil 2
Der Prozess
Bei Google werden heute tiefe neuronale Netzwerke für das maschinelle Lernen eingesetzt. ² Auf der Grundlage des Videomodells nimmt das neuronale Netzwerk von Youtube Videos, die denen ähnlich sind, die die nutzende Person bereits angesehen hat. Dann versucht es, die Verweildauer jedes neuen Videos für eine bestimmte nutzende Person vorherzusagen und ordnet sie auf der Grundlage dieser Vorhersage ein. Die Idee ist dann, die 10 bis 20 Videos (je nach Gerät) mit den besten Platzierungen anzuzeigen.

Der Prozess ähnelt dem Machine-Learning-Modell, das wir zuvor untersucht haben. Zunächst nimmt die Maschine Merkmale aus Benutzer– und Videomodellen, die von der Programmierung vorgegeben werden. Sie lernt aus den Trainingsdaten, welche Gewichtung sie jedem Merkmal geben muss, um die Sehdauer korrekt vorherzusagen. Und dann, wenn sie getestet und für gut befunden wurde, kann sie mit der Vorhersage und Empfehlung beginnen.
Schulung
Während des Trainings werden dem System Millionen von positiven und negativen Beispielen vorgelegt. Ein positives Beispiel ist, wenn eine nutzende Person auf ein Video geklickt und es sich eine bestimmte Zeit lang angesehen hat. Ein negatives Beispiel ist, wenn sie nicht auf das Video geklickt hat oder es sich nicht lange angesehen hat.²

Das Netzwerk nimmt die Merkmale einer nutzenden Person und die Videomerkmale auf, die im Abschnitt Modelle in Wie Youtube über Sie lernt — Teil 1 besprochen wurden. Es passt die Wichtigkeit der einzelnen Eingabemerkmale an, indem es prüft, ob es die Sehdauer für ein bestimmtes Video und eine bestimmte nutzende Person korrekt vorhersagt.

Es gibt ungefähr eine Milliarde Parameter (Gewichtung jedes Merkmals), die anhand von Hunderten von Milliarden Beispielen erlernt werden müssen.²Das Netzwerk kann auch lernen, bestimmte Merkmale zu ignorieren, d.h. ihnen keine Bedeutung beizumessen. So kann die Einbettung oder das Modell, das der Algorithmus erstellt, ganz anders aussehen, als es sich die Entwickelnden vorgestellt haben.
Testen

Nachdem das Netzwerk trainiert wurde, wird es an bereits verfügbaren Daten getestet und angepasst. Abgesehen von der Vorhersagegenauigkeit muss die Ausgabe des Systems von den Programmierenden auf der Grundlage mehrerer Werturteile angepasst werden. Die Anzeige von Videos, die den bereits angesehenen Videos zu ähnlich sind, ist nicht sehr ansprechend. Was bedeutet es wirklich, dass eine Empfehlung gut ist? Wie viele ähnliche Videos sollen gezeigt werden und wie viel Abwechslung soll es geben - sowohl in Bezug auf die anderen Videos als auch in Bezug auf den Verlauf der nutzenden Person? Wie viele der Interessen der nutzenden Person sollen abgedeckt werden? Welche Art von Empfehlungen führt zu sofortiger Zufriedenheit und welche zu langfristiger Nutzung?^{1, 3} Dies sind alles wichtige Fragen, die es zu berücksichtigen gilt.

Nach diesem Test wird eine Echtzeitbewertung der Empfehlungen durchgeführt. Gemessen wird die Gesamtzeit, die eine nutzende Person sich die empfohlenen Videos ansieht.² Je länger sie sich die empfohlenen Videos ansieht, desto erfolgreicher ist das Modell. Beachten Sie, dass die Anzahl der angeklickten Videos für die Bewertung nicht ausreicht. Youtube bewertet seine Empfehlungsgeber auf der Grundlage der Anzahl der empfohlenen Videos, die zu einem erheblichen Teil angeschaut wurden, der Sitzungsdauer, der Zeit bis zum ersten längeren Anschauen und des Anteils der eingeloggten Nutzenden mit Empfehlungen.¹
Interface
Schließlich geht es darum, wie die Empfehlungen der betrachtenden Person präsentiert werden: Wie viele Videos sollen gezeigt werden? Sollen die besten Empfehlungen alle auf einmal präsentiert werden, oder sollen einige für später gespeichert werden? ³ Wie sollen Miniaturbilder und Videotitel angezeigt werden? Welche anderen Informationen sollen angezeigt werden? Welche Einstellungen kann die nutzende Person kontrollieren? ¹ Die Antworten auf diese Fragen entscheiden darüber, wie Youtube seine zwei Milliarden Nutzerinnen und Nutzer rund um die Uhr zu fesseln vermag.
------------------------------------------------------------------------------------------------------
¹Davidson, J., Liebald, B., Liu, J., Nandy, P., Vleet, T., The Youtube Video Recommendation System, Proceedings of the 4th ACM Conference on Recommender Systems, Barcelona, 2010
² Covington, P., Adams, J., Sargin, E., Deep neural networks for Youtube Recommendations, Proceedings of the 10th ACM Conference on Recommender Systems, ACM, New York, 2016
³Konstan, J., Terveen, L., Human-centered recommender systems: Origins, advances, challenges, and opportunities, AI Magazine, 42(3), 31-42, 2021
4 Spinelli, L., and Crovella, M., How YouTube Leads Privacy-Seeking Users Away from Reliable Information, In Adjunct Publication of the 28th ACM Conference on User Modeling, Adaptation and Personalization (UMAP '20 Adjunct), Association for Computing Machinery, New York, 244–251, 2020
AI Speak: Wie adaptive Systeme über die Lernenden lernen — Teil 2 4 plain 2023-12-29T08:50:38+00:00
Der Prozess
In den letzten Jahren wird maschinelles Lernen immer häufiger in adaptiven Systemen eingesetzt, entweder als einzige Technologie oder in Verbindung mit anderen Ansätzen.² Wo es eingesetzt wird, besteht die Hauptaufgabe von ML darin, Schülermodelle auf der Grundlage einer Reihe von Merkmalen zu erstellen und zu aktualisieren, einschließlich der Ergebnisse von Bewertungen und neuer Daten, die während des gesamten Prozesses generiert werden.¹

Für die äußere Schleife werden mit Hilfe von Trainingsdaten Modelle erstellt, denen geeignete Gewichtsmerkmale zugewiesen werden, um effektive Lerninhalte zu empfehlen² (siehe auch Wie maschinelles Lernen funktioniert). Diese Modelle werden verwendet, um regelmäßig neue Lernpfade zu empfehlen, die den Lernfortschritt und die sich ändernden Interessen der Schülerinnen und Schüler widerspiegeln - wie neue Empfehlungen auf Youtube. Bei ML-basierten ALS kann die Anzahl der Pfade in die Billionen gehen.³
In der internen Schleife wird maschinelles Lernen eingesetzt, um geeignetes Feedback zu geben, Fehler oder Wissenslücken zu erkennen und die Beherrschung von Wissenseinheiten zu bewerten: Während der Arbeit an einer Aufgabe kann eine Schülerin oder ein Schüler Fehler machen. Mithilfe von ML können Sie vorhersagen, welche Fehler aus welcher Wissenslücke resultieren. Wenn ein Schritt der Lösung richtig ist, kann ML verwendet werden, um vorherzusagen, welche Wissenseinheiten erfolgreich gemeistert wurden.²

Andere Techniken, die in adaptiven Systemen zum Einsatz kommen, sind weniger automatisiert und erfordern explizit geschriebene Regeln, um Schlussfolgerungen zu ziehen.²Sie erfordern viel Programmierzeit und zusätzlichen Aufwand, um alle Kriterien, die in die Entscheidungsfindung einfließen, genau zu erfassen. Außerdem lassen sich die Ergebnisse oft nicht von einem Bereich zum nächsten oder von einem Problem zum nächsten verallgemeinern.

Tools, die ML verwenden, nutzen große Datensätze über die tatsächliche Leistung der Schülerinnen und Schüler und sind in der Lage, für sie im Laufe der Zeit die dynamischsten Lernpfade zu erstellen.¹ Wie bei allen ML-Anwendungen muss vor dem Einsatz im Klassenzimmer trainiert und getestet werden.
Pädagogisches Modell
Im Fall von Youtube haben wir gesehen, dass es eine Menge Werturteile darüber gibt, was eine gute Empfehlung ausmacht: wie viele Nutzerinteressen in einem Satz von Empfehlungen abgedeckt werden sollen, wie viele Videos den bereits gesehenen ähnlich sein sollen, wie viele neue Inhalte zur Abwechslung hinzugefügt werden sollen (siehe Wie Youtube über Sie lernt — Teil 2). ALS beinhaltet ähnliche Beurteilungen darüber, was es bedeutet, einen KU zu beherrschen und wie man zu dieser Beherrschung gelangt: die Pädagogik und die tägliche Erfahrung der Lernenden.⁴

Im Falle von ALS sollten diese Einschätzungen und Hinweise darauf, wie Lernende Fortschritte machen sollen, auf bewährten pädagogischen Theorien beruhen. Diese fließen in das pädagogische Modell ein und helfen der Maschine zusammen mit den Domänen- und Lernermodellen bei der Auswahl einer geeigneten Reihe von Aktivitäten.

Einige der Fragen, die in diesem Modell beantwortet werden, sind: Soll dem Schüler bzw. der Schülerin als Nächstes ein Konzept, eine Aktivität oder ein Test präsentiert werden? Mit welchem Schwierigkeitsgrad? Wie kann man den Lernprozess bewerten und Feedback geben? Wo ist mehr Hilfestellung notwendig? ⁵ (Hilfestellungen sind Unterstützungsmechanismen, die Anleitungen zu Konzepten und Verfahren, zu den verwendeten Strategien und zur Reflexion, Planung und Überwachung des Lernens geben.) Das pädagogische Modell diktiert den Umfang und die Tiefe der Aktivitäten und sogar, ob man innerhalb des ALS weitermachen oder sich Hilfe von der Lehrkraft holen soll.³

Interface
Die Empfehlungen werden zusammen mit anderen Daten wie Lernfortschritt, Leistung und Ziele dargestellt. Die wichtigsten Fragen dabei sind:
- Wie soll der Inhalt vermittelt werden?
- Wie viel Inhalt soll auf einmal empfohlen werden?
- Was wird direkt zugewiesen und was wird empfohlen?
- Was sind die unterstützenden Ressourcen?
- Ist es möglich, Gruppenaktivitäten anzubieten?
- Wie viel Autonomie ist zuzulassen?
- Können Lernende ihre Präferenzen ändern?
- Kann die Lehrkraft die Lernpfade ändern?
- Welche Daten werden der Lehrkraft angezeigt?
- Ist die Lehrkraft in den Prozess eingebunden?
Auswertung
Wenn das ALS zum Einsatz kommt, überwachen die meisten Systeme ihre eigene Leistung anhand der durch die Programmierung festgelegten Kriterien. Wie bei jedem KI-Tool können die Daten verzerrt sein. Die vom System gezogenen Schlüsse können ungenau sein. Die Daten von Schülerinnen und Schüler aus der Vergangenheit werden mit der Zeit immer weniger aussagekräftig.⁶ Daher muss auch die Lehrkraft die Leistung des Systems überwachen und den Lernenden bei Bedarf anleiten und korrigieren.

Es sind auch die Lehrkräfte und Mitlernenden, die Anregungen geben und alternative Ressourcen aufzeigen müssen. Die Forschung im Bereich der Empfehlungssysteme wurde über ein Jahrzehnt lang von kommerziellen Inhaltsanbietern und Online-Einzelhandelsunternehmen geprägt. Daher lag der Schwerpunkt auf der zuverlässigen Bereitstellung von Empfehlungen, die zu vermarktbaren Ergebnissen führen. „Die überraschende Freude über ein unerwartetes Juwel”⁷ und weniger befahrene Wege, die zu nachhaltigem Lernen anregen können, gehören nicht zu den Stärken des maschinengestützten personalisierten Lernens.

------------------------------------------------------------------------------------------------------
¹ EdSurge, Decoding Adaptive, Pearson, London, 2016
²Chrysafiadi, K., Virvou, M., Student modeling approaches: A literature review for the last decade, Expert Systems with Applications, Elseiver, 2013
³Essa, A., A possible future for next generation adaptive learning systems, Smart Learning Environments, 3, 16, 2016
⁴Groff, J., Personalized Learning : The state of the field and future directions, Center for curriculum redesign, 2017.
⁵Alkhatlan, A., Kalita, J.K., Intelligent Tutoring Systems: A Comprehensive Historical Survey with Recent Developments, International Journal of Computer Applications 181(43):1-20, March 2019
⁶du Boulay, B., Poulovasillis, A., Holmes, W., Mavrikis, M., Artificial Intelligence And Big Data Technologies To Close The Achievement Gap, In: Luckin, Rose ed. Enhancing Learning and Teaching with Technology. London: UCL Institute of Education Press, pp. 256–28, 2018
⁷Konstan, J., Terveen, L., Human-centered recommender systems: Origins, advances, challenges, and opportunities, AI Magazine, 42(3), 31-42, 2021