AI für Lehrer: Ein OpenTextbook

AI Speak: Maschinelles Lernen

Ein Algorithmus ist eine feste Abfolge von Anweisungen zur Ausführung einer Aufgabe. Er zerlegt die Aufgabe in einfache, verwirrungsfreie Schritte: wie ein gut geschriebenes Rezept.

Programmiersprachen sind Sprachen, die ein Computer befolgen und ausführen kann. Sie dienen als Brücke zwischen dem, was wir verstehen, und dem, was eine Maschine kann — letztendlich Schalter, die ein- und ausgeschaltet werden können. Für einen Computer sind Bilder, Videos und Anweisungen alles Einsen (Schalter ist an) und Nullen (Schalter ist aus).

In einer Programmiersprache geschrieben, wird ein Algorithmus zu einem ein Programm. Anwendungen sind Programme, die für Endbenutzende geschrieben werden.

Herkömmliche Programme nehmen Daten auf und folgen den Anweisungen, um eine Ausgabe zu erzeugen. Viele frühe KI-Programme waren konventionell. Da sich die Anweisungen nicht an die Daten anpassen können, waren diese Programme nicht sehr gut darin, Vorhersagen auf der Grundlage unvollständiger Informationen zu treffen und natürliche Sprache zu verarbeiten (NLP).

Eine Suchmaschine wird sowohl von herkömmlichen als auch von maschinellen Lernalgorithmen angetrieben. Im Gegensatz zu herkömmlichen Programmen analysieren ML-Algorithmen Daten auf Muster und verwenden diese Muster oder Regeln, um zukünftige Entscheidungen oder Vorhersagen zu treffen. Das heißt, auf der Grundlage von Daten — guten und schlechten Beispielen — finden sie ihr eigenes Rezept.

Diese Algorithmen sind gut geeignet für Situationen mit viel Komplexität und fehlenden Daten. Sie können auch ihre Leistung überwachen und dieses Feedback nutzen, um mit der Zeit besser zu werden.

Das ist nicht viel anders als bei Menschen, insbesondere bei Babys, die Fähigkeiten außerhalb des herkömmlichen Bildungssystems erlernen. Babys beobachten, wiederholen, lernen, testen ihr Lernen und verbessern sich. Wo nötig, improvisieren sie.

Aber die Ähnlichkeit zwischen Maschinen und Menschen ist sehr oberflächlich. „Lernen" aus menschlicher Sicht ist etwas ganz anderes und viel nuancierter und komplexer als „Lernen" für die Maschine.

Ein Klassifizierungsproblem

Eine häufige Aufgabe, für die eine ML-Anwendung verwendet wird, ist die Klassifizierung: Ist dies ein Foto von einem Hund oder einer Katze? Hat dieser Student Schwierigkeiten oder hat er die Prüfung bestanden? Es gibt zwei oder mehr Gruppen. Und die Anwendung muss neue Daten in eine dieser Gruppen einordnen.

Nehmen wir das Beispiel eines Spielkartenstapels, der nach einem bestimmten Muster in zwei Stapel — Gruppe A und Gruppe B — unterteilt ist. Wir müssen eine neue Karte, das Karo-Ass, als zu Gruppe A oder Gruppe B gehörend klassifizieren.
 
Zunächst müssen wir verstehen, wie die Gruppen aufgeteilt sind - wir brauchen Beispiele. Ziehen wir vier Karten aus Gruppe A und vier aus Gruppe B. Diese 8 Beispielfälle bilden unsere Trainingsmenge — Daten, die uns helfen, das Muster zu erkennen. Wir „trainieren", das Ergebnis zu sehen.

Sobald uns die Anordnung auf der rechten Seite gezeigt wird, würden die meisten von uns erraten, dass das Karo-Ass zu Gruppe B gehört. Wir brauchen keine Anweisungen, das menschliche Gehirn ist ein Wunderwerk der Musterfindung. Wie würde eine Maschine dies tun?

Die Algorithmen des maschinellen Lernens beruhen auf leistungsstarken statistischen Theorien. Die verschiedenen Algorithmen beruhen auf unterschiedlichen mathematischen Gleichungen, die sorgfältig ausgewählt werden müssen, um der jeweiligen Aufgabe gerecht zu werden. Es ist die Aufgabe der programmierenden Person, die Daten auszuwählen, zu analysieren, welche Merkmale der Daten für das jeweilige Problem relevant sind, und den richtigen Algorithmus auszuwählen.

Die Wichtigkeit von Daten

Die obige Kartenziehung hätte auf verschiedene Weise schiefgehen können. Bitte sehen Sie sich das Bild an. 1 hat zu wenige Karten, eine Vermutung wäre nicht möglich. 2 hat mehr Karten, aber alle von der gleichen Farbe — keine Möglichkeit zu wissen, wo Karo hinkommen würde. Wenn die Gruppen nicht gleich groß sind, könnte 3 sehr wohl bedeuten, dass die Zahlenkarten in Gruppe A und die Bildkarten in Gruppe B sind.

Normalerweise sind die Probleme des maschinellen Lernens offener und umfassen Datensätze, die viel größer sind als ein Kartenspiel. Die Trainingsdatensätze müssen mit Hilfe einer statistischen Analyse ausgewählt werden, sonst schleichen sich Fehler ein. Eine gute Datenauswahl ist entscheidend für eine gute ML-Anwendung, mehr noch als bei anderen Programmtypen. Maschinelles Lernen benötigt eine große Anzahl relevanter Daten. Als absolutes Minimum sollte ein grundlegendes Modell für maschinelles Lernen zehnmal so viele Datenpunkte enthalten wie die Gesamtzahl der Merkmale.1 Abgesehen davon ist ML auch besonders gut geeignet, um mit verrauschten, unübersichtlichen und widersprüchlichen Daten umzugehen.

Extraktion von Merkmalen

Bei den oben gezeigten Beispielen für Gruppe A und Gruppe B ist Ihnen vielleicht als Erstes die Farbe der Karten aufgefallen. Dann die Nummer oder den Buchstaben und die Farbe. Für einen Algorithmus müssen alle diese Merkmale speziell eingegeben werden. Er kann nicht automatisch wissen, was für das Problem wichtig ist.

Bei der Auswahl der Merkmale, die von Interesse sind, müssen sich Programmiernde viele Fragen stellen. Wie viele Merkmale sind zu wenig, um nützlich zu sein? Wie viele Funktionen sind zu viele? Welche Merkmale sind für die Aufgabe relevant? In welchem Verhältnis stehen die ausgewählten Funktionen zueinander — ist eine Funktion von der anderen abhängig? Ist es mit den gewählten Merkmalen möglich, dass die Ausgabe genau ist?

Der Prozess

Wenn die programmierende Person die Anwendung erstellt, nimmt sie Daten, extrahiert daraus Merkmale, wählt einen geeigneten Algorithmus für maschinelles Lernen (eine mathematische Funktion, die den Prozess definiert) und trainiert ihn mit markierten Daten (in dem Fall, in dem die Ausgabe bekannt ist — wie Gruppe A oder Gruppe B), so dass die Maschine versteht  das Muster hinter dem Problem versteht.

Für eine Maschine Verständnis in Form einer Reihe von Zahlen — Gewichten —, die sie jedem Merkmal zuordnet. Mit der korrekten Zuordnung der Gewichte kann sie die Wahrscheinlichkeit berechnen, dass eine neue Karte zur Gruppe A oder zur Gruppe B gehört. In der Regel hilft die programmierende Person der Maschine in der Trainingsphase, indem sie einige Werte manuell ändert - dies wird als Abstimmung  (eng.: Tuning) der Anwendung bezeichnet.

Sobald dies geschehen ist, muss das Programm getestet werden, bevor es in Gebrauch genommen wird. Zu diesem Zweck werden dem Programm die markierten Daten, die nicht für das Training verwendet wurden, zur Verfügung gestellt. Diese werden als die Testdaten bezeichnet. Die Leistung der Maschine bei der Vorhersage der Ausgabe wird dann gemessen. Sobald das Programm als zufriedenstellend eingestuft wird, kann es eingesetzt werden: Es ist bereit, neue Daten zu verarbeiten und eine Entscheidung oder Vorhersage darüber zu treffen.

Die Echtzeitleistung wird dann kontinuierlich überwacht und verbessert (die Gewichtung der Merkmale wird angepasst, um eine bessere Leistung zu erzielen). Oft führt die Echtzeitleistung zu anderen Ergebnissen, als wenn Machine Learning mit bereits vorhandenen Daten getestet wird. Da das Experimentieren mit echten Benutzern teuer, aufwändig und oft riskant ist, werden Algorithmen immer mit historischen Benutzerdaten getestet, die möglicherweise nicht in der Lage sind, die Auswirkungen auf das Benutzerverhalten zu ermitteln.Deshalb ist es wichtig, eine umfassende Evaluierung von Anwendungen des maschinellen Lernens durchzuführen, sobald sie im Einsatz sind:

Haben Sie Lust, Machine Learning auszuprobieren? Versuchen Sie diese Aktivität.

------------------------------------------------------------------------------------------------------
1Theobald, O. Machine Learning For Absolute Beginners: A Plain English Introduction (Second Edition) (Machine Learning From Scratch Book 1) (p. 24). Scatterplot Press. Kindle Edition.
Konstan, J., Terveen, L., Human-centered recommender systems: Origins, advances, challenges, and opportunities, AI Magazine, 42(3), 31-42, 2021

This page has paths:

This page references: