Unüberwachtes Lernen

Beim unüberwachten Lernen wird weder mit Labels noch mit vordefinierten Kategorien gearbeitet. Auch wird keine Belohnung, wie wir dies vom verstärkenden Lernen kennen, eingesetzt. Stattdessen analysiert ein ML-System in der Trainingsphase ihm vorgelegte Daten und versucht, darin Muster zu erkennen. Die erkannten Muster nutzt das System, um darauffolgend so genannte Cluster zu bilden. Cluster sind Einheiten oder Kategorien von Daten, die eine ähnliche Struktur aufweisen.

Schauen wir uns auch dies an einem Beispiel an: Ein ML-System soll durch unüberwachtes Lernen darauf trainiert werden, Bilder von Zitronen, Bananen und Birnen zu unterscheiden. Wir Menschen wissen, welches die jeweiligen Alleinstellungsmerkmale der drei Früchte sind. Beim unüberwachten Lernen möchten wir aber, dass das System ohne unser Eingreifen Cluster bildet. Ein Training eines solchen Systems könnte wie folgt aussehen:

Schritt 1: Das System erhält ein erstes Bild, das analysiert wird. Weil keine Cluster vorliegen, zu denen das Bild passen könnte, wird ein neuer Cluster gebildet.

Schritt 2: Ein zweites Bild wird analysiert. Bestimmte analysierte Merkmale (hier: Farbe) passen zu einem bestehenden Cluster. Andere Merkmale (hier: Form) passen nicht. Es wird ein neuer Cluster gebildet.

Schritt 3: Das dritte analysierte Bild weist viele Merkmale (Form, Farbe) eines bestehenden Clusters auf und wird diesem zugewiesen.

Schritt 4: Das vierte analysierte Bild weist zwar ähnliche Merkmale wie ein bestehendes Cluster auf, jedoch erkennt das System feine Unterschiede in Farbe und Form. Es wird wiederum ein neuer Cluster gebildet.

Auf den ersten Blick scheint unüberwachtes Lernen ein sehr mächtiges Instrument zu sein, denn bei dieser Lernmethode braucht die Maschine keinen Menschen, die ihm ein Feedback oder vorkategorisierte Trainingsdaten gibt. Muster können mit unüberwachtem Lernen automatisch erkannt werden, ohne dass im Vorfeld Informationen zu den Kategorien vorliegen. In der Praxis ist es jedoch so, dass Ansätze des unüberwachten Lernens lediglich für bestimmte Anwendungsbereiche gut funktionieren. Weil kein Feedback durch den Menschen erfolgt, kann es schnell vorkommen, dass eine nicht ganz reife Zitrone als Birne erkannt wird, oder dass von Grunde auf Cluster gebildet werden, die nicht nach den vom Menschen vorgesehenen Merkmalen kategorisieren.

Aus diesem Grund werden die Methoden des maschinellen Lernens oft miteinander kombiniert, um die Vorzüge der jeweiligen Verfahren optimal zu nutzen.