1. Maschinelles Lernen (ML)
Maschinelles Lernen ist ein Teilbereich der KI, bei dem Computer aus Daten lernen, ohne explizit programmiert zu werden.
Es wird in mehrere Lernmodelle unterteilt welche die KI für verschiedene Anwendungen unterschiedlich anpassen,
die wichtigsten Lernmodelle sind die folgenden:
Überwachtes Lernen
Vereinfacht: Überwachtes Lernen ist wie das Lernen mit einem Lehrer, der dir sagt, ob deine Antworten richtig oder falsch sind.
Definition: Beim überwachten Lernen lernt der Computer aus einem Datensatz, der Eingaben (Features) und die entsprechenden Ausgaben (Labels) enthält.
Beispiel: Eine E-Mail-Filtersoftware, die lernt, E-Mails als „Spam“ oder „Nicht-Spam“ zu klassifizieren.
Verstärkendes Lernen
Definition: Beim verstärkenden Lernen lernt ein Agent (z.B. ein Roboter oder ein Computerprogramm) durch Belohnungen und Bestrafungen, wie er in einer Umgebung handeln soll.
Beispiel: Ein Computerprogramm (z.B. ein Schachbot), das lernt, ein Spiel zu spielen, indem es Punkte (Belohnungen) erhält, wenn es gute Züge macht.
Unüberwachtes Lernen
Vereinfacht: Unüberwachtes Lernen ist wie das Lernen ohne Lehrer. Die KI findet selbst heraus, welche Muster in den Daten existieren.
Definition: Beim unüberwachten Lernen versucht der Computer, Muster und Zusammenhänge in Daten explorativ⁵, selbständig und ohne Aufsicht zu erkennen.
Beispiel: Ein Algorithmus, der Kunden in verschiedene Gruppen (Cluster¹⁰) basierend auf ihrem Kaufverhalten einteilt.
2. Neuronale Netze
Neuronale Netze sind ein wichtiger Bestandteil des maschinellen Lernens, insbesondere bei der Verarbeitung komplexer Daten wie Bilder oder Sprache.
Definition: Ein neuronales Netz besteht aus Schichten von Knoten (Neuronen), die ähnlich wie das menschliche Gehirn miteinander verbunden sind.
Funktionsweise:
Eingabeschicht: Nimmt die Eingabedaten auf.
Versteckte Schichten: Verarbeiten die Eingaben durch Gewichte und Aktivierungsfunktionen.
Ausgabeschicht: Liefert das Ergebnis (z.B. eine Klassifikation⁶).
Arten von Neuronalen Netzen:
Feedforward Neural Network: Die Daten bewegen sich nur in eine Richtung, von den Eingabeknoten zu den Ausgabeknoten.
Convolutional Neural Network (CNN): Besonders gut für die Verarbeitung von Bildern, da sie spezielle Schichten haben, die auf Mustererkennung spezialisiert sind.
Recurrent Neural Network (RNN): Gut für die Verarbeitung von sequenziellen⁷ Daten wie Text oder Sprache, da sie Informationen aus vorherigen Schritten behalten können.
3. Wichtige Konzepte
Diese Konzepte stellen die Funktionsfähigkeit und Genauigkeit von Modellen sicher, indem sie entscheiden welche Neuronen aktiviert werden. Sie überwachen das Modelltraining und die Validierung⁸ und finden ein Gleichgewicht zwischen Überanpassung und Unteranpassung.
Aktivierungsfunktionen
Definition: Aktivierungsfunktionen entscheiden, ob ein Neuron „feuert“ (aktiviert wird) oder nicht.
Beispiele:
Sigmoid: Wandelt Eingaben in Werte zwischen 0 und 1 um.
ReLU (Rectified Linear Unit): Wandelt negative Werte in 0 um, positive bleiben gleich.
Training und Validierung
Definition: Training ist der Prozess, bei dem ein Modell aus Daten lernt. Validierung überprüft, wie gut das Modell mit neuen, unsichtbaren Daten arbeitet.
Prozess:
Trainingsphase: Das Modell lernt aus einem Trainingsdatensatz.
Validierungsphase: Das Modell wird mit einem Validierungsdatensatz getestet.
Testphase: Das Modell wird mit einem Testdatensatz endgültig bewertet.
Überanpassung (Overfitting) und Unteranpassung (Underfitting)
Überanpassung: Das Modell ist zu stark an den Trainingsdaten orientiert und funktioniert schlecht mit neuen Daten.
Unteranpassung: Das Modell ist nicht gut genug, um die zugrunde liegenden Muster in den Daten zu erfassen.
4. Beispiele und Funktionsweise von Algorithmen
Maschinelles Lernen nutzt verschiedene Algorithmen um Werte vorherzusagen, oder um Daten in Gruppen zu teilen.
Jeder Algorithmus hat spezielle Regeln, die ihm helfen, aus den Daten zu lernen und Ergebnisse zu liefern.
Lineare Regression
Ziel: Vorhersage eines kontinuierlichen⁹ Werts.
Beispiel: Vorhersage des Preises eines Hauses basierend auf Größe, Lage, etc.
Funktionsweise: Findet die beste gerade Linie, die die Beziehung zwischen den Eingabewerten und dem Zielwert beschreibt.
k-Means Algorithmus (K-means Clustering)
Ziel: Gruppierung von Daten mit ähnlichen Eigenschaften.
Beispiel: Segmentierung von Kunden basierend auf Kaufverhalten.
Funktionsweise: Teilt die Daten in K Gruppen ein, indem es die Mittelpunkte der Cluster wiederholend anpasst.
Q-Learning
Ziel: Lernen, wie man Entscheidungen trifft, um die höchste Belohnung zu erzielen.
Beispiel: Ein Agent lernt, ein Spiel zu spielen, indem er für gute Züge belohnt wird.
Funktionsweise: Der Agent aktualisiert eine Tabelle (Q-Tabelle), die die erwarteten Belohnungen für jede Aktion in jedem Zustand speichert.