# Deep Learning

Deep Learning ist ein Teilbereich des maschinellen Lernens (ML), der sich auf künstliche neuronale Netze mit vielen Schichten („deep neural networks“) stützt.
Die Idee: Inspiriert vom menschlichen Gehirn werden viele Schichten aus Neuronen (mathematischen Funktionen) miteinander verbunden, um komplexe Muster in Daten automatisch zu erkennen.

Im Gegensatz zu klassischen ML-Methoden erfordert Deep Learning oft weniger manuelle Feature-Engineering, da die Modelle relevante Merkmale selbst aus den Rohdaten extrahieren.

## Typische Anwendungsgebiete

* Computer Vision
* Bilderkennung, Objekterkennung, medizinische Bildanalyse, autonomes Fahren.
* Natürliche Sprachverarbeitung (NLP)
* Maschinelle Übersetzung, Chatbots, Textgenerierung, Sprachassistenten.
* Spracherkennung & -verarbeitung
* Sprachsteuerung (z. B. Siri, Alexa), Untertitelung, Echtzeitübersetzung.
* Empfehlungssysteme
* Personalisierte Vorschläge bei Netflix, YouTube oder Amazon.
* Zeitreihenanalyse
* Finanzmarktvorhersagen, Predictive Maintenance, Wetterprognosen.
* Generative Modelle: Bild-/Video-Generierung (GANs, Diffusion Models), Musik- und Textgenerierung.

## Zentrale Prinzipien

## Neuronale Netze

Im Zentrum des Deppe Learning sethen die **Neuronalen Netze** in ihrer einfachsten Form durch ein **Multi-Layer Perceptron** realisiert

### Funnktionsweise

Ein neuronales Netzwerk ist ein mathematisches Modell, das sich an der Funktionsweise des menschlichen Gehirns orientiert und dazu dient, Muster in Daten zu erkennen und Vorhersagen zu treffen. Es besteht aus vielen einzelnen Knoten, die man künstliche Neuronen nennt, und diese sind in Schichten organisiert. Die erste Schicht nimmt Eingabedaten entgegen, zum Beispiel die Pixelwerte eines Bildes oder die numerischen Merkmale einer Tabelle. Jedes Neuron dieser Schicht leitet die Informationen mit einem bestimmten Gewicht an die Neuronen der nächsten Schicht weiter. Diese Gewichte bestimmen, wie stark ein bestimmter Eingangswert das Ergebnis beeinflusst. Bevor die Signale weitergegeben werden, wird meist eine sogenannte Aktivierungsfunktion angewendet, die die Ausgaben auf einen bestimmten Wertebereich begrenzt und dafür sorgt, dass das Netzwerk auch komplexe, nichtlineare Zusammenhänge erfassen kann.

Die mittleren Schichten, auch _versteckte Schichten_ genannt, sind das Herzstück des Netzwerks. Sie kombinieren die Eingaben immer wieder neu und verdichten die Informationen so, dass Muster, Strukturen und Zusammenhänge sichtbar werden, die auf den ersten Blick verborgen sind. Schließlich gelangt die verarbeitete Information zur Ausgabeschicht, die das Ergebnis des gesamten Netzwerks liefert. Das kann eine Klassenzuordnung sein, etwa die Entscheidung, ob ein Bild eine Katze oder einen Hund zeigt, oder eine kontinuierliche Vorhersage, zum Beispiel die Schätzung eines Aktienkurses.

Damit ein neuronales Netzwerk diese Aufgabe zuverlässig erfüllen kann, muss es trainiert werden. Beim Training vergleicht man die vom Netzwerk ausgegebene Antwort mit der richtigen Lösung, die man bereits kennt. Die Abweichung zwischen beiden Werten wird als Fehler bezeichnet. Mithilfe eines mathematischen Verfahrens - der **Backpropagation** -  wird dieser Fehler Schicht für Schicht zurückgerechnet, um die Gewichte so anzupassen, dass das Netzwerk bei zukünftigen Eingaben näher an die richtige Antwort kommt. Dieser Vorgang wiederholt sich über viele tausend oder sogar Millionen von Beispielen, bis das Netzwerk die zugrunde liegenden Muster in den Daten erlernt hat.

Am Ende entsteht ein System, das aus den abstrakten Zahlen der Eingabe durch eine Vielzahl von Rechenschritten ein sinnvolles Ergebnis generieren kann, ohne dass jeder Schritt explizit vom Menschen programmiert werden musste. Die Stärke neuronaler Netzwerke liegt genau darin, dass sie selbständig Strukturen erkennen, die für uns schwer greifbar sind, und dass sie auf neue, bisher unbekannte Daten generalisieren können, solange diese den Mustern der Trainingsdaten ähneln.