# Long Short-Term Memory (LSTM)

LSTM (Long Short-Term Memory) ist ein spezieller Typ von **Recurrent Neural Network (RNN)**, der entwickelt wurde, um das Problem des **Langzeitgedächtnisses** in neuronalen Netzen zu lösen. Herkömmliche RNNs haben Schwierigkeiten, sich über längere Sequenzen hinweg an Informationen zu erinnern, und leiden oft an dem sogenannten **Vanishing Gradient Problem**, wodurch sie wichtige Informationen aus früheren Zeitschritten "vergessen" oder nicht gut verarbeiten können.

### Hauptmerkmale von LSTM:

1. **Gedächtniszellen (Memory Cells)**: LSTM-Netzwerke bestehen aus speziellen Zellen, die über längere Zeiträume Informationen speichern können. Diese Zellen können Informationen je nach Bedarf speichern, abrufen oder vergessen.

2. **Gating-Mechanismen**: LSTM hat drei Haupttore (Gates), die den Informationsfluss kontrollieren:
   - **Forget Gate**: Bestimmt, welche Informationen aus der Gedächtniszelle verworfen werden sollen.
   - **Input Gate**: Kontrolliert, welche neuen Informationen in die Gedächtniszelle aufgenommen werden.
   - **Output Gate**: Entscheidet, welche Informationen aus der Gedächtniszelle ausgegeben und weitergegeben werden.

3. **Langzeit- und Kurzzeitspeicher**: LSTMs sind in der Lage, sowohl Informationen über kürzere als auch über längere Zeiträume zu speichern und abzurufen, was sie besonders geeignet für Aufgaben macht, bei denen die Reihenfolge und der zeitliche Verlauf der Daten wichtig sind.

### Anwendungen:

- **Spracherkennung und -verarbeitung**: z. B. für automatische Übersetzung, Texterkennung, Sprachgenerierung.
- **Zeitreihenanalyse**: z. B. für Vorhersagen auf Basis von historischen Daten (Wettervorhersage, Aktienmärkte).
- **Videoanalyse**: z. B. zur Erkennung von Aktionen in Videos.
- **Robotik und Steuerung**: zur Verarbeitung von Sensordaten über einen Zeitraum.

### Beispiel:

In Python mit der Bibliothek `Keras` lässt sich ein einfaches LSTM-Modell so implementieren:

```python
from keras.models import Sequential
from keras.layers import LSTM, Dense

# LSTM-Modell erstellen
model = Sequential()

# LSTM-Schicht hinzufügen
model.add(LSTM(50, activation='relu', input_shape=(100, 1)))

# Dense-Schicht hinzufügen (voll verbundene Schicht)
model.add(Dense(1))

# Modell kompilieren
model.compile(optimizer='adam', loss='mean_squared_error')

# Modell zusammenfassen
model.summary()
```

In diesem Beispiel ist `LSTM(50)` eine LSTM-Schicht mit 50 Speicherzellen, die Zeitreihendaten verarbeitet.