# pd.melt()

Siehe auch: [Wide vs. Long Format](../../Themen/Preprocessing/Wide_vs._Long.ipynb)

`pd.melt()` ist eine Funktion in der Pandas-Bibliothek, die verwendet wird, um einen **DataFrame von einem breiten Format in ein langes Format** umzuwandeln. Dies ist besonders nützlich, wenn man Daten für die Analyse oder Visualisierung umstrukturieren möchte, beispielsweise für statistische Analysen oder grafische Darstellungen.

### Grundkonzept

- **Breites Format**: In diesem Format sind mehrere Variablen (Spalten) in verschiedenen Spalten angeordnet. Oft wird dies in Tabellen verwendet, die Messungen für verschiedene Zeitpunkte oder Bedingungen enthalten.
- **Langes Format**: In diesem Format sind die Variablen in einer einzigen Spalte angeordnet, wobei eine zusätzliche Spalte erstellt wird, um den Typ der Variablen zu identifizieren. Dies erleichtert die Arbeit mit vielen Pandas-Funktionen, die oft besser mit langen Daten umgehen können.

### Syntax

```python
pd.melt(frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None, ignore_index=True)
```

### Parameter

- **`frame`**: Der DataFrame, den du umwandeln möchtest.
- **`id_vars`**: Spalten, die als Bezeichner verwendet werden (diese Spalten bleiben unverändert). Wenn nicht angegeben, werden alle Spalten als `value_vars` behandelt.
- **`value_vars`**: Die Spalten, die geschmolzen werden sollen. Wenn nicht angegeben, werden alle Spalten verwendet, die nicht in `id_vars` enthalten sind.
- **`var_name`**: Der Name der neuen Spalte, die die Namen der `value_vars` speichert.
- **`value_name`**: Der Name der neuen Spalte, die die Werte speichert. Standardmäßig ist dies `'value'`.
- **`ignore_index`**: Wenn `True`, wird der Index im Ergebnis neu nummeriert.

### Beispiel

In [1]:
import pandas as pd

# Beispiel-DataFrame im breiten Format
df = pd.DataFrame({
    'ID': [1, 2],
    'Januar': [100, 200],
    'Februar': [150, 250],
    'März': [200, 300]
})

print("Ursprünglicher DataFrame:")
print(df)

# DataFrame in ein langes Format umwandeln
melted_df = pd.melt(df, id_vars=['ID'], var_name='Monat', value_name='Wert')

print("\nDataFrame im langen Format:")
print(melted_df)

Ursprünglicher DataFrame:
   ID  Januar  Februar  März
0   1     100      150   200
1   2     200      250   300

DataFrame im langen Format:
   ID    Monat  Wert
0   1   Januar   100
1   2   Januar   200
2   1  Februar   150
3   2  Februar   250
4   1     März   200
5   2     März   300


### Zusammenfassung

- `pd.melt()` ist eine nützliche Methode, um Daten von einem breiten in ein langes Format umzuwandeln.
- Dies erleichtert Analysen und Visualisierungen, da viele Pandas-Methoden und Plotting-Bibliotheken (wie Matplotlib und Seaborn) besser mit langen Daten arbeiten können.
- Durch die Verwendung von `id_vars` und `value_vars` kannst du steuern, welche Spalten unverändert bleiben und welche geschmolzen werden sollen.