# df.stack() und df.unstack()

Die Methoden **`df.stack()`** und **`df.unstack()`** in Pandas werden verwendet, um DataFrames in **[hierarchischen (mehrdimensionalen) Indizes](Multiindex.ipynb)** umzustrukturieren. 

## Überblick

- **`stack()`**: Wandelt Spalten in Zeilen um, wodurch ein DataFrame von einem **weiten Format** in ein **langes Format** überführt wird. Das Resultat ist ein DataFrame mit einem hierarchischen Zeilenindex.
- **`unstack()`**: Ist die Umkehrung von `stack()`. Sie wandelt einen hierarchischen Zeilenindex in Spalten um, was von einem **langen Format** zurück zu einem **weiten Format** führt.

Diese Methoden sind besonders hilfreich, wenn man mit **mehrdimensionalen oder verschachtelten Daten** arbeitet, wie z. B. Zeitreihen mit mehreren Variablen pro Zeitstempel.

## Beispiel mit `stack()` und `unstack()`

#### Beispiel-DataFrame

Stellen wir uns einen DataFrame mit zwei Ebenen im Spaltenindex vor:

In [1]:
import pandas as pd

# Beispiel-DataFrame mit mehrdimensionalem Spaltenindex
df = pd.DataFrame({
    ('2023', 'Umsatz'): [100, 200],
    ('2023', 'Kosten'): [50, 80],
    ('2024', 'Umsatz'): [300, 400],
    ('2024', 'Kosten'): [150, 160]
}, index=['Produkt A', 'Produkt B'])

print("Ursprünglicher DataFrame:")
print(df)

Ursprünglicher DataFrame:
            2023          2024       
          Umsatz Kosten Umsatz Kosten
Produkt A    100     50    300    150
Produkt B    200     80    400    160


### `stack()`

Die Methode **`stack()`** verschiebt eine Ebene des Spaltenindex in die Zeilen, was zur Umstrukturierung der Daten ins [Long Format](../../Themen/Preprocessing/Wide_vs._Long.ipynb) führt.

In [7]:
stacked_df = df.stack(future_stack=True) # Vermeidet Future Warning
print("\nDataFrame nach Anwendung von stack():")
print(stacked_df)


DataFrame nach Anwendung von stack():
                  2023  2024
Produkt A Umsatz   100   300
          Kosten    50   150
Produkt B Umsatz   200   400
          Kosten    80   160


### `unstack()`

Die Methode **`unstack()`** kehrt diesen Prozess um, indem sie eine Indexebene aus den Zeilen zurück in die Spalten ([Wide Format](../../Themen/Preprocessing/Wide_vs._Long.ipynb)) verschiebt.

In [6]:
unstacked_df = stacked_df.unstack()
print("\nDataFrame nach Anwendung von unstack():")
print(unstacked_df)


DataFrame nach Anwendung von unstack():
            2023          2024       
          Umsatz Kosten Umsatz Kosten
Produkt A    100     50    300    150
Produkt B    200     80    400    160


- Das `unstack()` hat die hierarchische Zeilenebene wieder in den Spaltenindex verschoben und den DataFrame in ein breites Format zurückgeführt.

### Praktische Anwendung und Parameter

- **`stack(level=-1)`**: Stellt die unterste Ebene des Spaltenindex in den Zeilenindex um. Du kannst `level` anpassen, um eine andere Ebene des Spaltenindex zu verschieben.
- **`unstack(level=-1)`**: Macht das Gegenteil, indem es die unterste Ebene des Zeilenindex in den Spaltenindex verschiebt. Auch hier kann `level` angepasst werden.

### Zusammengefasst

- **`stack()`** verwandelt Spalten in Zeilen, was nützlich ist, um Daten in ein langes Format zu bringen.
- **`unstack()`** transformiert Zeilen in Spalten, ideal zum Erstellen eines weiten Formats.
- Beide Methoden helfen bei der Arbeit mit hierarchischen Indizes und erleichtern die Neuorganisation komplexer Daten.