# df.pivot()

Siehe auch: [Wide vs. Long Format](../../Themen/Preprocessing/Wide_vs._Long.ipynb)

Die `df.pivot()`-Methode in Pandas wird verwendet, um einen DataFrame in ein **breites Format** umzuwandeln, indem Spalten- und Zeilen-Indizes neu strukturiert werden. Sie eignet sich ideal, wenn man eine **Tabelle von einem langen Format in ein breites Format** bringen möchte, wobei Werte zu neuen Spalten gruppiert werden.

### Grundstruktur

Die `pivot()`-Methode erfordert drei Argumente:

- **`index`**: Die Spalte, die als Zeilenindex verwendet wird.
- **`columns`**: Die Spalte, die die neuen Spaltennamen bestimmt.
- **`values`**: Die Spalte, die die Werte für die neuen Spalten enthält.

### Syntax

```python
df.pivot(index='Index_Spalte', columns='Spalten_Spalte', values='Werte_Spalte')
```

### Beispiel

Angenommen, wir haben einen DataFrame im langen Format, der Verkäufe für verschiedene Produkte in verschiedenen Monaten enthält:

In [1]:
import pandas as pd

# Beispiel-DataFrame im langen Format
df = pd.DataFrame({
    'Produkt': ['Apfel', 'Apfel', 'Banane', 'Banane', 'Orange', 'Orange'],
    'Monat': ['Januar', 'Februar', 'Januar', 'Februar', 'Januar', 'Februar'],
    'Verkauf': [100, 150, 200, 250, 300, 350]
})

print("Ursprünglicher DataFrame:")
print(df)

Ursprünglicher DataFrame:
  Produkt    Monat  Verkauf
0   Apfel   Januar      100
1   Apfel  Februar      150
2  Banane   Januar      200
3  Banane  Februar      250
4  Orange   Januar      300
5  Orange  Februar      350


Wir können `pivot()` verwenden, um diesen DataFrame in ein breites Format umzuwandeln, sodass die `Monat`-Werte zu Spalten werden und die Verkaufszahlen in diesen Spalten stehen.

In [2]:
# Anwendung von pivot(), um den DataFrame umzuformen
pivot_df = df.pivot(index='Produkt', columns='Monat', values='Verkauf')
print("\nDataFrame nach Anwendung von pivot():")
print(pivot_df)


DataFrame nach Anwendung von pivot():
Monat    Februar  Januar
Produkt                 
Apfel        150     100
Banane       250     200
Orange       350     300


### Erklärung der Ausgabe

- **`index='Produkt'`**: Die `Produkt`-Spalte wird zur Zeilenbeschriftung.
- **`columns='Monat'`**: Die `Monat`-Spalte wird zur Spaltenüberschrift.
- **`values='Verkauf'`**: Die Werte in der `Verkauf`-Spalte füllen den DataFrame.

### Wichtige Hinweise

- **Eindeutige Kombinationen**: `pivot()` erfordert, dass jede Kombination aus `index` und `columns` genau einen Wert in `values` hat. Wenn es mehrere Werte gibt, entsteht ein Fehler. In solchen Fällen kannst du stattdessen [pivot_table()](df.pivot_table.ipynb), [pd.melt()](pd.melt.ipynb), oder [df.stack()](df.stack_unstack.ipynb) verwenden, um Aggregationsfunktionen zu definieren.

### Zusammenfassung

- **`pivot()`** ist hilfreich, um Daten von einem langen Format in ein breites Format zu transformieren.
- Es funktioniert gut, wenn jede Kombination aus `index` und `columns` einen eindeutigen Wert hat.
- Für komplexere Aggregationen und Berechnungen ist **`pivot_table()`** besser geeignet.