# df.join()

`df.join()` ist eine Methode in Pandas, mit der zwei DataFrames basierend auf dem Index oder auf bestimmten Spalten kombiniert werden. Es eignet sich gut, wenn man Daten zusammenführen will, die über dieselben Indexwerte verfügen, beispielsweise Daten über verschiedene Aspekte eines Objekts oder einer Person.  

### Syntax

```python
df1.join(df2, on=None, how='left', lsuffix='', rsuffix='', sort=False)
```

- **`df2`**: Der zweite DataFrame, den man mit `df1` verbinden möchte.
- **`on`**: Falls man Spalten statt des Indexes verwenden möchte, kann hier eine gemeinsame Spalte angegeben werden.
- **`how`**: Bestimmt die Art des Joins. Standardmäßig ist es ein *left join*, d.h., alle Zeilen von `df1` werden beibehalten, und passende Zeilen von `df2` werden hinzugefügt. Weitere Optionen sind `right`, `inner`, und `outer`.
- **`lsuffix` und `rsuffix`**: Falls beide DataFrames Spalten mit denselben Namen haben, kann man sie suffixieren, um Namenskonflikte zu vermeiden.

### Beispiel

Angenommen, `df1` enthält Kundennamen und `df2` deren Bestellungen, die beide denselben Index (z.B. `KundenID`) haben:

In [1]:
import pandas as pd

# DataFrames erstellen
df1 = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie']}, index=[1, 2, 3])
df2 = pd.DataFrame({'Order': ['Order1', 'Order2', 'Order3']}, index=[1, 2, 3])

# Join basierend auf dem Index
df_joined = df1.join(df2)

print(df_joined)

      Name   Order
1    Alice  Order1
2      Bob  Order2
3  Charlie  Order3


### Zusammenfassung

- `df.join()` ist praktisch für das Kombinieren von Daten, die denselben Indexwerten entsprechen.
- Wenn Indexe unterschiedlich sind oder Daten in einer Spalte gemeinsam genutzt werden sollen, ist [pd.merge()](pd.merge.ipynb) eine bessere Alternative.