# df.apply()

In Pandas wird `apply()` verwendet, um eine Funktion auf jedes Element, jede Zeile oder jede Spalte eines DataFrames oder einer Serie anzuwenden. Die Methode ist flexibel und wird vor allem dann eingesetzt, wenn komplexe Berechnungen oder Transformationen auf alle Zeilen oder Spalten ausgeführt werden sollen.

### Grundlegende Anwendung von `apply()`

- **Auf eine Spalte angewendet:** Die Funktion wird auf jedes Element in dieser Spalte angewendet.
- **Auf eine Zeile angewendet:** Die Funktion wird auf jede Zeile angewendet, häufig für Berechnungen, die mehrere Spalten betreffen.

### Parameter
- `axis=0`: Funktion wird auf jede Spalte angewendet (Standard).
- `axis=1`: Funktion wird auf jede Zeile angewendet.

### Beispiele

1. **Funktion auf eine Spalte anwenden**

In [6]:
import pandas as pd

# Beispiel DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [10, 20, 30]})

# Quadrat jedes Elements in Spalte 'A'
df['A_squared'] = df['A'].apply(lambda x: x**2)
print(df)

   A   B  A_squared
0  1  10          1
1  2  20          4
2  3  30          9


2. **Funktion auf jede Zeile anwenden**

In [7]:
# Summe der Werte von Spalte A und B in jeder Zeile berechnen
df['A_B_sum'] = df.apply(lambda row: row['A'] + row['B'], axis=1)
print(df)

   A   B  A_squared  A_B_sum
0  1  10          1       11
1  2  20          4       22
2  3  30          9       33


### Zusammengefasst

`apply()` ist sehr praktisch, wenn du:
- **individuelle Berechnungen oder Transformationen** auf alle Elemente einer Spalte oder Zeile anwenden musst.
- **komplexere Operationen** brauchst, die mehrere Spalten betreffen.

In diesen Fällen ist `apply()` eine flexible Lösung für DataFrames.

# Alternativen zu df.apply():

Alternativen zu `apply()` die oft schneller sind, insbesondere bei großen DataFrames:

1. **Vektorisierte Operationen**:
   - Direkt auf Spalten angewendet, z. B. `df['A'] + df['B']`.
   - Funktioniert schneller, da es auf niedrigster Ebene optimiert ist.

<br>

2. **[np.vectorize()](np.vectorize.ipynb) (NumPy)**:
   - Wandelt eine Funktion in eine vektorisierte Form um und ist oft effizienter.
   - Beispiel: `df['A_squared'] = np.vectorize(lambda x: x**2)(df['A'])`

<br>

3. **[np.where()](np.where.ipynb) (NumPy)**:
   - Für bedingte Zuweisungen in Arrays, z.B. `df['new_col'] = np.where(df['A'] > 1, 'Yes', 'No')`.

<br>

4. **[.map()](../../../Python/Zentral_Ordner/Funktionen_und_Methoden/map.ipynb) (für Series)**:
   - Besonders für Mapping und Transformationen von Werten einer einzelnen Spalte geeignet, z.B. `df['A'].map({1: 'one', 2: 'two'})`.

<br>

5. **[.transform()](df.transform.ipynb)**:
   - Ermöglicht eine transformation auf Series oder DataFrames und kann schneller als `apply()` sein.
   - Beispiel: `df[['A', 'B']].transform(lambda x: x**2)`.

<br>

6. **[List Comprehensions](../../../Python/Zentral_Ordner/Konstrukte/list_comprehension.ipynb)**:
   - Für einfache Transformationen oder Berechnungen in Spalten.
   - Beispiel: `df['A_squared'] = [x**2 for x in df['A']]`

Diese Alternativen verbessern die Geschwindigkeit oft signifikant und sind spezifisch für unterschiedliche Anwendungsfälle geeignet.