# Programmieraufgaben – Python

## Native Python Data Structures

#### Aufgabe 1: 
- Implementiere eine einfache Telefonbuch-Suche mit:
    - Liste von Tupeln (name, nummer)
    - Dictionary {name: nummer}
    
- Vergleiche die Suchzeit


#### Aufgabe 2:

- Zähle, wie oft Wörter in einem Text vorkommen. Lass dir das Ergebnis als Dictionary ausgeben.
- Bei Sonderzeichen im Text, verwende `re`- Modul (`.findall()`)

#### Aufgabe 3:

- Implementiere eine Notenskala ("A", "B", ...) mit Dictionary und Liste, und zeige den Unterschied in Zugriffsgeschwindigkeit.

#### Aufgabe 4: 

- Zeige, wie ein Dictionary automatisch doppelte Schlüssel überschreibt – im Gegensatz zu einer Liste, wo Duplikate manuell entfernt werden müssen.

#### Aufgabe 5: 

- Verwende ein Dictionary mit (x, y)-Koordinaten als Key, um z. B. eine Spielfeldkarte darzustellen.
- Implementiere ein Dictionary, das (Vorname, Nachname) als Schlüssel benutzt, um Infos einer Person schnell zu finden.

#### Aufgabe 6:

- Schreibe eine Funktion append_item(x, liste=[]), die x an liste anhängt.

- Zeige, wie mehrere Funktionsaufrufe dieselbe Liste verändern.

- Schreibe die gleiche Funktion mit None als Default-Wert und vergleiche das Verhalten.

## 🧮 Numpy

#### Aufgabe 1:

- Erstelle eine Liste mit 10 Millionen Zahlen.

    - Berechne die Summe mit sum().
    - Vergleiche mit np.sum().

#### Aufgabe 2:

- Erstelle eine große Liste und multipliziere jedes Element mit 2.

    - Einmal mit List Comprehension
    - Einmal mit Numpy Arrays

#### Aufgabe 3:

- Implementiere Matrix-Multiplikation für 2D-Listen von Hand.
- Vergleiche mit `np.dot()`.

#### Aufgabe 4:
- Berechne die Standardabweichung einer Liste:

    - Einmal mit statistics.stdev()
    - Einmal mit np.std()

- Vergleiche Geschwindigkeit und Genauigkeit

## 🐼 Pandas & Numpy

#### Aufgabe 1:

- Gegeben ist ein Datensatz mit fehlenden Werten. Bearbeite die Daten, indem du:

    - Fehlende Werte mit dem Mittelwert der Spalte ersetzt.
    - Die Daten nach einem bestimmten Kriterium filterst.
    - Eine neue Spalte basierend auf vorhandenen Spalten berechnest.

In [None]:
import pandas as pd
import numpy as np
 
df = pd.DataFrame({
    "name": ["Anna", "Ben", "Carla", "Daniel", "Eva"],
    "alter": [23, 25, np.nan, 29, 30],
    "einkommen": [3000, 3200, 2900, np.nan, 3100]
})

#### Aufgabe 2:

Gegeben ist ein DataFrame mit Verkäufen (Produkt, Datum, Umsatz).

- Gruppiere nach Produkt und berechne den durchschnittlichen Umsatz.

- Finde das Produkt mit dem höchsten Gesamtumsatz.

In [None]:
sales = pd.DataFrame({
    "produkt": ["A", "A", "B", "B", "C"],
    "datum": pd.date_range("2024-01-01", periods=5),
    "umsatz": [200, 220, 180, 210, 190]
})

#### Aufgabe 3: 

- Erstelle eine Zeitreihe mit Pandas für tägliche Temperaturdaten für 30 Tage (`.date_range()`).

- Glätte die Daten mit einem rollenden Mittelwert (rolling mean, Fenstergröße 7).

- Identifiziere den wärmsten Wochendurchschnitt.

#### Aufgabe 4:

- Vergleiche die Rechenzeit (z.B. mit timeit) beim Berechnen des Mittelwerts:

- Einmal mit einem Pandas Series Objekt.

- Einmal mit einem Numpy Array.

## 🔥 Pandas vs Polars 

#### Aufgabe 1:

- Installiere Polars mit: `pip install polars`

- Installiere Memory-Profiler: `pip install memory-profiler`

- Lade die CSV-Datei "predicted_data_3.csv" mit Pandas und mit Polars.

- Vergleiche die Ladezeit und den Speicherverbrauch.

#### Aufgabe 2:

- Gruppiere den Datensatz nach Bundesland ("blid") und berechne den Mittelwert für die Miete ("rent_sqm").

- Führe dies mit Pandas und Polars durch und vergleiche die Dauer.

#### Aufgabe 3: 

- Erstelle eine neue Spalte ("difference"), die die Differenz aus Kaltmiete ('mietekalt') und vorhergesagter Miete ('predicted_mietekalt'), indem du die Kaltmiete von der vorhergesagten Miete abziehst.

- Mache das einmal mit Pandas, einmal mit Polars.

#### Aufgabe 4:

- Sortiere die Spalte "predicted_mietekalt" mit absteigenden Werten.

- Vergleiche, wie lange das mit Pandas vs. Polars dauert.

## ⚡️ Dask vs Pandas

#### Aufgabe 1:

- Verwende Dask zum Laden der CSV-Datei "skincancer" und berechne den Mittelwert der Spalte "age".

- Vergleiche die Laufzeit mit Pandas.

#### Aufgabe 2:

- Zeige, wie Dask Tasks parallel ausführt (z.B. mit dem Dask Dashboard).