# Python Crash Course


### 🧠 Technische Einführung in Jupyter Notebook

#### ⚙️ Was ist Jupyter?

Ein webbasierter **Notebook-Editor**, mit dem man **Python-Code ausführen**, **Markdown schreiben**, und **Visualisierungen interaktiv darstellen** kann.
Unterstützt viele Sprachen über sog. *Kernels* (z. B. `ipykernel` für Python).

---

#### 💡 Warum Jupyter?

| Vorteil               | Beschreibung                                                      |
| --------------------- | ----------------------------------------------------------------- |
| 🔁 Reproduzierbarkeit | Code, Output & Erklärung im selben Dokument                       |
| 🧪 Experimentieren    | Änderungen an einzelnen Zellen ohne Neustart des gesamten Skripts |
| 📊 Visualisierung     | Direktes Plotting mit `matplotlib`, `seaborn`, `plotly`, etc.     |
| 📚 Dokumentation      | Unterstützung für Markdown, LaTeX, Code-Kommentare                |

---

#### ⌨️ Wichtige Shortcuts

| Modus            | Taste           | Funktion                                 |
| ---------------- | --------------- | ---------------------------------------- |
| **Edit Mode**    | `Enter`         | Zelle bearbeiten                         |
| **Command Mode** | `Esc`           | Zelle auswählen (blau)                   |
|                  | `A`             | Zelle **oberhalb** einfügen              |
|                  | `B`             | Zelle **unterhalb** einfügen             |
|                  | `D, D`          | Zelle löschen                            |
|                  | `M`             | Zelle in **Markdown** umwandeln          |
|                  | `Y`             | Zelle in **Code** umwandeln              |
|                  | `Shift + Enter` | Zelle ausführen + nächste auswählen      |
|                  | `Ctrl + Enter`  | Zelle ausführen, Auswahl behalten        |
|                  | `Alt + Enter`   | Zelle ausführen + neue darunter einfügen |

---

#### 🧪 Nützliche Magic-Commands

| Befehl               | Zweck                                |
| -------------------- | ------------------------------------ |
| `%timeit`            | Zeitmessung einer Anweisung          |
| `%who` / `%whos`     | Zeigt aktuell definierte Variablen   |
| `%matplotlib inline` | Plots direkt im Notebook anzeigen    |
| `%%time`             | Gesamtzeit einer ganzen Zelle messen |
| `%debug`             | Nach Fehler interaktiver Debug-Modus |

---

#### 🧰 Beispiel-Workflow in Data Engineering

```python
# 1. Daten lesen
import pandas as pd
df = pd.read_csv("data.csv")

# 2. Übersicht anzeigen
df.info()

# 3. Plot erzeugen
import avon eine PDF, eine Folienversion, oder das Ganze als Jupyter Notebook?


---
---
---

Hier ist eine kleine **2-Minuten-Übung** 

---
#
# ⏱️ 2-Minuten-Challenge: Erste Schritte im Notebook

> Ziel: Tastenkürzel testen, Markdown & Code mischen, Plot erzeugen

#### 🧪 Aufgabe

1. **Füge eine neue Zelle ein** (Shortcut: `B`)
2. **Wechsle zu Markdown-Modus** (`M`) und schreibe eine Überschrift:

   ```markdown
   ## Mein erstes Notebook 🚀
   ```
3. **Füge darunter eine Code-Zelle ein** (`B` → `Y`) und führe folgenden Code aus:

   ```python
   import matplotlib.pyplot as plt
   plt.plot([1, 4, 2, 5, 3])
   plt.title("Mini-Testplot")
   plt.grid(True)
   plt.show()
   ```
4. Optional: Miss mit `%timeit` die Geschwindigkeit folgender Zeile:

   ```python
   %timeit sum([i for i in range(1000)])
   ```

---

💡 **Bonus:** Wer fertig ist, testet `A`, `D,D`, und `Shift+Enter` gezielt aus.
Ziel: sich sicher dur-Wordcount oder DataFrame mit Pandas).


# PYTHON

### 🧠 Basics
- print
- Kommentar

### print

In [34]:
print("Hallo Welt!")  # Einfacher Text
print(42)            # Zahl
print(3.14)          # Fließkommazahl

Hallo Welt!
42
3.14


In [35]:
# Mehrere Werte ausgeben
name = "Anna"
alter = 25
print("Name:", name, "Alter:", alter)  # Trennt Werte automatisch mit Leerzeichen

Name: Anna Alter: 25


In [36]:
# f-Strings (ab Python 3.6)
print(f"{name} ist {alter} Jahre alt.")

Anna ist 25 Jahre alt.


### Kommentar

In [37]:
# Das ist ein einzeiliger Kommentar

"""
Das ist ein mehrzeiliger Kommentar
(technisch gesehen ein String, der nicht zugewiesen wird)
"""

def funktion():
    """Docstring - Kommentar für Funktionen"""
    pass

### 🧠 Syntax‑Primer
- Literale • Zuweisung
- `if / for / while / match-case`
- List‑ & Dict‑Comprehension (wichtig für RDD Transforms)

#### Ein Literal ist ein fester Wert, der direkt in den Quellcode geschrieben wird

In [30]:
42          # Integer-Literal
3.14        # Float-Literal
"Hello"     # String-Literal
True        # Boolean-Literal
[1, 2, 3]   # Listen-Literal

[1, 2, 3]

#### Eine Variable ist ein Speicherort mit einem symbolischen Namen, der verschiedene Werte aufnehmen kann

In [31]:
# Zuweisung von Ganzzahlen, Fließkommazahlen, Strings, Listen, Dictionaries 
x = 42
pi = 3.14
name = "Arga"
liste = [1, 2, 3]
d = {"key": "value"}


### 🧪 Übung:

Was ist der Datentyp von folgenden Werten?

In [21]:
print(type(100))
print(type(3.5))
print(type("hello"))
print(type([1, 2, 3]))
print(type((1, 2)))
print(type({"a": 1}))

<class 'int'>
<class 'float'>
<class 'str'>
<class 'list'>
<class 'tuple'>
<class 'dict'>


### 

### ⚙️ Kontrollstrukturen: if / for / while / match-case

#### if-Bedingungen (Verzweigungen)

Steuert, ob ein Codeblock ausgeführt wird, basierend auf einer Bedingung.

In [31]:
x = 10

if x > 5:
    print("x ist größer als 5")
else:
    print("x ist klein")

x ist größer als 5


#### for-Schleife (Iteration über Sequenzen)

Führt Code für jedes Element in einer Liste, einem String, etc. aus.

#### ⚙️ Einfache Zählschleife 

In [32]:
for i in range(3):
    print("Schleife:", i)

Schleife: 0
Schleife: 1
Schleife: 2


####  ⚙️ Nested for (verschachtelt)

In [43]:
for x in range(3):
    for y in range(3):
        print(f"x={x}, y={y}")

x=0, y=0
x=0, y=1
x=0, y=2
x=1, y=0
x=1, y=1
x=1, y=2
x=2, y=0
x=2, y=1
x=2, y=2


#### ⚙️ Über eine Liste iterieren

In [41]:
namen = ["Anna", "Ben", "Clara"]

for name in namen:
    print(f"Hallo, {name}!")

Hallo, Anna!
Hallo, Ben!
Hallo, Clara!


#### ⚙️ Mit range(start, stop, step)

In [40]:
for zahl in range(10, 0, -2):
    print("Runterzählen:", zahl)

Runterzählen: 10
Runterzählen: 8
Runterzählen: 6
Runterzählen: 4
Runterzählen: 2


#### while-Schleife (Wiederholung bis Bedingung falsch ist)

Führt Code so lange aus, wie eine Bedingung True ist.

In [33]:
n = 0
while n < 3:
    print("While:", n)
    n += 1


While: 0
While: 1
While: 2


#### match-case (Pattern Matching, ab Python 3.10)

Vergleicht einen Wert mit verschiedenen Mustern (ähnlich wie switch-case in anderen Sprachen).

In [37]:
lang = "de"

match lang:
    case "en":
        print("Hello")
    case "de":
        print("Hallo")
    case "fr":
        print("Salut")
    case _:
        print("Language not supported")


Hallo


#### 🧪 Übung:
Gib alle ungeraden Zahlen zwischen 1 und 20 aus

In [44]:
for zahl in range(1, 21):
    if zahl % 2 != 0:
        print(zahl)


1
3
5
7
9
11
13
15
17
19


In [45]:
for zahl in range(1, 21, 2):
    print(zahl)

1
3
5
7
9
11
13
15
17
19


### ---

#### 🧪 Extra Übung : FizzBuzz (1 bis 100)
| Zahl                   | Ausgabe         |
| ---------------------- | --------------- |
| Vielfaches von 3       | `Fizz`          |
| Vielfaches von 5       | `Buzz`          |
| Vielfaches von 3 und 5 | `FizzBuzz`      |
| sonst                  | die Zahl selbst |


In [48]:
for i in range(1, 101):
    if i % 3 == 0 and i % 5 == 0:
        print("FizzBuzz")
    elif i % 3 == 0:
        print("Fizz")
    elif i % 5 == 0:
        print("Buzz")
    else:
        print(i)


1
2
Fizz
4
Buzz
Fizz
7
8
Fizz
Buzz
11
Fizz
13
14
FizzBuzz
16
17
Fizz
19
Buzz
Fizz
22
23
Fizz
Buzz
26
Fizz
28
29
FizzBuzz
31
32
Fizz
34
Buzz
Fizz
37
38
Fizz
Buzz
41
Fizz
43
44
FizzBuzz
46
47
Fizz
49
Buzz
Fizz
52
53
Fizz
Buzz
56
Fizz
58
59
FizzBuzz
61
62
Fizz
64
Buzz
Fizz
67
68
Fizz
Buzz
71
Fizz
73
74
FizzBuzz
76
77
Fizz
79
Buzz
Fizz
82
83
Fizz
Buzz
86
Fizz
88
89
FizzBuzz
91
92
Fizz
94
Buzz
Fizz
97
98
Fizz
Buzz


## 🧠 String Methoden

String-Methoden sind Funktionen, die speziell für Zeichenketten (str-Objekte) in Python zur Verfügung stehen. Sie ermöglichen die Manipulation, Analyse und Formatierung von Texten.

| **Python-Konstrukt**    | **Beschreibung**                                            | 💡 **Beispiel**           |
| ----------------------- | ----------------------------------------------------------- | ------------------------- |
| `.strip()`              | Entfernt Leerzeichen am Anfang und Ende eines Strings       | `"  data  ".strip()`      |
| `.lower()` / `.upper()` | Wandelt einen String in Klein- oder Großbuchstaben um       | `"Email@x.com".lower()`   |
| `.split()`              | Teilt einen String anhand eines Trennzeichens in Teile      | `"a@b.com".split("@")[1]` |
| `in`                    | Prüft, ob eine Teilzeichenkette im String enthalten ist     | `'abc' in "alphabet"`     |
| `f-Strings`             | Formatiert und kombiniert Variablen innerhalb eines Strings | `f"{vorname} {nachname}"` |


In [61]:
"       arga      ".strip()

'arga'

In [62]:
"MAX.MUSTERMANN@GMAIL.COM".lower()

'max.mustermann@gmail.com'

In [63]:
"a@b.com".split("@")[1]

'b.com'

In [65]:
"a@b.com".split("@")[0]

'a'

In [66]:
'abc' in "alphabet"

False

In [67]:
'abc' in "bababababababcbababababa"

True

## 🧠 Funktionen & Module
- `def`, `return`, `*args`, `**kwargs`
- Imports (z. B. `os`, `sys`, `pathlib`, `pandas`)

#### ⚙️ Was ist eine Funktion in Python?

Eine Funktion ist ein benannter, wiederverwendbarer Block aus Code, der eine bestimmte Aufgabe ausführt.

Du kannst sie einmal definieren und beliebig oft aufrufen – oft mit Parametern und Rückgabewert.

#### Unterschied zwischen Funktion und Methode:

    Funktion:

        - Eigenständiger Aufruf, z. B. print("Hallo")
        - Gehört nicht zu einem bestimmten Objekt.

    Methode:

        - Wird an ein Objekt gebunden, z. B. "text".upper()
        - Wird mit einem Punkt (.) aufgerufen.

In [49]:
def fahrenheit_to_celsius(f):
    """Convert °F to °C"""
    return (f - 32) * 5/9

In [39]:
print_arga()

arga


In [50]:
fahrenheit_to_celsius(77)

25.0

In [53]:
fahrenheit_to_celsius(99)

37.22222222222222

#### ⚙️ Was ist *args in Python?

*args erlaubt dir, eine flexible Anzahl von Positionsargumenten an eine Funktion zu übergeben.
Du musst vorher nicht wissen, wie viele Argumente die Nutzer:innen beim Aufruf übergeben werden.

In [54]:
def funktion_name(*args):
    for wert in args:
        print(wert)

In [55]:
funktion_name("Arga", "Hendrik", "Sheikh", "Tilo", "Jan", "Ralf-Uwe","Julian")

Arga
Hendrik
Sheikh
Tilo
Jan
Ralf-Uwe
Julian


#### ⚙️ Was ist **kwargs in Python?

**kwargs steht für "keyword arguments" – es erlaubt dir, beliebig viele benannte Parameter (z. B. name=wert) in einer Funktion zu übergeben, ohne sie vorher definieren zu müssen.

In [57]:
def benutzerdaten(**kwargs):
    for key, value in kwargs.items():
        print(f"{key}: {value}")

In [58]:
benutzerdaten(name="Arga", alter=31, beruf="Data Engineer")

name: Arga
alter: 31
beruf: Data Engineer


#### Import
Der Befehl import wird verwendet, um externe Module oder Bibliotheken in dein Python-Programm zu laden, damit du deren Funktionen, Klassen oder Konstanten nutzen kannst.

In [77]:
from math import pi, sin
print(sin(pi / 2))

1.0


In [78]:
import math
print(math.sqrt(16))

4.0


In [79]:
#help('modules')

### 🐍 ✅ Python-Standardbibliothek

> Alle diese Module kannst du mit `import xyz` verwenden – **ohne `pip install`!**

Hier die wichtigsten:

---

#### 🔢 **Mathematik & Zahlen**

| Modul        | Funktion                                          |
| ------------ | ------------------------------------------------- |
| `math`       | Mathematische Funktionen (`sqrt`, `floor`, `sin`) |
| `random`     | Zufallszahlen (`randint`, `choice`)               |
| `statistics` | Mittelwert, Median, Standardabweichung            |

---

#### 🕒 **Datum & Zeit**

| Modul      | Funktion                    |
| ---------- | --------------------------- |
| `datetime` | Zeitstempel, Datumsrechnung |
| `time`     | Zeitmessung, Sleep          |
| `calendar` | Monats-/Kalenderfunktionen  |

---

#### 📂 **Dateisystem & Pfade**

| Modul     | Funktion                             |
| --------- | ------------------------------------ |
| `os`      | Dateisystem, Umgebungsvariablen      |
| `pathlib` | Objektorientierter Dateipfad-Zugriff |
| `shutil`  | Kopieren, Verschieben, Archivieren   |
| `glob`    | Files per Wildcards finden           |

---

#### 🛠️ **System, Tools & Debugging**

| Modul       | Funktion                        |
| ----------- | ------------------------------- |
| `sys`       | Systempfade, Argumente, Version |
| `argparse`  | Kommandozeilen-Argumente        |
| `pdb`       | Debugger                        |
| `traceback` | Stack-Traces analysieren        |

---

#### 🧵 **Concurrency (Nebenläufigkeit)**

| Modul                | Funktion           |
| -------------------- | ------------------ |
| `threading`          | Threads            |
| `multiprocessing`    | Parallele Prozesse |
| `concurrent.futures` | Executor API       |

---

#### 🔤 **Text & Zeichenketten**

| Modul      | Funktion                              |
| ---------- | ------------------------------------- |
| `string`   | Zeichenklassen, z. B. `ascii_letters` |
| `re`       | Reguläre Ausdrücke                    |
| `textwrap` | Zeilenumbruch & Formatierung          |

---

#### 🧪 **Testen & Mocken**

| Modul      | Funktion                        |
| ---------- | ------------------------------- |
| `unittest` | Unit-Tests                      |
| `doctest`  | Tests in Docstrings             |
| `timeit`   | Code-Messung (z. B. Laufzeiten) |

---

#### 🧩 **Datenformate & Serialisierung**

| Modul     | Funktion                 |
| --------- | ------------------------ |
| `json`    | JSON lesen/schreiben     |
| `csv`     | CSV-Dateien verarbeiten  |
| `pickle`  | Python-Objekte speichern |
| `sqlite3` | Leichte lokale Datenbank |

---

#### 🔒 **Security & Hashes**

| Modul     | Funktion                       |
| --------- | ------------------------------ |
| `hashlib` | MD5, SHA-Hashes                |
| `secrets` | Kryptografisch sicherer Zufall |

---


## 🧠 Datensammlungen
- Listen • Tupel • Dicts • Sets

### 1. Listen – geordnet, veränderbar, erlaubt Duplikate

In [1]:
fruits = ["apple", "banana", "cherry"]
fruits.append("banana")      # erlaubt Duplikate
fruits[0] = "pear"           # veränderbar (mutable)
print(fruits)

['pear', 'banana', 'cherry', 'banana']


Wichtige Methoden:

    .append(x) – fügt ans Ende an
    .insert(i, x) – fügt an Index ein
    .remove(x) – entfernt das erste Vorkommen
    .pop() – entfernt das letzte Element
    .sort() – sortiert (ändert die Liste selbst)
    sorted(list) – gibt eine sortierte Kopie zurück

#### Listen und Teillisten in Python (mit Slicing :)

In [44]:
meine_liste = [10, 20, 30, 40, 50, 60, 70, 80, 90]

Die Slicing-Syntax lautet: **liste[start:stop:schritt]**

    start: Index, bei dem der Ausschnitt beginnt (inklusive)
    stop: Index, bei dem der Ausschnitt endet (exklusive)
    schritt: Abstand zwischen Elementen (optional)

In [45]:
# Erste 3 Elemente
print(meine_liste[0:3])

[10, 20, 30]


In [46]:
# Elemente von Index 2 bis 5
print(meine_liste[2:6])

[30, 40, 50, 60]


In [49]:
# Jedes zweite Element
print(meine_liste[::2])

[10, 30, 50, 70, 90]


In [48]:
# Liste umkehren
print(meine_liste[::-1])

[90, 80, 70, 60, 50, 40, 30, 20, 10]


### 2. Tupel – geordnet, nicht veränderbar, erlaubt Duplikate

In [2]:
coordinates = (10, 20)
print(coordinates[1])       # Zugriff über Index

# Tupel mit nur einem Element:
single = (42,)              # das Komma ist wichtig!

20


**Warum Tupel?**

    - Datensicherheit (immutable)
    - Kann als Schlüssel in Dictionaries verwendet werden
    - Wird oft für Rückgaben von Funktionen verwendet: return (x, y)

### 3. Dictionaries (Dicts) – key-value pairs, ungeordnet bis Python 3.6, geordnet ab 3.7

In [4]:
person = {"name": "Alice", "age": 30}
print(person["name"])
person["city"] = "Berlin"     # Neues Paar hinzufügen

Alice


Nützliche Methoden:

    .keys() – alle Schlüssel
    .values() – alle Werte
    .items() – Paare (Key, Value)
    .get("key", "default") – sicherer Zugriff
    .update({...}) – mehrere Änderungen auf einmal

 ### 4. Sets – ungeordnet, nur eindeutige Werte

In [5]:
unique_numbers = {1, 2, 3, 2, 3, 3}
print(unique_numbers)         # → {1, 2, 3}

{1, 2, 3}


#### Nützliche Operationen:

In [7]:
a = {1, 2, 3}
b = {3, 4, 5}

a.union(b)

{1, 2, 3, 4, 5}

In [8]:
a.intersection(b)

{3}

In [9]:
a.difference(b) 

{1, 2}

#### Übungsaufgaben:
1. Erstelle eine Liste mit 5 Städtenamen und gib die ersten 3 aus
2. Erstelle ein Tupel mit deinen Geburtsdaten (Tag, Monat, Jahr)
3. Erstelle ein Dictionary mit 3 Produkten und ihren Preisen
4. Erstelle zwei Sets mit Zahlen und berechne Schnittmenge und Differenz
5. Wandle die Liste aus Aufgabe 1 in ein Set um - was passiert?

In [51]:
# 1
staedte = ["Berlin", "München", "Hamburg", "Köln", "Frankfurt"]
print(staedte[:3])

# 2
geburtstag = (18, 9, 1993)

# 3
produkte = {"Apfel": 0.99, "Brot": 2.49, "Milch": 1.19}

# 4
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a & b)  # {3, 4}
print(a - b)  # {1, 2}

# 5
staedte_set = set(staedte)  # Reihenfolge geht verloren, Duplikate würden entfernt werden
staedte_set

['Berlin', 'München', 'Hamburg']
{3, 4}
{1, 2}


{'Berlin', 'Frankfurt', 'Hamburg', 'Köln', 'München'}

## Error‑Handling & Debugging
- `try / except`, `raise`, `assert`


#### 🔐 try / except – Fehler sicher abfangen

    Mit try / except kann man Code ausführen, der Fehler verursachen könnte, ohne dass das ganze Programm abstürzt.

In [20]:
def div_100_by(x: int | float) -> float:
    """Teilt 100 durch x"""
    return 100 / x

def save(value: float) -> None:
    """Simuliert das Speichern des Ergebnisses."""
    print(f"[SAVE] Stored result: {value}")

def cleanup() -> None:
    """Aufräumarbeiten (z. B. Dateien schließen)."""
    print("[CLEANUP] Done")

def run_case(x):
    print(f"\n--- Test mit x = {x} ---")
    try:
        result = div_100_by(x)
    except ZeroDivisionError as e:           # spezifisch fangen!
        print(f"[WARN] Division durch Null: {e}")
        result = float("inf")                # Ersatzwert float("inf") erzeugt in Python den speziellen Gleit­komma­wert „Infinity“ (∞)
    else:
        save(result)                         # läuft nur ohne Fehler
    finally:
        cleanup()                            # läuft immer
    print(f"[RETURN] result = {result}")

# Zwei Durchläufe: einer klappt, einer wirft ZeroDivisionError
run_case(10)
run_case(0)


--- Test mit x = 10 ---
[SAVE] Stored result: 10.0
[CLEANUP] Done
[RETURN] result = 10.0

--- Test mit x = 0 ---
[WARN] Division durch Null: division by zero
[CLEANUP] Done
[RETURN] result = inf


### 🚨 raise – Fehler absichtlich auslösen

    Mit raise wirfst du bewusst eine Exception – z. B. wenn etwas nicht erlaubt, ungültig oder nicht implementiert ist.

In [16]:
def sqrt(x: float) -> float:
    if x < 0:
        raise ValueError(f"{x} ist negativ, keine reale Wurzel")
    return x ** 0.5

In [19]:
sqrt(-9)

ValueError: -9 ist negativ, keine reale Wurzel

In [22]:
assert response.status_code == 200, "API-Aufruf fehlgeschlagen"

NameError: name 'response' is not defined

#### ✅ assert – Annahmen im Code testen

    assert prüft eine Bedingung, und wirft automatisch einen Fehler, wenn sie nicht stimmt. Ideal zum Testen von Vorbedingungen.

In [23]:
age = -5
assert age >= 0, "Alter darf nicht negativ sein"

AssertionError: Alter darf nicht negativ sein

In [28]:
age = 5
assert age >= 0, "Alter darf nicht negativ sein"