# Einleitung

Dieser Kurs soll in die Statstik und Datenanalyse mit Python einführen. Sie lernen, wie Sie typische statistische Fragestellungen mit Python bearbeiten können und lernen das nötige Handwerkzeug, sprich die dafür nötigen Pakete (Module) und Funktionen kennen. Inhalt dieses Kurses sind vor allem das Einlesen und die Manipulation von Daten, die Visualisierung und deskriptive Beschreibung der Daten mit Hilfe verschiedener Plots, sowie statistischer Kennwerte. Des Weiteren werden wir uns in die Inferenzstatistik, mit Hilfe von Konfidenzintervallen, Hypothesentests und Varianzanalysen vorwagen.

## Warum Python?

Für die komputationale Bearbeitung wissenschaftlicher Probleme (vor allem im numerischen, mathematischen und statistischen Bereich) gibt es, so meint man, eigentlich mit [Matlab](https://de.mathworks.com/products/matlab.html) und der [OpenSource](https://de.wikipedia.org/wiki/Open_Source) Software [R](https://www.r-project.org/) ausreichend gute Möglichkeiten. Gerade im akademischen Umfeld, vor allem in den Sozialwissenschaften aber auch anderen Bereichen, in denen statistische Software eine wichtige Rolle spielt, hat sich R weitestgehend durchgesetzt. Die meisten wissenschaftlichen Beiträge in diesem Bereich werden in R-Pakete "gegossen" und können von der Community sofort eingesetzt werden. *Wieso also noch Python einsetzen?*

Vorweg sollte man sagen: man *muss* Python natürlich nicht einsetzen und in den meisten mathematischen und statistischen Einsatzgebieten ist es nicht besser oder schlechter als R oder andere Alternativen.

Zuerst hat vieles mit Vorlieben und Gewohnheit zu tun. Python ist eine *multiparadigmatische* Programmiersprache (Sie können in Python prozeduralen, objektorientierten und funktionalen Code schreiben), die für sehr viele Zwecke eingesetzt werden kann: Automatisierung und Skripting im Server Bereich, Backend Webentwicklung, GUI Programmierung, IoT-Geräte, mobile Apps und vor allem im Bereich Data Science und Deep Learning. Desweiteren hat Python unter anderem folgende Vorteile gegenüber manch anderen Programmiersprachen:
- Sie ist dazu entworfen worden, um leicht lesbar zu sein und einen guten Programmierstil von Anfang an zu erlernen.
- Sie ist auf leichte Erlernbarkeit ausgelegt (das macht sie auch zur Sprache der Wahl bei den meisten Programmiereinführungskursen)
- Sie hat ein sehr umfangreiches und tiefes Ökosystem (Auf [PyPi](https://pypi.org/) gibt es kaum ein Modul für ein Problem, das noch nicht gelöst wurde).
- Man kann mit ihr erheblich umfangreiche Aufgaben erledigen mit einem minimalen Aufwand.
- Durch ihre Popularität gibt es eine enorm große und sehr hilfsbereite Community.

Und genau dies sind die Hauptgründe, sich für Python auch in diesem Bereich zu entscheiden. Mit Python hat man eine Art Schweizer Taschenmesser, dass sich in fast allen IT Bereichen mühelos einsetzen lässt. Vor allem in der Industrie, außerhalb des akademischen Bereichs ist dies ein wichtiger Grund, weshalb Python vorwiegend eingesetzt wird.

## Voraussetzungen

Dies ist keine Einführung in die Statistik! Die im Kurs behandelten statistischen Konzepte sollten Ihnen zumindest ein Begriff sein. Auch ist es sehr hilfreich, wenn Sie schon einmal programmiert haben (z.B. in R) oder gar einen Einführungskurs in Python gemacht haben.

## Überblick über den Kurs:

- Die Mutter aller wissenschaftlichen Python Module: *NumPy*
- Daten Visualisieren: erste Schritte mit *Matplotlib*
- Daten einlesen und manipulieren mit *Pandas*
- Deskriptive und Inferenzstatistik mit *SciPy*
- Weitere Konzepte

# Kurze Einführung in Python

Diese kurze Einführung ersetzt nicht eine ordentliche Auseinandersetzung und umfassendere Einführung in Python, wie Sie sie z.B. von mir [hier](https://datenschauer.de/pythonkurs) finden können. Ich möchte aber dennoch versuchen, Ihnen die wichtigsten Programmierkonzepte in Python näherzubringen, damit Sie die nachfolgenden Kapitel verstehen können.

## einfachste Konzepte

Beginnen wir mit den wichtigsten Basisfunktionalitäten: Variablen, Zahlen, Operatoren, Strings, eingebaute Funktionen und Methoden.

### Zahlen und Operatoren

Python kann von Haus aus grundständige Rechenoperationen bewerkstelligen. Dabei stehen ihm Ganzahltypen `int` und Gleitkommazahlen `float` zur Verfügung.

In [4]:
# Addition
5 + 17

22

In [5]:
# Subtraktion
8967 - 9383

-416

In [6]:
# Multiplikation
78 * 65

5070

In [7]:
# Division gibt immer eine Gleitkommazahl zurück!
81 / 9

9.0

In [8]:
# Dezimalzahlen mit einem "Punkt" als Dezimaltrenner!
3.1415926 * 2.71828

8.539728332728

In [9]:
# Potenzen
2 ** 8

256

In [12]:
# Modulo Operator (Berechnung des Rests)
92 % 5

2

In [14]:
# Abrundungsfunktion (floor division)
92 // 5 # 92 / 5 -> 18.4

18

Python kennt zwar so etwas wie eine "Punkt-vor-Strich-Rechnung", aber für komplexere Berechnungen und der Übersicht halber kann man Klammern verwenden.

In [15]:
(90 / (67 - (3 ** 2) // 4))

1.3846153846153846

Neben diesen mathematischen Operatoren gibt es natürlich auch noch logische Operatoren, die einen Wahrheitswert `True` oder `False` zurück geben. Diese Operatoren sind die Vergleichsoperatoren (`==, <, >, <=, >=`), sowie die Operatoren zur logischen Verknüpfung (`and, or, not`).

In [17]:
not ((30 > 45) and ((12 / 3) == 4 or 5 <= 12))

True

### Variablen

Variablen werden mit einem Istgleich-Zeichen `=` instantiiert und initialisiert in einem. Der Name einer Variablen kann dabei jedes ASCII Zeichen annehmen, muss aber mit einem Buchstaben oder einem Unterstrich `_` beginnen. Mit der `print()` Funktion können Ausdrücke am Bildschirm ausgegeben werden.

In [3]:
meine_variable = 5

meine_variable

5

In [19]:
x = 8
y = 17
m = x + y
print(x + y, m)

25 25


## Funktionen

Funktionen können über ihren Namen, gefolgt von runden klammern und eventuellen Argumenten (= Parametern) aufgerufen werden: `funktionsname(arg1, arg2)`

Die Print-Funktion haben wir beispielsweise schon kennengelernt. Sie hat den Funktionsnamen "print" und nimmt als Argumente ein oder mehrere Strings entgegen, als Zeichenketten, die dann in der Standardausgabe (meist die Konsole oder in Jupyter Notebooks der Bereich unterhalb der Zelle) ausgegeben werden. Als Argumente dienen aber nicht nur direkte Strings, sondern auch alle Objekte und Rückgabewerte, die eine String Repräsentation haben.

In [6]:
print("Hallo Welt!")
print("Hallo", "Welt", "!")

Hallo Welt!
Hallo Welt !


In [9]:
# Weitere Beispiele von Funktionen:

max(4, 3, 9, 1) # gib das gröẞte Element zurück

9

```
    max       (4, 3, 9, 1)
     |           |    |
Funktionsname   Argumente
```

In [8]:
len("Hallo Welt!") # gib die Länge eines Objektes zurück

11

Funktionen lassen sich auch ineinander "verschachteln". Der Aufruf und die Rückgabe der einzelnen Funktionen erfolgt dann von "innen nach auẞen".

In [11]:
print(max(len("Hallo"), len("Welt")))

5


```
print( max ( len("Hallo"), len("Welt) ))
 |      |      |           |
 |       \     5           4 
 |        \    |          /
 |       max  (5,       4)
  \        |
   \       |
    print (5)
      |
      5
```

## Datenstrukturen

### Listen

Eine Liste legt man über Verwendung eckiger Klammern „[]“ an. Zwichen diese Klammern schreibt man durch ein Komma separiert die einzelnen Objekte, die in dieser Liste gespeichert werden sollen. Unsere erste Liste, die die Werte der gegebenen Antworten des ersten Items enthält, könnte demnach so aussehen:

In [1]:
item_1 = [3, 1, 1, 3, 1, 1, 5, 2, 2, 3, 4, 3, 5, 3, 5, 1, 5, 4, 4, 4]

Über den Klammernoperator `[]` kann man auf die eizelenen Werte (Indices) einer List zugreifen. Dabei sind Listen, wie auch Tupel *iterierbare* Objekte in Python.

Jedes iterierbare Objekt lässt sich der Reihe nach in einzelne Elemente zerlegen, die von vorne nach hinten über einen sog. Index durchnummeriert werden und über diese Nummern auch angesprochen werden können. Ähnlich wie bei einem langen Zug bei dem man vorne bei der Lok zu zählen beginnt und jedem weiteren Waggon eine Nummer n+1 gibt. Die Lok wäre der Index 0, der erste Waggon der Index 1, der zweite Waggon der Index 2 usw., bis zum letzten Waggon. Von vorne nach hinten gezählt ist aber die Lok das erste Bauteil, der erste Waggon das zweite usw.

![Index Zug](./img/index_zug.png)

Genauso zählt auch Python die Elemente eines Iterable durch. Das erste Element hat immer den Index 0, das zweite den Index 1 und das letzte hat den Index „Anzahl der Elemente minus 1“.

Um einen Index auszuwählen, bzw. auf ihn zuzugreifen, benutzt man den Klammer-Operator: zwei eckige Klammern „[]“, die hinten an das Iterable angesetzt werden. Die Syntax sieht folgendermaßen aus: `iterable[<index>]`.

In [5]:
print(item_1)
print(item_1[0]) # das erste Element
print(item_1[1]) # das zweite Element
print(item_1[10]) # das elfte Element usw.

[3, 1, 1, 3, 1, 1, 5, 2, 2, 3, 4, 3, 5, 3, 5, 1, 5, 4, 4, 4]
3
1
4


Diese Index Syntax mit den eckigen Klammern erlaubt es sogar, „von Hinten“ anzufangen zu zählen. Das letzte Element hätte somit den Index -1, das zweitletzte den Index -2 usw.

In [13]:
print(item_1[-1]) # das letzte Element
print(item_1[-5]) # das fünfte Element von "hinten"

4
1


Man kann auch Teile einer Liste "herausschneiden". Dies nennt man *Slicing*. Das Slicing erfolgt auch über den `[]`-Operator und hat folgende Syntax:
```
liste[ start : ende : schritte ]
```
**Achtung:** Bei Start und Ende handelt es sich um ein *halboffenes Intervall*. Der Start-Index ist immer inkludiert, der End-Index aber ausgeschlossen!

Man kann je nachdem Start, Ende und Schritte auch weggelassen:
- Lässt man Start weg, wird bei Index 0, also dem ersten Element begonnen.
- Lässt man Ende weg, so wird bis zum letzten Index + 1, bzw. `[-1]`, also dem letzten Element gegangen.
- Lässt man die Schritte weg, so wird "1" genommen, also jedes Element, ohne eines zu überspringen.

Anbei ein paar Beispiele.

In [6]:
items_2 = ["eins", "zwei", "drei", "vier", "fünf", "sechs", "sieben"]

print(items_2[2:5])
print(items_2[0:4])
print(items_2[:4])
print(items_2[3:-1])
print(items_2[3:])
print(items_2[:])
print(items_2[::2])
print(items_2[1:5:3])

['drei', 'vier', 'fünf']
['eins', 'zwei', 'drei', 'vier']
['eins', 'zwei', 'drei', 'vier']
['vier', 'fünf', 'sechs']
['vier', 'fünf', 'sechs', 'sieben']
['eins', 'zwei', 'drei', 'vier', 'fünf', 'sechs', 'sieben']
['eins', 'drei', 'fünf', 'sieben']
['zwei', 'fünf']


Listen in Python sind **extrem flexible** Datenstrukturen. Grundsätzlich kann man jede Art von Objekt auch in eine Liste packen (selbst wiederum Listen oder ganze Funktionen). Ausserdem ist es ein Leichtes, neue Objekte hinzuzufügen, Objekte an Ort und Stelle zu ändern, Onjekte zu löschen und auch die Elemente einer Liste zu sortieren.

Halten Sie sich folgende Beispiele vor Augen.

In [1]:
multilist = ["eins", 1, sum, True]

Können Sie sich folgenden Ausdruck erklären?

In [4]:
multilist[2]([multilist[1], multilist[-1]])

2

Das dritte Element von Multilist ist die Funktion `sum()`. Über die runden Klammern geben wir ihr ein Argument mit, das ein *Iterable* ist. Eine Liste ist zum Beispiel solch ein Iterable, also eine Objekt, über das *iteriert* werden kann, über das man also Schritt für Schritt hinweg gehen kann und jedes Element nacheinander einzeln zurückbekommt. Wir bilden also eine Liste als Argument mit den eckigen Klammern und stecken die zwei Elemente `multilist[1]` (das zweite Element, die Zahl "1") und `multilist[-1]` (das letzte Element, der Wahrheitswert `True`) hinein. Da der Wahrheitswert `True` immer auch als Zahl "1" interpretiert wird (genauso wie `False` immer als "0") ergibt die Summe von "1" und "1" eben "2".

Listenelemente kann man durch Zuweisung auch sehr leicht ersetzen.

In [7]:
items_2[2] = "neues Element"

items_2

['eins', 'zwei', 'neues Element', 'vier', 'fünf', 'sechs', 'sieben']

In [8]:
items_2[4:] = ["neu"] * 3

items_2

['eins', 'zwei', 'neues Element', 'vier', 'neu', 'neu', 'neu']

#### Wichtige Listen Methoden

Anhängen lassen sich neue Elemente mit der Methode `append()`.

In [9]:
items_2.append("wurde gerade angehängt")

items_2

['eins',
 'zwei',
 'neues Element',
 'vier',
 'neu',
 'neu',
 'neu',
 'wurde gerade angehängt']

Besteht eine Liste ausschließlich aus Elemente, die sich untereinander nach Größe vergleichen lassen, so kann man diese Liste auch sortieren. Dazu können die Funktion `sorted()` und die Methode `.sort()` benutzt werden.

Den Unterschied beider Funktionen sollte dieser Code klar machen:

In [22]:
ls = [3, 7, 2, 8, 1, 4]

print(sorted(ls))

print(ls)

ls.sort()

print(ls)

[1, 2, 3, 4, 7, 8]
[3, 7, 2, 8, 1, 4]
[1, 2, 3, 4, 7, 8]


Die Länge, also die Anzahl der Elemente einer Liste bekommt man über die Funktion `len()`.

In [23]:
len(ls)

6

#### Mehrere Dimensionen

Wenn man aber sämtliche Python Objekte in eine Liste packen kann, so kann man auch Listen selbst wieder in Listen packen. Wenn wir Listen miteinander verschachteln, so erreichen wir höhere Dimensionen.

In [18]:
listen = [
    ["00", "01", "02", "03"],
    ["10", "11", "12", "13"],
    ["20", "21", "22", "23"]
]

listen

[['00', '01', '02', '03'], ['10', '11', '12', '13'], ['20', '21', '22', '23']]

Beim Zugriff auf diese verschachtelten Listen müssen Sie pro Dimension eine Eckige Klammer eingeben. Schauen wir uns das kurz an einem Beispiel an:

In [19]:
print(listen[0][1])
print(listen[1][3])
print(listen[2][0])

01
13
20


```
      liste[0][1]
            |  |
            |  |
            |  |
           /    \
          /      \
         /        \
Index Liste =     Index Element =
= Index Zeile     = Index Spalte
```

Das ganze können wir jetzt natürlich noch weiter treiben. Wir könnten Listen von Listen wieder in einer Liste zusammenfassen, was dann ein dreidimensionales Objekt ergeben würde.

Hier wieder ein hoffentlich verständlicheres Beispiel:

In [20]:
listen = [
    [["000", "001", "002", "003"],
     ["010", "011", "012", "013"],
     ["020", "021", "022", "023"]],
    [["100", "101", "102", "103"],
     ["110", "111", "112", "113"],
     ["120", "121", "122", "123"]],
    [["200", "201", "202", "203"],
     ["210", "211", "212", "213"],
     ["220", "221", "222", "223"]],
]
print(listen[1][0][1])
print(listen[0][1][3])
print(listen[2][2][0])

101
013
220


Sie können auch einfach an einen Zauberwürfel, bzw. Rubic’s Cube denken:

Die einzelnen Schichten sind Gruppen von Listen (oder im Fall der Studie, die einzelnen Messzeitpunkte). Die einzelnen Zeilen sind die Listen von Elementen (in der Studie die gesammelten Codes eines Items). Die Spalten sind die einzelnen Elemente (bzw. in der Studie die Einzelcodes der Teilnehmer*innen).

![Zauberwürfel](img/rubics_cube.png)

Wenn Sie mathematisch denken, so ist eine Liste nur mit Elementen ein Vektor (oder eindimensionale Matrix), eine Liste mit weiteren Listen eine zweidimensionale Matrix, eine Liste mit ein oder mehreren zweidimensionalen Matrizen eine dreidimensionale Matrix und so weiter.

### Tupel

Um es kurz zu machen: Tupel sind iterierbare Datenstrukturen wie Listen, nur dass sie nicht veränderlich sind (immutable). D.h. dass die Elemente nicht durch einen Zuweisungsoperator ersetzt werden können.

Die Syntax verwendet runde Klammern statt eckigen: `(element, element, ...)`

Ansonsten können Sie auf die Elemente eines Tupels genauso zugreifen, wie auf Listenelemente.

In [21]:
tupel = (2, "vier", 6, False, [3, 7, 9])

In [25]:
print(tupel[-1])
print(tupel[1::2])
print(len(tupel))
print(len(tupel[-1]))

[3, 7, 9]
('vier', False)
5
3


### Dictionaries

Die letzte wichtige Datenstruktur in Python sind sog. "Schlüssel-Wert-Paare", die in Python *Dictionaries* heißen.

Die Syntax sieht wie folgt aus: `{ "Schlüssel" : Wert }` (**Achtung:** Der Schlüssel muss *hashable* sein, ist also meistens ein String oder ein Integer). 

Wie bei Listen und bei Tupeln auch, können in Dictionaries sämtliche Datentypen gespeichert werden.

In [1]:
my_dict = {1: "Eins", "zwei": "Zwei"}

Auf die Elemente wird auch über den `[]` Operator zugegriffen; allerdings nicht über den Index wie bei Listen und Tupeln, sondern über den *Schlüssel*.

In [2]:
print(my_dict[1])

print(my_dict["zwei"])

Eins
Zwei


Mit Dictionaries kann man sehr schön Objekte und komplexere Datenstrukturen abbilden.

In [70]:
dc_super_heroes = {
   "Superman": {
       "real_name": "Clark Kent",
       "alignment": "good",
       "groups": ["Justice League", "Black Lantern Corps"],
       "partnerships": ["Supergirl", "Superboy", "Batman", "Wonder Woman"],
       "1st_appearance": "1938-04-18",
       "is_active": True
   },
    "Batman": {
        "real_name": "Bruce Wayne",
        "alignment": "neutral",
        "groups": ["Justice League", "Wayne Enterprises", "Outsiders"],
        "partnerships": ["Robin", "Batgirl", "Superman", "Wonder Woman", "Cat Woman", "Jeff Gordon"],
        "1st_appearane": "1939-05-30",
        "is_active": True
    },
    "Wonder Woman": {
        "real_name": "Diana Prince",
        "alignment": "good",
        "groups": ["Justice League", "Department of Metahuman"],
        "partnerships": ["Wonder Girl", "Steve Trevor", "Artemis", "Superman", "Batman"],
        "1st_appearance": "1941-10-21",
        "is_active": True
    },
    "Flash": {
        "real_name": "Barry Allen",
        "alignment": "good",
        "groups": ["Justice League"],
        "partnerships": [],
        "1st_appearance": "1940-01-01",
        "is_active": False
    }
}

In [5]:
print(dc_super_heroes["Superman"]["partnerships"])

print("Black Lantern Corps" in dc_super_heroes["Batman"]["groups"])

['Supergirl', 'Superboy', 'Batman', 'Wonder Woman']
False


In [13]:
import datetime

first_flash = datetime.datetime.strptime(dc_super_heroes["Flash"]["1st_appearance"], "%Y-%M-%d")
today = datetime.datetime.today()

print(f"Time since first appearance: {today - first_flash}.")

Time since first appearance: 30250 days, 10:35:53.793872.


In [71]:
dc_super_heroes["Flash"]["partnerships"].append("Green Lantern")

print(dc_super_heroes["Flash"]["partnerships"])

['Green Lantern']


In [19]:
dc_super_heroes["Flash"]["other_characters"] = ["Jay Garrick", "Wally West", "Bart Allen"]

print(dc_super_heroes["Flash"])

{'real_name': 'Barry Allen', 'alignment': 'good', 'groups': ['Justice League'], 'partnerships': ['Green Lantern', 'Green Lantern'], '1st_appearance': '1940-01-01', 'is_active': False, 'other_characters': ['Jay Garrick', 'Wally West', 'Bart Allen']}


## Kontrollstrukturen

### Verzweigungen (if ... else ...)

Bedingungen prüfen und je nach Prüfung ein Programm in die eine oder andere Richtung laufen zu lassen ist ein zentrales Konzept der *imperativen Programmierung*, wie sie vor allem in *prozeduralen* und *objekt-orientierten* Softwaredesigns vorkommt.

Ein Bedingungsblock wird in Python mit dem Schlüsselwort `if`, einer Prüfung, die `True` oder `False` ergeben muss und einem abschliessendem Doppelpunkt `:` eingeleitet.

```
if <Bedingung>:
    # tu etwas
    # tu noch mehr
```

Der Code, der ausgeführt werden soll, wenn eine Bedingung `True` ergibt, muss mit der gleichen Anzahl an Leerzeichen eingerückt werden (meistens 4).

In [21]:
if len("hallo") == 5:
    
    print("'hallo' hat 5 Zeichen")

'hallo' hat 5 Zeichen


Wenn die Bedingung `False` ergibt, wird der Code innerhalb des Blocks natürlich nicht ausgeführt. Möchte man in diesem Fall aber dennoch einen "alternativen" Code ausführen, so muss man diesem in einem zweiten Block mit `else:` einleiten.

In [22]:
if len("hallo") == 4:
    print("'hallo' hat 4 Zeichen")
    
else:
    print("'hallo' hat nicht 4 Zeichen")

'hallo' hat nicht 4 Zeichen


Möchte man weitere Bedingungen zwischen `if` und `else` prüfen, kann man weitere Blöcke mit `elif <Bedingung>:` einschieben.

In [24]:
word = "hallo"

if len(word) == 4:
    print(f"das Wort '{word}' hat 4 Zeichen")
    
elif len(word) == 5:
    print(f"das Wort '{word}' hat 5 Zeichen")
    
else:
    print(f"das Wort '{word}' hat mehr als 5 Zeichen")

das Wort 'hallo' hat 5 Zeichen


### Schleifen (while und for)

Die `while` Schleife führt eine Anweisung so lange aus, so lange eine logische Bedingung wahr ergibt. Die Bedingung, die erfüllt sein muss, steht dabei nach dem Schlüsselwort `while`. Eingeleitet wird der Code, der dann ausgeführt werden soll wieder mit einem Doppelpunkt. Der While-Block selbst ist durch Einrückung gekennzeichnet. Ist der Compiler am Ende des While-Blocks angekommen, beginnt er wieder von vorne und prüft die Bedingung. Ist Sie wahr, wird der Code im While-Block wieder durchlaufen und ausgeführt, und so weiter, so lange, bis die logische Prüfung am Kopf der Schleife einmal `False` ergibt. Dann wird die Schleife übersprungen und der Code nach der Schleife ausgeführt.

In [25]:
i = 0

while i < 5:
    print(i)
    i += 1

0
1
2
3
4


So kann man auch über den Index einer Datenstruktur *iterieren*:

In [27]:
i = 0
ww_partners = dc_super_heroes["Wonder Woman"]["partnerships"]

while i < len(ww_partners):
    print(ww_partners[i])
    i += 1

Wonder Girl
Steve Trevor
Artemis
Superman
Batman


Listen, Tupel und Strings sind in Python *iterierbare* Objekte. Um über die Elemente dieser Objekte zu iterieren, gibt es das Konstrukt einer *For-Schleife*.

Sie wird mit dem Schlüsselwort `for` eingeleitet, worauf eine *temporäre Variable* folgt, die den Namen für jedes einzelne Element gibt; sodann das Schlüsselwort `in` und dann das iterierbar Objekt, gefolgt von einem Doppelpunkt `:`, der wie immer den Codeblock einleitet.

```
for <temp var> in <iter>:
    #
    # mache etwas mit <temp var>
    #
```

In [30]:
my_list = ["0", True, 2, 3.0]

for element in my_list:
    
    print(int(element))

0
1
2
3


In [31]:
for key in dc_super_heroes:
    
    print(f"{key}s eigentlicher Name: {dc_super_heroes[key]['real_name']}")

Supermans eigentlicher Name: Clark Kent
Batmans eigentlicher Name: Bruce Wayne
Wonder Womans eigentlicher Name: Diana Prince
Flashs eigentlicher Name: Barry Allen


In Python gibt es auch **Iteratoren**. Diese kreieren eine Sequenz, die aber nicht sofort ausgegeben und in den Speicher geschrieben wird. Erst der Aufruf von `next()` oder die Verarbeitung in einer For-Schleife holen die Werte auf dem Iterator heraus.

Ein Beispiel für einen Iterator ist die Funktion `range()`. Die Syntax dieser Funktion lautet:
```range( start, stop, step )```, wobei diese Argumente wie in *Slices* weiter oben funktionieren und ein halboffenes Intervall bilden.

In [37]:
ersten_fuenf_zahlen = range(1, 6)

ersten_fuenf_zahlen

range(1, 6)

In [39]:
for i in ersten_fuenf_zahlen:
    print(i)

1
2
3
4
5


Zu guter Letzt kann man mit **List Comprehension** in Python sehr leicht Listen erzeugen. Die Syntax sieht wie folgt aus:

```
[<tu etwas mit Element> for <Element> in <Iterable>]
```

In [42]:
import math

liste_der_ersten_geraden_quadratwurzeln = [math.sqrt(i) for i in range(2, 21, 2)]

liste_der_ersten_geraden_quadratwurzeln

[1.4142135623730951,
 2.0,
 2.449489742783178,
 2.8284271247461903,
 3.1622776601683795,
 3.4641016151377544,
 3.7416573867739413,
 4.0,
 4.242640687119285,
 4.47213595499958]

## eigene Funktionen schreiben

In Imperativen Sprachen dienen Funktionen vor allem dazu, einmal geschriebenen Code öfter zu verwenden und das sog. [DRY Prinzip](https://de.wikipedia.org/wiki/Don%E2%80%99t_repeat_yourself) einzuhalten.

Ein Funktion wird in Python mit dem Schlüsselwort `def` und dem *Namen der Funktion* eingeleitet. Darauf folgt eine kommaseparierte Liste mit Argumenten in runden Klammern `(arg1, arg2, ...)` (diese Liste kann auch leer sein). Ein Doppelpunkt `:` leitet den Block ein, in dem der Code steht, der ausgeführt werden soll. Soll ein Wert am Ende des Codes zurückgegeben werden, muss dieser mit dem Schlüsselbegriff `return` gekennzeichnet werden. Ein Return beendet eine Funktion sofort.

```
def <Funktionsname> (<arg1>, <arg2>, ...):
    # 
    # Codeblock
    #
    return <Wert aus Codeblock>
```

In [43]:
def is_even(n):
    
    if n % 2 == 0:
        
        return True
    
    return False

In [44]:
print(is_even(4))

print(is_even(5))

True
False


In [45]:
# das Ganze kann man noch kürzer schreiben

def is_even2(n):
    
    return True if n % 2 == 0 else False

In [46]:
print(is_even(7))

print(is_even(8))

False
True


In [73]:
# eine Funktion, die ein Dictionary an Superhelden entgegen nimmt und eine sortierte Liste
# ausgibt, an Partnerschafte, die ein Superheld in seinem Leben eingegangen ist

def get_sorted_hero_partnerships(dict_of_heroes):
    
    def count_partnerships(hero):
        return len(hero["partnerships"])
    
    def sort_dict_by_count(dictionary):
        return {key: value for (key, value) in sorted(dictionary.items(),
                                                      key = lambda x: dictionary[x[0]],
                                                      reverse = True)}
    
    dict_of_partners = {}
    
    for key in dict_of_heroes:
        
        hero = dict_of_heroes[key]
        
        dict_of_partners[key] = count_partnerships(hero)
        
    return sort_dict_by_count(dict_of_partners)

In [74]:
get_sorted_hero_partnerships(dc_super_heroes)

UnboundLocalError: local variable 'count_partnerships' referenced before assignment

# Module