# Python Basics

Dieses Tutorial wurde ursprünglich von [Justin Johnson](https://web.eecs.umich.edu/~justincj/) für den Kurs cs231n an der Universität Stanford geschrieben. Es wurde als Jupyter-Notebook für cs228 von [Volodymyr Kuleshov](http://web.stanford.edu/~kuleshov/) und [Isaac Caswell](https://symsys.stanford.edu/viewing/symsysaffiliate/21335) angepasst. Diese Version wurde für Colab von Kevin Zakka für den Kurs [cs231n](https://cs231n.github.io/) angepasst. Standardmäßig läuft sie mit Python3.



## Einleitung

Python ist an sich schon eine großartige Allzweckprogrammiersprache, aber mit Hilfe einiger beliebter Bibliotheken (numpy, scipy, matplotlib) wird sie zu einer leistungsstarken Umgebung für Data Science Berechnungen.

Wir gehen davon aus, dass viele von Ihnen bereits Erfahrung mit Python und numpy haben; für alle anderen dient dieser Abschnitt als schneller Crashkurs sowohl über die Programmiersprache Python als auch über die Verwendung von Python für Data Science Berechnungen.

Einige von Ihnen haben vielleicht Vorkenntnisse in Matlab, in diesem Fall empfehlen wir auch die Seite numpy for Matlab users (https://docs.scipy.org/doc/numpy-dev/user/numpy-for-matlab-users.html).

Dieses Tutorial beinhaltet folgende Themen:

* Basic Python: Basic data types (Containers, Lists, Dictionaries, Sets, Tuples), Funktionen, Klassen
* Numpy: Arrays, Array indexing, Datatypes, Array Manipulation, Broadcasting
* Matplotlib: Plotting, Subplots, Images
* IPython: Creating notebooks, Typical workflows

## Python Versionen 

Ab dem 1. Januar 2020 hat Python [offiziell die Unterstützung](https://www.python.org/doc/sunset-python-2/) für `python2` eingestellt, bitte verwenden Sie kein Python 2 mehr. Wir werden Python 3.7 oder höher für diesen Kurs verwenden. Sie können Ihre Python-Version auf der Kommandozeile überprüfen, indem Sie `python3 --version` ausführen.



In [1]:
!python3 --version

Python 3.8.12


## Python Basics

Python ist eine hochentwickelte, dynamisch typisierte Multiparadigma-Programmiersprache. Von Python-Code wird oft gesagt, er sei fast wie Pseudocode, da er es ermöglicht, sehr mächtige Ideen in sehr wenigen Codezeilen auszudrücken und dabei sehr lesbar zu sein. Als Beispiel ist hier eine Implementierung des klassischen Quicksort-Algorithmus in Python zu nennen:

In [2]:
import json
from dataclasses import asdict, dataclass
from datetime import date
from math import sqrt
from typing import List


def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)


print(quicksort([3, 6, 8, 10, 1, 2, 1]))

[1, 1, 2, 3, 6, 8, 10]


### Basic data types

#### Zahlentypen

Integers and floats verhalten sich wie man es erwarten würde:

In [3]:
x = 3
print(x, type(x))

3 <class 'int'>


In [4]:
print(x + 1)  # Additon
print(x - 1)  # Subtraktion
print(x * 2)  # Multiplikation
print(x**2)  # Exponente

4
2
6
9


In [5]:
x += 1
print(x)
x *= 2
print(x)

4
8


In [6]:
y = 2.5
print(type(y))
print(y, y + 1, y * 2, y**2)

<class 'float'>
2.5 3.5 5.0 6.25


Beachten Sie, dass Python im Gegensatz zu vielen anderen Sprachen keine unären Inkrement- (x++) oder Dekrement-Operatoren (x--) besitzt.

Python hat auch eingebaute Typen für long / BigInt Zahlentypen und komplexe Zahlen; Sie können alle Details in der [Dokumentation](https://docs.python.org/3.7/library/stdtypes.html#numeric-types-int-float-long-complex) finden.

#### Booleans

Python implementiert alle üblichen Operatoren für die boolesche Logik, verwendet aber englische Wörter anstelle von Symbolen (`&&`, `||`, etc.):

In [7]:
t, f = True, False
print(type(t))

<class 'bool'>


Hier die typischen Operationen:

In [8]:
print(t and f)  # Logisches UND;
print(t or f)  # Logisches ODER;
print(not t)  # Logisches NICHT;
print(t != f)  # Logisches EXKLUSIVES ODER;

False
True
False
True


#### Strings

In [9]:
hello = "HELLO"  # String Literale sind agnostisch für Anführungszeichen
world = "WORLD"
print(hello, len(hello))

HELLO 5


In [10]:
hw = hello + " " + world  # String concatenation
print(hw)

HELLO WORLD


In [11]:
hw12 = f"{hello} {world} {12}"  # string formatting
print(hw12)
# moderne Formatierung mit f"<String>" und ersetzung
hw34 = f"{hw12} {hw} here speaks the {world}"
print(hw34)

HELLO WORLD 12
HELLO WORLD 12 HELLO WORLD here speaks the WORLD


String Objekte haben einige praktische Methoden:

In [12]:
s = "hallo"
print(s.capitalize())  # Eine Zeichenkette groß schreiben
print(s.upper())  # Konvertiert eine Zeichenkette in Großbuchstaben; printet "HELLO"
print(
    s.rjust(7)
)  # Eine Zeichenkette rechtsbündig ausrichten, mit Leerzeichen auffüllen
print(s.center(7))  # Eine Zeichenkette zentrieren, mit Leerzeichen auffüllen
print(
    s.replace("l", "(ell)")
)  # Ersetze alle vorkommenden Teile einer Teilzeichenkette durch eine andere
print(" world ".strip())  # Führende und nachfolgende Leerzeichen entfernen

Hallo
HALLO
  hallo
 hallo 
ha(ell)(ell)o
world


Hier finden Sie die Dokumentation von [String Methoden](https://docs.python.org/3.7/library/stdtypes.html#string-methods).

### Konvertierung

In [13]:
print(int("5"), type(int("5")))  # von String nach int
print(float("5"), type(float("5")))  # von String nach float
print("Hello " + str(5.5))  # von int/float nach String
print("Hello" + 5)  # keine implizite konvertierung von int nach string

5 <class 'int'>
5.0 <class 'float'>
Hello 5.5


TypeError: can only concatenate str (not "int") to str

### Container

Python enthält mehrere eingebaute Containertypen: Listen, Dictionaries, Sets und Tuples.

#### Listen

Eine Liste ist das Python-Äquivalent zu einem Array, kann aber in der Größe verändert werden und Elemente unterschiedlichen Typs enthalten:

In [None]:
xs = [3, 1, 2]
print(xs, xs[2])
print(len(xs))  # Länge der Liste
print(xs[-1])  # Negative indizes zählen vom Ende der Liste
print(xs[2] == xs[len(xs) - 1] == xs[-1])  # Alle indizes sind Äquivalent

In [None]:
xs[2] = "foo"  # Listen können beliebige Typen enthalten
print(xs)

In [None]:
xs.append("bar")  # Anhängen an die Liste
print(xs)

In [None]:
x = xs.pop()  # gibt letztes Element der Liste zurück und entfernt es
print(x, xs)

Wie immer gibt es die Details in der [Dokumentation](https://docs.python.org/3.7/tutorial/datastructures.html#more-on-lists).

#### Slicing

Zusätzlich zum Zugriff auf einzelne Listenelemente bietet Python eine präzise Syntax für den Zugriff auf Unterlisten; dies wird als Slicing bezeichnet:

In [None]:
nums = list(
    range(5)
)  # range ist eine eingebaute Funktion, die eine Liste von Ganzzahlen erstellt
print(nums)  # Printet "[0, 1, 2, 3, 4]"
# Holt ein Slice von Index 2 bis 4 (exklusiv); gibt "[2, 3]" aus
print(nums[2:4])
print(nums[2:])  # Holt ein Slice von Index 2 bis zum Ende; gibt "[2, 3, 4]" aus
print(
    nums[:2]
)  # Holt ein Slice vom Anfang bis zum Index 2 (exklusiv); gibt "[0, 1]" aus
# Holt einen Ausschnitt der gesamten Liste; gibt ["0, 1, 2, 3, 4]" aus
print(nums[:])
print(nums[:-1])  # Slice-Indizes können negativ sein; gibt ["0, 1, 2, 3]" aus
nums[2:4] = [8, 9]  # Zuweisung einer neuen Teilliste zu einem Slice
print(nums)  # Printet "[0, 1, 8, 9, 4]"

#### Advanced Slicing

In [None]:
start = 1
stop = 7
step = 1  # Schrittweite

nums = list(range(10))  # 0 bis 9, 10 ist nicht dabei!
print(nums)
print(nums[::2])  # jedes zweite Element
print(nums[start:stop:step])
print(nums[::-1])  # negativer step -> rückwärts laufen

#### Schleifen

Iterieren über eine Liste erfolgt so:

In [None]:
animals = ["cat", "dog", "monkey"]
for animal in animals:
    print(animal)

Wenn Sie Zugriff auf den Index jedes Elements innerhalb des Körpers einer Schleife haben wollen, verwenden Sie die eingebaute Funktion `enumerate`:

In [None]:
animals = ["cat", "dog", "monkey"]
for idx, animal in enumerate(animals):
    print(f"#{idx + 1}: {animal}")

#### List comprehensions:

Beim Programmieren wollen wir häufig einen Datentyp in einen anderen umwandeln. Dies ist eine der mächtigsten Funktionen von Python und ersetzt funktionale Konzepte wie `map`, `filter` und `reduce`.

Ein einfaches Beispiel ist der folgende Code zur Berechnung von Quadratzahlen:

In [None]:
nums = [0, 1, 2, 3, 4]
squares = []
for x in nums:
    squares.append(x**2)
print(squares)

Sie können diesen Code vereinfachen, indem wir eine List Comprehension verwenden:

In [None]:
nums = [0, 1, 2, 3, 4]
squares = [x**2 for x in nums]
print(squares)

Die List Comprehensions können auch Bedingungen enthalten:

In [None]:
nums = [0, 1, 2, 3, 4]
even_squares = [x**2 for x in nums if x % 2 == 0]
print(even_squares)

#### Dictionaries

Ein Dictionary speichert Paare (Key, Value), ähnlich wie eine "Map" in Java oder ein Objekt in Javascript. Sie können es wie folgt verwenden:

In [None]:
d = {"cat": "cute", "dog": "furry"}  # Dict erstellen
print(d["cat"])  # Zugriff via Key; prints "cute"
print("cat" in d)  # Ist ein bestimmter Wert zu einem Key vorhanden?; prints "True"

In [None]:
d["fish"] = "wet"  # Zuweisung
print(d["fish"])  # Prints "wet"

In [None]:
print(d["monkey"])  # KeyError: 'monkey' not a key of d

In [None]:
print(d.get("monkey", "N/A"))  # Zugriff mit Default Wert; prints "N/A"
print(d.get("fish", "N/A"))

In [None]:
del d["fish"]  # Einen Wert löschen
print(d.get("fish", "N/A"))  # "fish" ist kein Key mehr; prints "N/A"

Alles weitere hält die [Dokumentation](https://docs.python.org/2/library/stdtypes.html#dict) bereit.

Iteration über Dictionary:

In [None]:
d = {"person": 2, "cat": 4, "spider": 8}
for animal, legs in d.items():
    print(f"A {animal} has {legs} legs")

Dictionary comprehensions: Sie ähneln den List Comprehensions, ermöglichen aber die einfache Erstellung von Dictionaries. Zum Beispiel:

In [None]:
nums = [0, 1, 2, 3, 4]
even_num_to_square = {x: x**2 for x in nums if x % 2 == 0}
print(even_num_to_square)

#### Sets (Mengen)

Eine Menge ist eine ungeordnete Sammlung von unterschiedlichen Elementen. Ein einfaches Beispiel:

In [None]:
animals = {"cat", "dog"}
print("cat" in animals)  # Ist ein Element im Set?; prints "True"
print("fish" in animals)  # prints "False"

In [None]:
animals.add("fish")  # Element hinzufügen
print("fish" in animals)
print(len(animals))  # Anzahl der Element in der Menge

In [None]:
animals.add("cat")  # Adding an element that is already in the set does nothing
print(len(animals))
animals.remove("cat")  # Element aus Menge entfernen
print(len(animals))

**Schleifen** : Das Iterieren über eine Menge hat die gleiche Syntax wie das Iterieren über eine Liste; da Mengen jedoch ungeordnet sind, können Sie keine Annahmen über die Reihenfolge machen, in der Sie die Elemente der Menge ausgegeben werden:

In [None]:
animals = {"cat", "dog", "fish"}
for idx, animal in enumerate(animals):
    print(f"#{idx + 1}: {animal}")

Set comprehensions: Like lists and dictionaries, we can easily construct sets using set comprehensions:

In [None]:
print({int(sqrt(x)) for x in range(30)})

#### Tuple

Ein Tupel ist eine (unveränderbare) geordnete Liste von Werten. Ein Tupel ähnelt in vielerlei Hinsicht einer Liste; einer der wichtigsten Unterschiede ist, dass Tupel als Schlüssel in Wörterbüchern und als Elemente von Mengen verwendet werden können (sie sind hashbar), während dies bei Listen nicht möglich ist. Hier ist ein triviales Beispiel:

In [None]:
d = {(x, x + 1): x for x in range(10)}  # Create a dictionary with tuple keys
t = (5, 6)  # Create a tuple
print(type(t))
print(d[t])
print(d[(1, 2)])

In [None]:
t[0] = 1  # immutable

### Funktionen

Python Funtionen werden mit dem`def` keyword definiert. Hier gleich mit einem `if`, `elif` und `else` Kontrollfluss:

In [None]:
def sign(x):
    if x > 0:
        return "positive"
    elif x < 0:
        return "negative"
    else:
        return "zero"


for x in [-1, 0, 1]:
    print(sign(x))

Eine schöne eigenschaft von Python sind optionale keyword Argumente. 

In [None]:
def hello(name, loud=False):
    if loud:
        print(f"HELLO, {name.upper()}")
    else:
        print(
            f"Hello, {name}!"
        )  # neuer format Sytanx man beachte das 'f' vor dem String


hello("Bob")
hello("Fred", loud=True)

### Klassen

Klassen in Python sind einfach zu definieren:

In [None]:
class Greeter:
    """Dokumentation der Klasse erfolgt über 3-fach Anführungszeichen"""

    # Constructor
    def __init__(
        self, name
    ):  # self ist eine konvention und dienst zur Referenzierung der Instanz
        self.name = name  # instanz Variable, unterscheidet sich

    # Instance method
    def greet(self, loud=False):
        if loud:
            print(f"HELLO, {self.name.upper()}")
        else:
            print(f"Hello, {self.name}!")


g = Greeter("Fred")  # Construct an instance of the Greeter class
g.greet()  # Call an instance method; prints "Hello, Fred"
g.greet(loud=True)  # Call an instance method; prints "HELLO, FRED!"

In [None]:
# Ruft Dokumentationsstring auf
Greeter?

### Data Klassen

Data Classes sind praktisch um einfach Daten abzulegen ohne z.B. den Klassenkontruktor zu verwenden

In [None]:
@dataclass
class InventoryItem:
    """Class for keeping track of an item in inventory."""

    name: str  # Beispiele für Type Annotations, diese sind meist optional
    unit_price: float
    quantity_on_hand: int = 0  # default value

    def total_cost(self) -> float:
        return self.unit_price * self.quantity_on_hand


item = InventoryItem(name="Schrank", unit_price=120.50, quantity_on_hand=10)
print(item.total_cost())

## Übungen zum Selbststudium

### 1. Zahlen invertieren mal anders

Gegeben sei eine natürliche Zahl N in Dezimaldarstellung. Geben sie eine Funktion an die die Zahl "rückwärts" ausgibt: für die `N = 124` lautet das Ergebnis `321`.

In [3]:
def reverse_number(N):
    return int(str(N)[::-1])


assert reverse_number(123) == 321

### 2. Bubblesort

Implementierien sie das klassiche [Bubblesort Verfahren](https://de.wikipedia.org/wiki/Bubblesort).
Hinweis: praktische Funktionen hierfür sind `range` und einen Variablen swap kann in python auch ohne temporäre Variable erfolgen z.B.


In [4]:
a, b = 1, 2  # Zuweisung auf einer Zeile
print(a, b)
b, a = a, b
print(a, b)

1 2
2 1


In [25]:
def bubblesort(arr):
    if len(arr) <= 1:
        return arr

    for i in range(len(arr) - 1):
        j = i + 1
        if arr[i] > arr[j]:
            arr[i], arr[j] = arr[j], arr[i]

    return bubblesort(arr[:-1]) + [arr[-1]]


array = [29, 11, 28, 95, 722, 10, 2, 18]
sorted_array = bubblesort(array)

assert sorted_array == sorted(array)

### 3. Simpler CSV Parser

CSV steht für Comma Seperated Values und dient dazu Daten zu serialisieren. Lesen sie die Datei "01_test_data.csv" ein und stellen Sie die Daten als Liste von Listen dar.

In [32]:
def simple_csv_parser(filename, seperator=","):
    nested_lists = []
    with open(filename) as file:
        for l in file:
            nested_lists.append(l.split(seperator))

    for j in nested_lists:
        print(" ".join(j))


simple_csv_parser("01_test_data.csv")

Stunde Montag Dienstag Mittwoch Donnerstag Freitag

1 Mathematik Deutsch Englisch Erdkunde Politik

2 Sport Deutsch Englisch Sport Geschichte

3 Sport "Religion (ev.  kath.)" Kunst  Kunst



In [None]:
# Ausgabe sollte sein:

# Stunde Montag Dienstag Mittwoch Donnerstag Freitag
# 1 Mathematik Deutsch Englisch Erdkunde Politik
# 2 Sport Deutsch Englisch Sport Geschichte
# 3 Sport "Religion (ev.  kath.)" Kunst  Kunst

### 4.  HL7 Fhir Patienten Modell

Wir möchten einen Patienten wie in HL7 Fhir vereinfacht nachbauen.

1. Lesen Sie sich die Definition auf https://www.hl7.org/fhir/patient.html durch.
2. Schauen Sie sich das Beispiel auf https://www.hl7.org/fhir/patient-examples-general.json.html an
3. Bauen Sie jeweils (einfache) dataclasses für die Attribute
    - name 
    - telecom
4. Bauen Sie eine Data Class für Patient. Fügen Sie mindetens name, telecom, gender und birthdate als Attribute hinzu
5. Benutzen sie https://docs.python.org/3/library/dataclasses.html#dataclasses.asdict und https://docs.python.org/3/library/json.html#json.dumps um ein JSON auszugeben
6. Vergleichen Sie ihr JSON mit dem Beispiel aus 2 und überlegen Sie wie Sie weitere Felder implementieren würden
7. (optional) implementieren Sie weitere Attribute

In [57]:
@dataclass
class TelecomItem:
    system: str
    value: str
    use: str


@dataclass
class NameItem:
    use: str
    family: str
    given: List[str]


@dataclass
class FhirPatient:
    telecom: List[TelecomItem]
    name: NameItem
    gender: str
    bithDate: date


patient = FhirPatient(
    telecom=[TelecomItem(system="phone", value="555-555-2003", use="work")],
    name=NameItem(use="official", family="Everywomen", given=["Eve"]),
    gender="other",
    bithDate=date.fromisoformat("1990-11-04"),
)

patient_dict = asdict(patient)
patient_json = json.dumps(
    patient_dict, indent=4, default=str
)  # default=str braucht man um datetime objekte automatisch zu serialisieren

print(patient_json)

{
    "telecom": [
        {
            "system": "phone",
            "value": "555-555-2003",
            "use": "work"
        }
    ],
    "name": {
        "use": "official",
        "family": "Everywomen",
        "given": [
            "Eve"
        ]
    },
    "gender": "other",
    "bithDate": "1990-11-04"
}
