<figure>
  <IMG SRC="https://upload.wikimedia.org/wikipedia/commons/thumb/d/d5/Fachhochschule_Südwestfalen_20xx_logo.svg/320px-Fachhochschule_Südwestfalen_20xx_logo.svg.png" WIDTH=250 ALIGN="right">
</figure>

# Python Crashkurs

# Erste Schritte in Python

## Variablen

Python ist fundamental objektorientiert. Das heißt nicht nur, dass Sie in Python objektorientiert programmieren können. Es gilt auch der Leitsatz: *Alles in Python ist ein Objekt*. Also selbst grundlegende Datentypen wie `int`, `float` und `str`, sowie Funktionen sind Objekte. Daher sind Variablen in Python immer Referenzen auf Objekte. Strenggenommen müsste man also sagen, es gibt in **Python keine Variablen**.

Weil der Begriff der *Variablen* aber so verbreitet ist - in den allermeisten Python Büchern wird von Variablen gesprochen - verwenden wir ihn auch an dieser Stelle. Wenn also im Folgenden von einer *Variablen* die Rede, ist immer eine Objektreferenz, bzw ein *Name für ein Objekt* gemeint.

Wie viele andere Skriptprachen auch, ist Python dynamisch typisiert. Das bedeutet, dass Sie keine Typangaben bei der Definition einer Variablen angeben müssen. Python leitet automatisch den passenden Typ ab, bzw. es wählt den "am besten passenden" Typ aus.


In [None]:
a = 42
b = 1.23
ab = 'Hallo'

Für Variablennamen gelten die Gleichen Regeln wie für die Bezeichner in C/C++. Variablen müssen mit einem Buchstaben oder Unterstrich beginnen und können sich ab dem 2. Zeichen aus einer beliebigen Folge von Buchstaben, Ziffern und Unterstrichen zusammensetzen.

Es gibt allerdings einige Konventionen für die Wahl von Bezeichnern. So gelten Variablen, die mit 2 Unterstrichen beginnen als *privat*, Namen mit 2 Unterstrichen am Anfang und am Ende sind für spezielle Attribute und Methoden reserviert ("*magic methods*").

Die skalaren, also elementare oder nicht-zusammengesetzten Datentypen in Python sind:
- `int` Ganze Zahlen
- `float` Fließkommazahlen mit 64-bit Präzision
- `complex` Komplexe Zahlen
- `bool` Bool'scher Datentyp mit den Werten `True` und `False`
- `NoneType` signalisiert das Nicht-Vorhandensein einer Referenz, ähnlich zu `NULL` oder `NIL` in anderen Sprachen

Die Typen `str` für Zeichenketten sowie `bytes` für Folgen von 8-bit (vorzeichenlosen) Werten (zum Verarbeiten von Binärdaten) gehören zu den *Sequentiellen Datentypen*.

## Zeichenketten
Zeichenketten schreibt man in Python entweder in einzelne `''`, oder doppelte `""` Anführungszeichen.

In [None]:
s0 = "Hello, world "
s1 = 'Hello, world '
print(s0)
print(s1)

Dass man zwei Schreibweisen verwenden kann, hilft bei der Verwendung von Anführungszeichen in Stings.
Wenn Sie z.B. doppelte Anführunszeichen im String verwenden wollen, benutzen Sie für den Python String einfache Anführungszeichen.

In [None]:
s2 = 'Die Zeichenkette "Hello, world"'
print(s2)

Erst wenn Sie beide Arten von Anführungszeichen im Stingverwenden wollen, müssen Sie die Zeichen mit `\` maskieren.

In [None]:
s2 = 'Das Zeichen \'s\' kommt im String  "Hello, world" nicht vor!'
print(s2)

Zeichenketten kann man mit `+` aneinanderhängen und mit `*` wiederholen.

In [None]:
s2 = "Hallo"
s0 = "s0"
print(s0 + s0 + s2)
print()
print(s0 * 3)

Auf einzelne Zeichen greift man so zu, wie man es von Arrays her kennt.

In [None]:
print(s0[1])

## Operationen

Für die meisten Datentypen existieren die bekannten Operationen (`+`, `-`, `*`, `/`) mit der üblichen Bedeutung. Daneben gibt es noch den Operator `//`, für die ganzzahlige Division, den Modulo-Operator `%` und den Potenz-Operator `**`.

In [None]:
a = 2 + 1.23
b = 22.2//3
c = "Hallo " + "Welt"
d = 2**8
print(a, b, c, d)

Die `print` Funktion, wie oben verwendet, benötigt man ziemlich häufig.
Ruft man sie mit einer (beliebigen) Folge von Parametern aus, so wird für jede Variable, entsprechend ihres Typs, eine passende *print* Methode aufgerufen. In Python heißt die Methode `__str__()`, sie entspricht in etwa der `toString()`-Methode aus Java.

Um eine formatierte Ausgabe zu erhalten, kann man einen Format-String mit Platzhaltern angeben, ähnlich wie bei der `printf`-Funktion aus C. Über den Modulo-Operator können dann die Variablen angegeben werden, die an den Platzhaltern eingesetzt werden sollen.
Für unser Beispiel oben sieht das dann z.B. so aus:

In [None]:
print("a = %f, b = %d, c = %s, d = %s" % (a, b, c, d))

Python ist stark typisiert. D.h., dass Variablen immer einen eindeutigen Typ haben und an keiner Stelle eine implizite Typumwandlung stattfinden kann. Jede Änderung des Typs erfordert eine explizite Typkonvertierung. Ein Ausdruck wie `"Hallo"+2` kann nicht ausgewertet werden, da die `+`-Operation für einen String und einen Integer nicht definiert ist.
In diesem Fall kann man eine Typenwandlung, z.B. von `int` nach `str` vornehmen:

In [None]:
"Hallo" + str(2)

## Sequentielle Datentypen

Unter sequenziellen Datentypen wird eine Klasse von Datentypen zusammengefasst, die Folgen von **gleichartigen oder verschiedenen Elementen** verwalten.
In Listen und Tupel können beliebige Folgen von Daten abgelegt sein. Die gespeicherten Elemente haben eine definierte Reihenfolge und man kann über eindeutige Indizes auf sie zugreifen. Listen sind veränderbar, d.h., man kann einzelne Elemente  ändern, löschen oder hinzufügen. Tupel sind nicht veränderbar. Das bedeutet, bei jeder Änderung wird ein komplett neues Objekt mit den geänderten Elementen angelegt.

In [None]:
a = [3.23, 7.0, "Hallo Welt", 256]
b = (3.23, 7.0, "Hallo Welt", 256)
print("Liste a = %s\nTupel b =%s" % (a,b) )
print("Das dritte Element von b ist " + b[2])
print("Gleiche Referenz? %s. Gleicher Inhalt? %s" % (a == b, set(a)==set(b)))
type(b)
c

Das obige Beispiel bringt uns direkt zum nächsten Datentyp, den Mengen (oder engl. *sets*).
Wie bei den Mengen aus der Mathematik kann ein set in Python jedes Objekt nur einmal enthalten.
Wenn wir also aus der Liste [4,4,4,4,3,3,3,2,2,1] eine Menge machen, hat diese folgende Elemente:

In [None]:
set([4,4,4,4,3,3,3,2,2,1])

Die Elemente tauchen nun nicht nur einmalig auf, sondern sie sind auch umsortiert worden.
Man darf sich hier nicht täuschen lassen, die Elemente einer Menge sind immer unsortiert.
D.h., man kann keine spezielle Sortierung erwarten, auch wenn die Ausgabe in manchen Fällen danach aussieht.

Ein weitere sequentieller Datentyp sind Dictionaries (die deutsche Übersetzung *Wörterbücher* passt hier nicht so gut).
Diectionaries sind eine Menge von *Schlüssel-Wert-Paaren*.
Das bedeutet, dass jeder Wert im Dictionary unter einem frei wählbaren Schlüssel abgelegt ist, und auch über diesen Schlüssel zugegriffen werden kann.

In [None]:
haupstaedte = {"DE" : "Berlin", "FR" : "Paris", "US" : "Washington", "CH" : "Zurich"}
print(haupstaedte["FR"])
haupstaedte["US"] = "Washington, D.C."
print(haupstaedte["US"])

## Funktionen 

Funktionen in Python werden über das Schlüsselwort `def` definiert. Die Syntax einer Funktions-Definition sieht folgendermaßen aus:

```python
def myfunc(arg1, arg2,... argN):  
  '''Dokumentation'''  

  #Programmcode  

  return <Rückgabewert>  
```

Hier wird die Funktion "myfunc" definiert, welche mit den Parametern "arg1,arg2,....argN" aufgerufen werden kann.

Wir sehen hier auch ein weiteres Konzept von Python, das wir bisher noch nicht angesprochen haben. Die Strukturierung von Code in Blöcke erfolgt über **Einrückungen**.
Für eine Funktion bedeutet das, dass der Code des Funktionskörpers um eine Stufe gegenüber der Funktionsdefinition eingerückt sein muss. Wenn der Funktionskörper weitere Kontrollstrukturen enthält, z.B. Schleifen oder Bedingungen, sind weitere Einrückungen nötig. Betrachten Sie folgendes Beispiel:

In [None]:
def gib_was_aus():
    print("Eins")
    print("Zwei")
print("Drei")
gib_was_aus()

Hier wird zuerst eine Funktion `gib_was_aus` definiert. Die Anweisung `print("Drei")` ist nicht mehr eingerückt, gehört daher nicht mehr zur Funktion.

Funktionen können fast überall definiert sein, also z.B. auch innerhalb von anderen Funktionen.
Rückgaben erfolgen, wie auch in anderen Programmiersprachen üblich mit den Schlüsselwort `return`.
Falls mehrere Elemente zurückgegeben werden sollen, können diese z.B. in ein Tupel gepackt werden:

In [None]:
def inc(a, b, c):
    return a+1, b+1, c+"B"
a=b=1
c="A"
a,*x = inc(a,b,c)
d = inc(a,b,c)
print(a,b)
print(x)

## Verzweigungen

Wir haben bisher noch keine Kontrollstrukturen, also Verzweigungen oder Schleifen angesprochen.
Eine Bedingung oder Verzweigung funktioniert in Python (wie üblich) über ein `if`-`else`-Konstrukt.
Auch hier werden zur Strukturierung der Blöcke Einrückungen benutzt.

In [None]:
a=2
if a==0:
    print("a ist Null")
else:
    print("a ist nicht Null")


Um tiefe Verschachtelungen zu vermeiden, gibt es noch eine `elif`-Anweisung:

In [None]:
a=2
if a<0:
    print("a ist negativ")
elif a>0:
    print("a ist positiv")
else:
    print("a ist Null")

## Schleifen

In Python gibt es die Schleifentypen, `while` und `for`, wobei letztere eine etwas ungewöhnliche Syntax hat.
Die `while`-Schleife hingegen wird wie in vielen bekannten Programmiersprachen benutzt:

In [None]:
i = 5
while i>0:
    print(i)
    i -= 2

Anders als z.B. in C/C++ oder Java läuft eine `for`-Schleife in Python nicht über eine Zählvariable, sondern über *die Elemente eines iterierbaren Datentyps*.
Einige Beispiele für iterierbaren Datentypen haben wir schon als sequentielle Datentypen kennengelernt.
Wir können z.B. mit einer `for`-Schleife alle Elemente eines Dictionaries besuchen:

In [None]:
haupstaedte = {"DE" : "Berlin", "FR" : "Paris", "US" : "Washington", "CH" : "Zurich"}
for s in haupstaedte:
    print(haupstaedte[s])

Wir sehen, dass die Laufvariable hier alle Schlüssel des Dictionaries annimmt. Bei einer Liste wird über alle Werte iteriert:

In [None]:
a = [3.23, 7.0, "Hallo Welt", 256]
for s in a:
    print(s)

Neben den sequentiellen Datentypen liefern noch sogenannte **Generatoren** Folgen von Werten die iterierbar sind. Der bekannteste Iterator ist `range()`.
`range` kann mehrere Argumente haben. Ist nur ein Argument `E` angegeben, so läuft der Iterator von 0 bis `E-1`.
`range(S, E)` läuft von S bis `E-1`, und `range(S, E, K)` läuft von S bis `E-1` mit der Schrittweite `K`

In [None]:
print("Ein Parameter:", end=" ")
for s in range(5): print(s, end=" ")

print("\nZwei Parameter:", end=" ")
for s in range(2,5): print(s, end=" ")

print("\nDrei Parameter:", end=" ")
for s in range(0,5,2): print(s, end=" ")

Das zusätzliche Argument `end=" "` in den `print`-Anweisungen oben verhindert übrigens einen Zeilenumbruch.
Ohne diesen Parameter würden alle Werte in einer Spalter untereinander ausgegeben.

Damit endet unser erster *Crash Kurs* zum Thema Python. Sie haben nun die wichtigsten Elemente der Python-Syntax gesehen.
Natürlich zeigen die Beispiele aber nur einen kleinen Ausschnitt, die Sprache ist noch deutlich umfangreicher und viele Konzepte, wie z.B. Klassen und Module, haben wir noch nicht einmal angesprochen.

Am besten Sie probieren Python einfach mal aus, indem Sie bestehende Beispiele übernehmen und verändern.
Die Python Notebooks sind eine ideale Umgebung dafür.
Sie können in den Code-Zellen Programmcode einfach ausprobieren.
In den Markdown-Zellen können Sie sich Notizen machen, um Ihren Code zu dokumentieren oder ihre Schritte zu beschreiben.

# Datentypen

### Der NoneType

Vermutlich kennen Sie folgende Situation bereits von anderen Programmiersprachen: Bei der Programmierung möchten Sie gelegentlich ausdrücken möchte, dass etwas **nicht** existiert, bzw. dass eine Referenz auf ein Objekt nicht initialisiert ist.

Referenzen (und Pointer) sind Verweise auf Objekte.

Wenn nun die Referenz existiert, nicht aber das Objekt auf das sie verweisen soll, so gibt man der Referenz einen ganz speziellen *Null*-Wert.

Bei den Zeigern in C/C++ ist das die Adresse mit dem Wert 0 (`NULL`), in Java die `null`-Referenz.

Auch in Python gibt es eine solche Referenz.
Sie hat den Wert (bzw. den Namen) `None` und ist selbst vom Typ `NoneType`.

In [None]:
def returnNone():
    return

x = returnNone()
print(x, type(x))

### Operatoren

Die wichtigsten Operatoren haben wir bereits im letzten Arbeitsblatt kennengelernt. Für alle elementaren Datentypen und auch die zusammengesetzten Datentypen sind verschiedenen Operatoren definiert.
Bei numerischen Ausdrücken haben die Operationen (`+`, `-`, `*`, `/`) ihre übliche Bedeutung.

Der Operator `//` berechnet die ganzzahlige Division zweier Zahlen, der Modulo-Operator `%` den ganzzahligen Rest einer Integer Division.

Dazu gibt es noch den Potenz-Operator `**`.

Für den ganzzahligen Datentyp int sind zusätzlich Bit-Operationen definiert. Dies sind das bitweise AND (`&`), OR (`|`) und XOR (`^`) sowie das Bit-Komplement (`~x`) einer Zahl `x`. Auch Bit-Verschiebungen (bit shifts) sind mit den Operatoren `<<` (shift links) und `>>` (shift rechts) möglich.

In [None]:
3 << 3

Operatoren sind auch für nicht-arithmetische Datentypen, wie etwa `str` (String) oder zusammengesetzte Datentypen wie Tupel oder Listen definiert.

Eine Konkatenation von Strings mit dem Operator `+` haben wir bereits gesehen.

Mit den `*`-Operator kann man Strings zusätzlich multiplizieren.

In [None]:
print("Blah "*3)

Als Vergleichsoperatoren stehen `==` (gleich), `!=` (ungleich), `<` (kleiner), `>` (größer), `<=` (kleiner oder gleich) und `>=` (größer oder gleich) zur verfügung.

Das Ergebnis einer Vergleichsoperation ist vom Typ `bool`.

In [None]:
x = 12 > 12
type(x)

Bool'sche Ausdrücke selbst können mit logischen Operatoren verbunden werden.

Hier benutzt Python eine etwas andere Syntax wie z.B. C oder Java, indem die Operatoren *ausgeschrieben* werden.

`not` invertiert einen logsichen Ausdruck, mit `and` und `or` verknüpft man zwei logische Ausdrücke mit einem logischen UND, bzw. ODER.

**Aufgabe:** Ein logisches XOR gibt es nicht. Wie können sie es mit den existierenden logischen Operatoren realisieren?

In [None]:
print('x\ty\tx XOR y')
print('------------------------')
a = [True, False]
b = [True, False]

Kurzauswertungen sind nach dem Muster `<Operator>=` möglich.
Beispielsweise entspricht `x*=3` dem Ausdruck `x=x*3`.

Inkrement/Dekrement Operatoren wie in C oder Java existieren in Python allerdings nicht.
Sie werden üblicherweise durch eine Kurzauswertungs-Schreibweise ersetzt, also z.B. `x+=1`.

### Sequenzielle Datentypen

Unter sequenziellen Datentypen wird eine Klasse von Datentypen zusammengefasst, die Folgen von **gleichartigen oder verschiedenen** Elementen verwalten.
Die in sequenziellen Datentypen gespeicherten Elemente haben eine definierte Reihenfolge und man kann über eindeutige Indizes auf sie zugreifen.

Den sequenziellen Datentyp `str` haben wir schon kennengelernt, er speicherteine folge von Zeichen, auch *zeichenkette* oder *String* genannt.
Der Typ `bytes` (bzw. seine veränderliche Variante `bytearray`) ist den Strings ähnlich, verwaltet aber Folgen von Bytes (statt Zeichen).
`bytes` ist in Python der Standardtyp um mit Binärdaten umzugehen.

Neben Strings werden in Python häufig auch die sequenziellen Datentypen `list` und `tuple` eingesetzt.
Mit ihnen können geordente Folgen von Objekten (bzw. von den Refeferenzen der Objekte) gespeichert werden.



| <p align="left">Modus | <p align="left">Beschreibung | <p align="left"> Veränderbarkeit |
| --- | --- | --- |
| <p align="left"> `list` | <p align="left"> Listen beliebiger Instanzen | <p align="left"> veränderlich |
| <p align="left"> `tuple` | <p align="left"> Listen beliebiger Instanzen unveränderlich | <p align="left"> unveränderlich |
| <p align="left"> `str` | <p align="left"> Text als Sequenz von Buchstaben | <p align="left"> unveränderlich |
| <p align="left"> `bytes` | <p align="left"> Binärdaten als Sequenz von Bytes | <p align="left"> unveränderlich |
| <p align="left"> `bytearray` | <p align="left"> Binärdaten als Sequenz von Bytes | <p align="left"> veränderlich |


Sequenzielle Datentypen untestüzen eine Reihe von Operationen die den Umgang mit den Daten erleichtern.
Folgende Tabelle gibt einen Überblick über die Operatoren und Funktionen die auf sequenziellen Datentypen definiert sind (Quelle: Lehrbuch Site 148f.):

| <p align="left"> Notation | <p align="left"> Beschreibung |
| :--- | :--- |
| <p align="left"> `x in s` | <p align="left"> Prüft, ob x in s enthalten ist. Das Ergebnis ist ein Wahrheitswert. |
| <p align="left"> `x not in s` | <p align="left"> Prüft, ob x nicht in s enthalten ist. Das Ergebnis ist eine bool-Instanz. Gleichwertig mit not x in s. |
| <p align="left"> `s + t` | <p align="left"> Das Ergebnis ist eine neue Sequenz, die die Verkettung von s und t enthält. |
| <p align="left"> `s += t` | <p align="left"> Erzeugt die Verkettung von s und t und weist sie s zu. |
| <p align="left"> `s * n oder n * s` | <p align="left"> Liefert eine neue Sequenz, die die Verkettung von n Kopien von s enthält. |
| <p align="left"> `s *= n` | <p align="left"> Erzeugt das Produkt s * n und weist es s zu. |
| <p align="left"> `s[i]` | <p align="left"> Liefert das i-te Element von s. |
| <p align="left"> `s[i:j]` | <p align="left"> Liefert den Ausschnitt aus s von i bis j. |
| <p align="left"> `s[i:j:k]` | <p align="left"> Liefert den Ausschnitt aus s von i bis j, wobei nur jedes k-te Element beachtet wird. |

| <p align="left"> Notation | <p align="left"> Beschreibung |
| :--- | :--- |
| <p align="left"> `len(s)` | <p align="left"> Gibt die Anzahl der Elemente von s zurück. |
| <p align="left"> `max(s)` | <p align="left"> Liefert das größte Element von s, sofern eine Ordnungsrelation für die Elemente definiert ist. |
| <p align="left"> `min(s)` | <p align="left"> Liefert das kleinste Element von s, sofern eine Ordnungsrelation für die Elemente definiert ist. |
| <p align="left"> `s.index(x)` | <p align="left"> Gibt den Index des ersten Vorkommens von x in der Sequenz s zurück. |
| <p align="left"> `s.count(x)` | <p align="left"> Zählt, wie oft x in der Sequenz s vorkommt. |

#### Listen

Listen sind eine sequentielle Anordnung die beliebige (Referenzen auf) Objekte aufnehmen kann.
Erinnern Sie sich, dass in Python *alles* ein Objekt ist, also auch Elemente von Basis-Typen wie `ìnt`, `float`, oder `string`.
Beispiele für Listen sind etwa:
```python
a = [1, 2.4, "Hallo"]
b = [6, 2, [False, True, False], 44]
```
Alle sequenziellen Datentypen haben gemein, dass ihre Elemente eine feste Anordnung haben und über einen fortlaufenden Index adressierbar sind.
So liefert `a[2]` den String `Hallo`, `b[2][1]` den Wert `True`.

Wie die Beispiele zeigen, werden Listen in Python angelegt, indem die Elemente in eckige Klammern `[...]` geschrieben werden.
So lässt sich auch eine leere Liste mit `a = []` anlegen.

Für Listen existieren die Funktionen:
- `l.append(e)` zum Anängen des Objekts `e` an das Ende der Liste `l`
- `l.extend(m)` zum Anängen aller Elemente von `m` an das Ende der Liste `l`
- `l.insert(i, e)` Einfügen des Objekts `e` an der Stelle `i` in die Liste `l`. Die anderen Elemente in `l` rücken von der Position `i` (einschließlich) um eine Position nach hinten
- `l.pop([i])` Liefert das `i`-te Element der Liste `l` zurück und entfernt es aus der Liste. Die folgenden Elemente rücken um eine Position nach vorne. Der Parameter `i` ist optional. Fehlt er, wird das letzte Element der Liste entnommen
- `l.remove(e)` Entfernt das erste Vorkommen von `e` aus der Liste `l`
- `l.reverse()` Kehrt die Reihenfolge der Elemente in s um
- `l.sort()` Sortiert die Liste `l` *in-place* (es wird keine neue Liste erzeugt)

In [None]:
x = [4,3,2,1]
print(id(x), x)
x.append(5)
print(id(x), x, "(Hänge ein Element an:)")
x+=[6]
print(id(x), x, "(Verbinde 2 Listen mit '+')")
x=x+[7]
print(id(x), x, "(Die Zuweisung mit '=' erzeugt eine neue Liste)")
x.sort()
print(id(x), x, "(Sortieren)")
y = [9,9,9]
x.extend(y)
print(id(x), x, "(Verbinde 2 Listen mit extend())")
x.append(y)
print(id(x), x, "(Anhängen eines Elements vom Typ list)")
x.pop(0)
print(id(x), x, "(Entnehmen des ersten Elements)")

**Aufgabe:** Gegeben seien die folgenden Listen `a` und `b`:
```python
a = [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31]
b = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
```
Berechnen Sie eine neue Liste `c`, die alle Elemente von `a` enthält die **nicht** in `b` sind.

#### Veränderbare und nicht-veränderbare Objekte

Python unterscheidet zwischen veränderbaren und unveränderbaren Objekten.

Instanzen von Basistypen sind unveränderbar.

Das bedeutet, wenn Sie einer existierenden Variablen `x` einen neuen Wert zuweisen, so wird ein *neues Objekt* angelegt und der Variablen zugewiesen.

In [None]:
x = 1.2
print(id(x))
x = 1.2
print(id(x))

Auch eine Kurzauswertungsoperation führt zum Anlegen eines neuen Objekts.

In [None]:
x = 1234
print(id(x), x)
x += 1
print(id(x), x)

Unveränderbare (**immutable**) Objekte haben einigen Vorteile gegenüber veränderbaren (**mutable**) Objekten.
Die Unveränderbarkeit von Objekten verhindert Seiteneffekte.
Das bedeutet, wenn man ein immutable Object benutzt, kann man sicher sein, dass die Werte des Objekts nicht an anderer Stelle geändert wurden.
Betrachten wir folgendes Beispiel:
```python
x = [1,2,3]
y = x
print(x is y)
x[0] = 42
print(y)
```
```
True
[42, 2, 3]
```

Die Variablen `x` und `y` zeigen hier auf dasselbe Objekt, was belegt wird, durch die Überprüfung der Identität von `x` und `y` mit dem `is`-Operator.
Durch Verändern von `x` wird nun gleichzeitig `y` verändert, schließlich referenzieren die beiden Variablen ja dasselbe Listen-Objekt.

Wenn `x` und `y` unveränderbar wären, dann wäre die Zuweisung `x[0] = 42` nicht möglich.

In diesem Fall müsste eine neue Liste mit `x = [42,2,3]` angelegt werden.
Aber nun ist `x` aber ein neues Objekt, das von `y` verschieden ist.

Durch das Unveränderbarmachen eines Datentyps erreicht man also, dass die Art Seiteneffekte nicht entstehen.
Ein weiterer Vorteil von unveränderbaren Typen ist, dass sich die Daten im Speicher in kompakterer Form darstellen lassen.

Allerdings haben immutable Objekte auch Nachteile.
Wenn Sie ein Objekt verändern, also z.B. eine Sequenz erweitern, oder ein Element aus der Sequenz löschen wollen, müssen Sie die komplette Sequenz kopieren und als neues Objekt anlegen.

Kommt das Verändern häufiger vor oder besteht die Sequenz aus vielen Elementen, so bringt die Unveränderbarkeit deutliche Performance-Einbußen mit sich.

**Achtung:** Ein Objekt eines unveränderbaren Datentyps kann selbst wieder Objekte von veränderbaren Typen enthalten.
Im folgenden Beispiel ist die (veränderbare) Liste `x` teil des (unveränderbaren) Tupels `y`.
Wenn `x` geändert wird, ändert sich implizit auch `y` mit.

In [None]:
x = [1,2,3]
y = (1,2,x)
print(y)
x[0]=44
print(y)

#### Tupel

Der Datentyp `tuple` ist die unveränderbare Variante des Typs `list`.
Durch die Tatsache, das einmal erzeugte Tupel nicht mehr verändert werden können, entfallen viele der Funktionalitäten der Listen.
Funktionen wie `append`, `extend` oder `pop` ergeben für Tupel keinen Sinn.

Tupel werden über eine mit Komma getrennte Liste von Elementen erzeugt.
Optional kann das Tupel in runde Klammern gesetzt werden.
Durch die Klammern erkennt man auch bei der Ausgabe, dass es sich um einen Tupel-Typ handelt.

In [None]:
x = 1,2,3
y = ('A',4,5.6)
print(x)
print(y)

Eine Ausnahme besteht beim Anlegen eines Tupels mit nur einem Element.

Angenommen, wir wollen ein Tupel `x`erstellen, das nur die Zahl `1` als Element enthält.
Bei der Schreibweise `x = 1` wird die `1`natürlich nicht als Tupel interpretiert.
Aber auch die Schreibweise `x = (1)` ist widersprüchlich, denn `(1)` ist eine geklammerte Integer-Zahl.

Um diese Mehrdeutigkeiten auszuschließen, wird bei einem Tupel, das aus nur einem Element bestehen soll, ein Komma hinter das Element gesetzt.
Damit ist es für den Python Interpreter klar, dass es sich um ein Tupel handeln soll.

In [None]:
x = 1,
y = (2.0,)
print(type(x), x)
print(type(y), y)

Über die Konvertierungsfunktionen `list()` und `tuple()` lassen sich Listen bzw.
Tupel aus Objekten anderer sequenzielle Datentypen erzeugen.

Um aus einem Tupel oder eine Liste einen String zu machen, genügt die `str()` Funktion allerdings nicht.
Hier hilft die Methode `c.join(s)`, die, aufgerufen auf einem Zeichen `c`, die Elemente von `s` mit dem Trennzeichen `c` zu einem String verbindet.

In [None]:
s = "ABC"
t = tuple(s)
print(type(t), t)
l = list(t)
print(type(l), l)
l[2]='B'
s = ''.join(l)
print(type(s), s)

#### Packing / Unpacking

Wir haben gesehen, dass man die runden Klammern beim Erstellen von Tupel weglassen kann.
Diese Eigenschaft nennt man auch *tuple packing*.
Ein ähnliches Prinzip, genannt *unpacking*, gibt es auch bei der Zuweisung eines Tupels oder einer Liste auf mehrere Variable.

Ist die rechte Seite einer Zuweisung ein Objekt eines sequenziellen Datentyps, kann dieses auf mehrere Zielvariable zugewiesen werden.
Im unteren Beispiel wird der String `"123"` der Variablen `x` zugewiesen.
`x` besitzt also einen sequenziellen Datentyp und hat 3 Elemente.
Wir können daher `x` auf 3 andere Variable zuweisen.

In [None]:
x = "123"
a,b,c = x
b

In [None]:
a = ["Primzahlen", [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31]]
name, l = a
print(name)
print(l)

Mit Unpacking hat man auch eine äußerst kompakte Möglichkeit, um die Werte mehrerer Variablen zu vertauschen:

In [None]:
a, b = 10, 20
a, b = b, a
a

Es kommt relativ häufig vor, dass man nur eins oder wenige Elemente einer Sequenz "auspacken" möchte.
Da die Anzahl der Elemente in einer Sequenz groß sein kann, wäre es äußerst unpraktisch, wenn man immer die genaue Zahl von Einzelvariablen auf der linken Seite der Zuweisung angeben müsste.
Es gibt daher einen speziellen Operator, mit dem eine Variable als Sequenz-Typ markiert werden kann.
Diese Sequenz-Variable übernimmt dann die Werte, die nicht auf die Einzelvariablen zugewiesen werden.

In [None]:
p = [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31]
p0, p1, p2, *px = p
px

Die Aufteilung der Werte auf die Variablen muss dabei eindeutig sein.
Folgende Zuweisung funktioniert daher nicht:

In [None]:
p = [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31]
*pa, pm, *pe = p
pa

**Aufgabe:** Schreiben Sie eine Funktion `fib(n)`, die die `n`-te Fibonacci-Zahl **sowie** die Fibonacci-Folge vom ersten bis `n`-ten Element zurückliefert.

Der Unpacking Operator `*` funktioniert auch an anderen Stellen, z.B. bei *Generatoren*.

Generatoren sind spezielle Funktionen, die Folgen von Objekten generieren.

Wir haben bereits öfter den `range()`-Generator benutzt.

Um einen Generator-Aufruf direkt in eine Liste zu überführen, können wir den Unpacking Operator benutzen.

In [None]:
[* range(10) ]

**Aufgabe:** Erstellen Sie eine Liste mit den Ungeraden Zahlen zwischen 20 und 50.

#### Indizierung

Schon mehrfach haben wir über die Index-Klammern `[]` auf einzelne Elemente eines sequenziellen Datentyps zugegriffen.
Es gibt aber auch die Möglichkeit, ganze Bereiche aus einer Sequenz zu selektieren.
Diese Art Zugriffe nennt man auch *slicing*.

Beim Zugriff per slicing gibt man in der Index-Klammer einen Bereich an.
Dabei ist zu beachten, dass der Endwert als exklusiv zu interpretieren ist und damit nicht mehr zu dem Bereich gehört.
`x[2:5]` liefert also die Elemente `x[2]`, `x[3]` und `x[4]` als Sequenz zurück.

Optional kann noch ein weiterer Parameter für die Schrittweite angegeben werden.
`x[1:10:2]` liefert z.B. die Elemente mit ungeradem Index im Bereich 1 bis 9.

Eine weitere Möglichkeit der Indizierung funktioniert mit negativen Indizes.
Mit `x[-1]` referenziert man das letzte Element der Sequenz `x`.
Zusammen mit einer negativen Schrittweite kann man damit auch rückwärts über die Elemente der Sequenz iterieren.

In [None]:
z = [i for i in range(15)]
print(z, "(Die Liste)")
print(z[3], "(Das Element mit Index 3 aus der Liste)")
print(z[3:12], "(Elemente von Index 3 bis 11)")
print(z[3:12:2], "(Jedes zweite Element von Index 3 bis 11)")
print(z[-2], "(Das Element mit dem vorletzten Index aus der Liste)")
print(z[-1:-5:-1], "(Die letzten 4 Elemente der Liste in umgekehrter Reihenfolge)")

**Aufgabe:** Die folgende Code-Zelle generiert eine (zweidimensionale) Liste von Listen mit durchnummerierten Integer Werten.
Schreiben Sie eine Funktion `teilmatrix(A,a=0,b=0,c=0,d=0)` die eine Teilmatrix von `A` als neue zweidimensionale Liste zurückgibt.

Die Teilmatrix soll die Zeilen `a` bis `b` (ausschließlich) und darin die Elemente in den Spalten `c` bis `d` (ausschließlich) umfassen.

`a`, `b`,`c` und `d` sind optionale Parameter, falls sie beim Funktionsaufruf nicht angegeben werden, wird die Initialbelegung (hier `0`) angenommen.

Falls die oberen Begrenzungen (`b` und `d`) nicht oder gleich 0 gesetzt sind, soll die maximale Länge der Zeilen bzw. Spalten angenommen werden.

In [None]:
rows = 5
cols = 5
A = [[y for y in range(x*cols,(x+1)*cols)] for x in range(rows)]
A

### Dictionaries


*Mappings* sind Datentypen, die Zuordnungen zwischen verschiedenen Objekten herstellen.

Der Python Datentyp, *Dictionary* (dt. *Wörterbuch*) gehört zu dieser Kategorie.

Ein Dictionary enthält beliebig viele Schlüssel-Wert-Paare (engl. *key/value pairs*), wobei der Schlüssel nicht unbedingt, wie der Index bei sequentiellen Datentypen, eine ganze Zahl sein muss.

Vielleicht ist Ihnen dieser Datentyp schon von einer anderen Programmiersprache her bekannt, wo er als assoziatives Array (u. a. in PHP), Map (u. a. in C++) oder Hash (u. a. in Perl) bezeichnet wird.

Der Datentyp dict ist mutabel, also veränderlich.

In [None]:
haupstaedte = {"DE" : "Berlin", "FR" : "Paris", "US" : "Washington", "CH" : "Zurich"}
for s in haupstaedte:
    print(haupstaedte[s])

Folgende Funktionen sind für den Dictionary-Typ definiert:
- `d.clear()` Löscht alle Elemente aus dem Dictionary `d`
- `d.copy()` Erzeugt eine Kopie von `d`
- `d.get(k)` Liefert `d[k]`, wenn der Schlüssel `k` vorhanden ist. Im Gegensatz zu `d[k]` erzeugt `d.get(k)` keinen Laufzeitfehler, wenn der Schlüssel `k` im Dictionary nicht existiert
- `d.items()` Gibt ein iterierbares Objekt zurück, mit dem alle Schlüssel-Wert-Paare von `d` durchlaufen werden können
- `d.keys()` Gibt ein iterierbares Objekt zurück, mit dem alle Schlüssel von `d` durchlaufen werden können
- `d.values()` Gibt ein iterierbares Objekt zurück, mit dem alle Werte von `d` durchlaufen werden können
- `d.pop(k)` Gibt den zum Schlüssel `k` gehörigen Wert zurück und löscht das Schlüssel-Wert-Paar aus dem Dictionary `d`
- `d.popitem()` Gibt ein willkürliches Schlüssel-Wert-Paar von `d` zurück und entfernt es aus dem Dictionary `d`
- `d.setdefault(k, [x])` Fügt den Wert `x` unter dem Schlüsssel `k` hinzu, falls `k` nicht schon vorhanden ist
- `d.update(d2)` Fügt ein Dictionary `d2` zu `d` hinzu und überschreibt gegebenenfalls die Werte bereits vorhandener Schlüssel
- `dict.fromkeys(s, [v])` Erstelle ein neues Dictionary mit den Werten der Liste `s` als Schlüssel und setzte alle Werte auf `v`


In [None]:
d = {'key1':1.23,('k','e','y','2'):(1,2,3),'key4':2}
d[33]=True
print("Items:", d.items())
print("Values:", d.values())
print("Keys:", d.keys())
print("Dictionary:", d)
d.setdefault('key3',['A','B','CDE'])
print("Dictionary:", d)
print("Pop Element:", d.popitem())
print("Pop Element:", d.pop('key1'))
print("Dictionary:", d)
d.clear()
print("Dictionary:", d)

Für Dictionaries gibt es verschiedene Iteratoren.

In [None]:
d = {'key1':1.23,'key2':(1,2,3),'key3':['A','B','CDE']}
print("Items:")
for i in d.items(): print(i, end=' ')
print("\nValues:")
for v in d.values(): print(v, end=' ')
print("\nKeys:")
for k in d.keys(): print(k, end=' ')

**Aufgabe:** In der folgenden Code-Zelle wird ein zweidimensionales Feld erzeugt.
Jedes Element der der äußeren Liste ist wieder eine Liste.
Diese inneren Listen bestehen aus Daten verschiedenen Typs.
Das erste Element ist ein Integer, dass die Matrikelnummer von Studierenden darstellen soll.
Das zweite Element ist ein Name, kodiert als String. 
Danach folgen drei Integer-Werte, die die Punkte für drei Klausuraufgaben wiedergeben.

1. Lesen Sie die Liste `data` in ein Dictionary ein und verwenden Sie als Schlüssel die Matrikelnummern der Studierenden. Als Werte sollen die Punkte in Form eines 3-Tupels zusammen mit dem Namen als Liste gespeichert werden.
2. Erweitern Sie sie Werte des Dictionaries indem Sie die Gesamtpunktzahl in der Liste hinzfügen.

In [None]:
from random import randint, seed
seed(1)
names = ["Alice","Bob","Carol","Fan","Eve","Frank","Grace","Harry","Ivy","John"]
data = []
for i in range(10):
    matnr = 2000000 + randint(34, 42) * 100 + randint(0,100)
    name = names[i]
    p1 = randint(0,10)
    p2 = randint(0,10)
    p3 = randint(0,10)
    data.append([matnr, name, p1, p2, p3])
data

1\. Lesen Sie die Liste `data` in ein Dictionary ein und verwenden Sie als Schlüssel die Matrikelnummern der Studierenden. Als werte sollen die Punkte in Form eines 3-Tupels zusammen mit dem Namen als Liste gespeichert werden.

2\. Erweitern Sie sie Werte des Dictionaries indem Sie die Gesamtpunktzahl in der Liste hinzfügen.

### Mengen

Eine Menge (engl. *set*) ist eine ungeordnete Sammlung von Elementen, in der jedes Element nur einmal enthalten sein darf. In Python gibt es zur Darstellung von Mengen zwei Basisdatentypen: `set` für eine veränderliche Menge sowie `frozenset` für eine unveränderliche Menge – set ist demnach mutabel, frozenset immutabel.

In [None]:
s = {4,4,4,4,3,3,3,2,2,1}
s

Mit der Funktion `set(seq)` kann man aus einer beliebigen Sequenz eine Menge erstellen.
Die Funktion `set()` ist darüber hinaus notwendig, um eine leere Menge zu Erzeugen.
Die geschweiften Klammern, mit denen eine Menge angelegt werden kann, wird auch für Dictionaries benutzt und die Zeichenfolge `{}` würde Python als leeres Dictionary interpretieren.

In [None]:
s = input ("Zeichenkette eingeben: ")
set(s)

Auf Mengen sind auch die mathematischen Mengenoperationen definiert.

Mit `s >= t`überprüft man, ob `t` eine Teilmenge von `s` ist.

Die Vereinigungsmenge von `s` und `t` bildet man mit `s | t`, die Schnittmenge mit `s & t`.

In [None]:
set("Hallo")&set("Welt")

**Aufgabe:** In der folgenden Code-Zelle wird eine Text-Datei (J.W. von Goethe - Faust I) eingelesen und zeilenweise verarbeitet.
Die Worte in den Zeilen werden nach Leerzeichen getrennt (`line.split()`), danach werden noch die Satzzeichen (`string.punctuation`) entfernt und alle Buchstaben zu Kleinbuchstaben gemacht (`w.lower()`).

Der Ausgangspunkt für die Aufgabe ist die Liste `faust`, die alle Worte des Goethe-Werks enthält.

1. Geben Sie die ersten 200 Worte des Textes über die Liste `faust` aus. Um die Lesbarkeit zu verbessern, können Sie aus einer Liste einen String machen. `' '.join(liste)` verbindet alle Elemente von `liste` mit einem Leerzeichen `' '`. Das Ergebnis können Sie mit `print` ausgeben.
2. Bestimmen Sie die Länge des Textes in der Anzahl der Wörter.
3. Bestimmen Sie die Anzahl der voneinander verschieden Wörter im Text. Jedes Wort soll also nur einmal gezählt werden.
4. Bestimmen Sie die Häufigkeit der Vorkommen aller Wörter im Text. Legen Sie dazu Dictionary an, dass die verschiedenen Wörter des Textes als Schlüssel und die Vorkommen der Wörter als Wert benutzt.
5. Bestimmen Sie die `n` (z.B. 10, 30, ...) häufigsten Wörter im Text.

In [None]:
import os, codecs, string
faust = []
with codecs.open('faust.txt','r', 'utf-8') as f:
    for line in f:
        for word in line.split():
            w = word.translate(str.maketrans('', '', string.punctuation))
            faust.append(w.lower())

1\. Geben Sie die ersten 200 Worte des Textes über die Liste `faust` aus. Um die Lesbarkeit zu verbessern, können Sie aus einer Liste einen String machen. `' '.join(liste)` verbindet alle Elemente von `liste` mit einem Leerzeichen `' '`. Das Ergebnis können Sie mit `print` ausgeben.

2\. Bestimmen Sie die Länge des Textes in der Anzahl der Wörter.

3\. Bestimmen Sie die Anzahl der voneinander verschieden Wörter im Text. Jedes Wort soll also nur einmal gezählt werden.

 4\. Bestimmen Sie die Häufigkeit der Vorkommen aller Wörter im Text. Legen Sie dazu Dictionary an, dass die verschiedenen Wörter des Textes als Schlüssel und die Vorkommen der Wörter als Wert benutzt.

5\. Bestimmen Sie die n (z.B. 10, 30, ...) häufigsten Wörter im Text.

# Funkionen

Funktionen in Python werden über das Schlüsselwort `def` definiert. Die Syntax einer Funktions-Definition sieht folgendermaßen aus:

```python
def myfunc(arg1, arg2,... argN):  
  '''Dokumentation'''  

  #Programmcode  

  return <Rückgabewert>  
```

Hier wird die Funktion "myfunc" definiert, welche mit den Parametern "arg1,arg2,....argN" aufgerufen werden kann. Im Funktionsrumpf kann vor dem eigentlichen Programmcode noch eine Dokumentation zu der Funktion angegeben werden. (Siehe auch: Kapitel 36 _Dokumentation_ in: Ernesti und Kaiser, "Python 3: Das umfassende Handbuch", Rheinwerk 2018)

Die Dokumentation sowie der Rückgabewert sind optional. Eine Funktion muss aber mindestends eine Anweisung enthalten. Deshalb ist die folgende Definition ungültig:

In [None]:
def leer():
      

Falls Sie eine Funktion definieren, aber nicht ausimplementieren wollen, können Sie die `pass`-Anweisung benutzen. Sie wird eingesetzt, wenn die Syntax eine Anweisung verlangt, das Programm jedoch nichts tun soll.

In [None]:
def fastleer():
    pass

## Schreiben einer Funktion

Hier ist noch einmal die Beispiel-Funktion aus Kapitel 19.1 des Lehrbuchs.

In [None]:
def fak(zahl):
    '''Berechnet die Fakultät einer Zahl'''
    ergebnis = 1
    for i in range(2, zahl+1):
        ergebnis *= i
    print(ergebnis)

#Ein einfacher Test:
fak(10)

Diese Funktion ist allerdings nur bedingt nützlich, da sie das Resultat der Berechnung nur auf die Standardausgabe schreibt, aber keinen Rückgabewert definiert. Daher ist es sinnvoll, die Funktion so zu umzuschreiben:


In [None]:
def fak(zahl):
    '''Berechnet die Fakultät einer Zahl'''
    ergebnis = 1
    for i in range(2, zahl+1):
        ergebnis *= i
    return ergebnis

#Ein einfacher Test:
fak(10)

Natürlich können Sie die Fakultät-Funktion auch rekursiv definieren:

In [None]:
def fak(n):
    '''Berechnet die Fakultät der Zahl n'''
    if n > 0:
        return fak(n - 1) * n
    else:
        return 1
    
print(fak(10))

Da wir einen *Docstring* angegeben haben, können wir Informationen zur Funktion über das Hilfesystem abfragen:

In [None]:
help(fak)

Auf den Docstring kann man auch innerhalb eines Programms zugreifen:

In [None]:
print(fak.__doc__)

**Aufgabe 1**

**Schreiben Sie eine Funktion `ggt(a,b)`, die den größten gemeinsamen Teiler (ggT) zweier Zahlen berechnet.**

**Hinweise:** Eine effiziente Möglichkeit, den ggT zu berechnen ist der euklidische Algorithmus. Das Verfahren funktioniert folgendermaßen:
1. Spezialfälle abfangen: Wenn (a==0) gilt, ist das Ergebnis der Funktion `b`; wenn (b==0) gilt, ist das Ergebnis `a`.  
2. Solange `b!=0` ("b ungleich 0") gilt, wiederhole folgende Schritte:  
    1. Berechne r als den ganzzahligen Rest der Division $\frac{a}{b}$ ("r = a modulo b")  
    2. Setze a=b und b=r
3. Gebe a als Ergebnis zurück


Weitere Informationen finden Sie z.B. auf [Wikipedia](https://de.wikipedia.org/wiki/Gr%C3%B6%C3%9Fter_gemeinsamer_Teiler)

In [None]:
def ggt(a, b):
    if(a == 0):
        return b
    if(b == 0):
        return a
    
    while (b != 0):
        r = a % b;
        a = b;
        b = r;
            
    return a

Überprüfen Sie die Funktion anhand von Beispielen.

In [None]:
print("ggT von 168 und 546 ist %d (richtig ist 42)" % ggt(168,546))

## Funktionsparameter

Sie haben nun eine `ggt` Funktion, die den größten gemeinsamen Teiler zweier Zahlen berechnet. Falls Sie den ggT von mehr als 2 Zahlen berechnen wollen, können Sie die Funktion `ggt` mehrfach benutzen.  
Nehmen wir an Sie wollen den ggt der Zahlen a, b, und c berechnen. Es gilt $ggT(a,b,c)=ggT(ggT(a,b),c)$  
Da für die ggT Funktion das Assoziativgesetz gilt, ist es unerheblich, in welcher "Reihenfolge" Sie die Funktion aufrufen. Es gilt also $ggT(ggT(a,b),c)=ggT(a,ggT(b,c)$.

Um die ggT Funktion nun allgemeiner, für mehrere Parameter zu definieren, benennen wir zunächst die ursprüngliche Funktion `ggt` in `ggt2` um:

In [None]:
ggt2=ggt

Das funktioniert, weil der Funktionsname nur ein Zeiger auf das eigentliche Funktionsobjekt ist. Sie können nun die Funktion über beide "Namen" aufrufen:

In [None]:
print(ggt(168,546))
print(ggt2(168,546))

Der "alte" Name kann weiter bestehen, Sie können ihn aber auch explizit löschen:

In [None]:
del ggt
print(ggt(168,546))
print(ggt2(168,546))

**Aufgabe 2**

**Schreiben Sie eine Funktion `ggt3(a,b,c)`, die den ggT dreier Zahlen a, b und c berechnet. Die Funktion soll auch ein korrektes Ergebnis zurückgeben, wenn nur 2 der 3 Parameter beim Funktionsaufruf gesetzt werden.**

In [None]:
def ggt3(a=0, b=0, c=0):
    return ggt2(ggt2(a,b),c)

Überprüfen Sie ihre Funktion anhand einiger Beispiele:

In [None]:
ggt3(168,546)

In [None]:
ggt3(b=168,c=546)

Die ggT-Funktion um einen Parameter zu erweitern ist nicht gerade sinnvoll. Besser wäre es, wenn man `ggt()` mit einer beliebigen Anzahl von Parametern aufrufen könnte.  

**Aufgabe 3**

**Schreiben Sie eine Funktion `ggt`, die den ggT von 2 und mehr Zahlen berechnet.**

**Hinweise:** Verwenden Sie variable (Positions-) Parameter mit dem `*<parameter-tupel>` Konstrukt.

In [None]:
def ggt(a, b, *p, **kwp):
    prev = ggt2(a,b)
    if(p):
        for z in p:
            prev = ggt2(prev,z)
    else:
        print("Nur 2 Parameter angegeben")
    if(kwp):
        for z in kwp.values():
            prev = ggt2(prev,z)
    else:
        print("Kein kwp angegeben")
    return prev

In [None]:
tupel = ()
if tupel:
    print("Nicht leer")

Testen Sie ihre Implementierung:

In [None]:
ggt(16, 20, 4, letzter=2)

Sie können sich auch zu Testzwecken eine Eingabe für ihre Funktion generieren. Im nächsten Code Abschnitt wird eine Liste von 4er Potenzen erzeugt. Dieses Beispiel zeigt im Übrigen auch eine sinnvollere Anwendung von benannten Parametern: Die `print` Funktion gibt im Normalfall ihren ersten Parameter auf der Standardausgabe aus und schließt die Ausgabe mit einem Zeilenumbruch ab. Wenn Sie statt des Umbruchs eine andere Zeichenkette verwenden wollen, so können Sie den `end` Parameter überschreiben.

In [None]:
for z in range(1,10): print(4**z, end=", ")
print(4**10)

In [None]:
ggt(4, 16, 64, 256, 1024, 4096, 16384, 65536, 262144)

Im vorherigen Schritt haben wir die eine "Liste" von Argumenten generiert. Diese Liste ist aber nur eine Reihe von ausgegebenen Werten, kein Listen-Objekt in Python.

**Aufgabe 4**

**Wandeln Sie den Test-Code für die `ggt` Funktion so um, dass sie ein Tupel-Objekt `t` and den Funktionsaufruf übergeben. Testen Sie ihre Implementierung**


In [None]:
l = []
for z in range(3,11): l.append(4**z)
t = tuple(l)
ggt(4,16,*t)
print(*t)
t

Sie können zusätzlich eine variable Liste von benannten Objekten as Funktionsargument übergeben.
Der Parameter in fer Funktion wird dann mit zwei Sternen `**` eingeleitet.

In [None]:
def myfunct(**kwargs):
    print(list(kwargs.keys()))
    print(list(kwargs.values()))

myfunct(A=1, B='Zwei', C=3)

Dabei können Sie auch ein Dictionary übergeben, bei dem die Keys ausschließlich aus Stings bestehen

In [None]:
dictionary = {'Erster':1, 'Zweiter':'2ter', 'Dritter':3.0}
myfunct(**dictionary)


Wenn Sie eine variable Liste unbenannter Objekte sowie eine variable Liste benannter Ojekte übergeben wollen, müssen alle unbenanten Objekte **vor** den benannten stehen.

In [None]:
def myfunct(*args, **kwargs):
    print(list(args))
    print(list(kwargs.keys()))
    print(list(kwargs.values()))

myfunct(1, 'B', A=3, B='Vier', C=5)


## Namensräume

Beim Aufruf einer Funktion betreten Sie einen neuen Namensraum. Das ist wichtig, damit nicht alle Variablen in Ihrem Programm eindeutig definiert sein müssen.

Wenn Sie also in einer Funktion ein Objekt definieren, dessen Name bereits ausserhalb der Funktion benutzt wurde, hat der *lokale Kontext* Priorität.

In [None]:
a = "a aus main"
def f(a):
    a = "a aus f"
    print(a)

f(a)
a

Sie haben allerdings auch innerhalb einer Funktion Zugriff auf den übergeordneten Kontext.

In [None]:
def f():
    print(a)

a = "a aus main"
f()

Was der *übergeordnete Kontext* ist, hängt davon ab, wo die Funktion *definiert* wurde; nicht, in welchem Kontext sie aufgerufen wird.

In [None]:
a = "a aus main"

    
def f():
    def g():
        print(a)
    a = "a aus f"
    g()

f()

**Aufgabe 5**

**Ändern sie die Funktion f so um, dass das Resultat des Aufrufs `f()` "a aus f" ist.**


In [None]:
a = "a aus main"

    
def f():
    def g():
        print(a)
    a = "a aus f"
    g()

f()

Sobald Sie aus einer Funktion heraus schreibend auf eine globale Variable zugreifen wollen, wird eine lokale Kopie der Variablen erzeugt. Der Wert der Variablen im globalen Kontext bleibt erhalten. Um auch verändernd auf den globalen Namensraum zugreifen zu können, gibt es das Schlüsselwort `global`.

**Aufgabe 6**

**Ändern Sie die Funktion f so um, dass das Resultat des Aufrufs `print(a)` im folgenden Code Abschnitt "a aus f" ist.**

In [None]:
def f():
    global a
    a = "a aus f"

a = "a aus main"
f()
print(a)
    

Mit `global` greifen Sie immer auf den globalen Namensraum des Moduls zu. Es kann aber Fälle geben, in denen Sie nicht auf den globalen, sondern den nächst höheren Kontext zugreifen wollen. Dies kann über das Schlüsselwort `nonlocal` erreicht werden. Wenn Sie im folgenden Code Abschnitt `global` durch `nonlocal` ersetzen, erreichen Sie das gewünschte Verhalten.

In [None]:
def f():
    a = "Bitte überschreiben!"
    def g():
        nonlocal a
        a = "Neues a"
    print("Altes a in f: ", a)
    g()
    print("Neues a in f: ", a)


a = "Bitte nicht überschreiben!"
f()
print(a)

## Anonyme Funktionen

In Python (wie auch in vielen anderen Programmiersprachen) ist es möglich, (Zeiger auf) Funktionen als Argumente an andere Funktionen zu übergeben. Normalerweise muss hierzu die zu übergebende Funktion zuvor definiert werden. Bei Funktionen mit nur sehr wenigen Anweisungen kann dies zu unübersichtlichen Code führen.  
Anonyme Funktionen (oder auch *Lambda Funktionen*) bieten eine Möglichkeit, eine Funktion direkt in einem anderen Ausdruck anzugeben, ohne die Funktion selbst zuvor zu definieren. Eine Summenfunktion kann etwa mit dem Ausdruck `lambda x, y: x+y` beschrieben werden, besitzt aber in dieser Form keinen Namen.  

Es ist aber durchaus möglich, einer Lambda Funktion eine Variable zuzuweisen, über dessen Namen die Funktion im folgenden aufgerufen werden kann:

In [None]:
s = lambda x, y: x+y
s(4,5)

Eine "generische Funktion", die eine beliebige Funktion `f` auf 2 Argumente `a` und `b` anwendet und das Resultat zurückgibt, kann folgendermaßen beschrieben werden:

In [None]:
def wasauchimmer(a,b,f):
    return f(a,b)

Mittels anonymer Funktionen kann diese "generische Funktion" nun direkt benutzt werden, ohne die jeweiligen Funktionen `f` vorher zu definieren: 

In [None]:
wasauchimmer(4, 5, lambda x, y: x*y)

**Aufgabe 7**

**Implementieren Sie die Funktion `mymap` im folgenden Code Abschnitt soweit aus, dass die Funktion `f` auf alle Elemente der Liste `l` angewendet wird. Die so berechneten Elemente sollen in einer neuen Liste zusammengefasst werden, welche als Resultat der Funktion zurückgegeben wird. Testen Sie die Funktion mit 2 verschiedenen Lambda Funktionen ($x\mapsto{}x+1$ und $x\mapsto{}x^2$).**

In [None]:
def mymap(l, f):
    local_l = []
    for e in l: local_l.append(f(e))
    return local_l

l = []
for z in range(10): l.append(z)
print(l)
print(mymap(l, lambda x: x+1))
print(mymap(l, lambda x: x*x))

# Beispiele für Pakete aus der Standardbibliothek (und Drittanbieter-Pakete)
In diesem Arbeitsblatt geht es um weiterführende Themen rund um die Programmiersprache Python. Zu der enormen Popularität von Python hat nicht zuletzt die Vielzahl an frei verfügbaren Paketen zu verschiedensten Anwendungsgebieten beigetragen. Durch den Einsatz bestehender Module lassen sich Entwicklungszeiten drastisch verkürzen. Zusammen mit der relativ leichten Erlernbarkeit, hat dies Python den Ruf eingebracht, eine sehr produktive Programmiersprache zu sein.

In den folgenden Abschnitten werden die Themen Web-Zugriffe, Server-seitige Programmierung, Wissenschaftliches Rechnen und GUI-Programmierung kurz angerissen. Die Behandlung der Themen ist weder vollständig noch repräsentativ. Es soll lediglich darum gehen, Einblicke in verschiedene Aspekte zu vermitteln und Sie motivieren, im Selbststudium etwas tiefer in die vorgestellten, oder auch weitere Themen rund um Python einzusteigen.

## 1. Installieren von Drittanbieter-Paketen

Um Pakete von Drittanbietern zu installieren, sollten Sie in jedem Fall einen Paketmanager benutzen. Der am meisten verwendete Paketmanager für Python ist [pip](https://pip.pypa.io/en/stable/). Mit diesem Tool können Sie auf die Pakete zugreifen, die im _Python Package Index_ ([PyPI](https://pypi.org)) enthalten sind. Ab Version 3.4 ist pip bereits in der Python Standard-Distribution enthalten.
Um ein Paket zu installieren, führen Sie folgendes Kommando (auf der Kommandozeile) aus:
```python
pip3 install <paketname>
```
So aufgerufen, versucht _pip_ das Paket _systemweit_ im Python-Installationspfad zu installieren. Falls Sie nicht als Administrator auf Ihrem Computer angemeldet sind, kann dies zu Problemen führen. Daher wird allgemein empfohlen, dass Nutzer zusätzliche Pakete innerhalb von _Virtuellen Umgebungen_ ([virtualenv](https://packaging.python.org/guides/installing-using-pip-and-virtualenv/)) zu installieren.
Eine Alternative dazu ist, neue Pakete in einem Dateipfad zu installieren, auf den der Benutzer vollen Zugriff hat. Im  Python-Interpreter sind verschiedene Suchpfade bereits voreingestellt, in denen zur Laufzeit eines Programms nach verwendeten Paketen (siehe `import`-Anweisung) gesucht wird. Die entsprechenden Dateipfade sind natürlich vom dem verwendeten Betriebssystem abhängig und können z.B. wie folgt mit Python selbst gelistet werden:

In [None]:
import sys
for path in sys.path:
    print(path)

Um ein Paket zu installieren, können Sie prinzipiell auch `!pip install` aufrufen.
Dies hat aber einen Nachteil: Ihr Jupyter Notebook könnte eine Python Installation verwenden, die nicht die standard Python Installation auf Ihrem System ist. Der `pip`-Aufruf würde das Paket dann in diese Installation integrieren und Sie könnten es aus dem Notebook heraus nicht verwenden.

Daher ist es besser, die Python-Version zu verwenden, die Ihr Notebook benutzt.
Unter welchem Programmpfad der Python-Interpreter abgelegt ist, den das Notebook verwendet, kann man ebenfalls über das Modul `sys` herausfinden. `sys.executable` lifert den kompletten Pfad zum Python-Kommando.
Dies ruft man über das `!` Zeichen in der *Shell* auf und verwendet die Option `-m` mit dem Modul `pip`.
Mit `-m` kann man ein Modul wie ein Skript ausführen.
Über das Kommando `install` kann dann ein Modul, z.B. `python-chess` installiert werden.

In [None]:
import sys
!{sys.executable} -m pip install python-chess

Mit _pip_ können Sie bequem Python Pakete installieren und verwalten. _pip_ stößt aber an seine Grenzen, wenn man Abhängigkeiten installieren möchte, die nicht als Python Paket vorliegen. Beispiele dafür sind laufzeitoptimierte Bibliotheken für mathematisch/wissenschaftliche Zwecke, die oftmals in maschinennahen Code vorliegen (z.B. in C entwickelt und für eine entsprechende _Hardware Architektur_ kompiliert).

Hier schaffen Python Distributionen Abhilfe, die auch diese Abhängigkeiten enthalten und bei Bedarf mitinstallieren.
[Anaconda](https://www.anaconda.com/distribution/) ist ein Beispiel für eine solche Distribution. Der Paketmanager in Anaconda heißt _conda_ und lässt sich ähnlich wie _pip_ bedienen.

## 2. Bibliotheken einsetzen

Dank Pythons großer Entwickler-Community existiert eine riesige Menge an nützlichen Modulen, nicht nur in der umfangreichen Standardbibliothek sinder vor allem in den öffentlichen Repositories wie dem *Python Package Index*.

Wenn Sie ein Drittanbieter-Paket wie *python-chess* verwenden, ist die zugehöre Dokumentation in der Regel über das Web verfügbar.

In [None]:
import webbrowser
url = 'https://python-chess.readthedocs.io/en/latest/'
webbrowser.open(url)

Wenn Sie ein passendes Paket gefunden haben, können Sie dies häufig mit recht wenigen Schritten für Ihre Anwendung verwenden.

Im Folgenden Beispiel wollen wir ein Simples Schachprogramm schreiben. Es soll einen menschlichen und einen Computer-Spieler geben.
Das Modul *python-chess* liefert fast alles, was man dazu benötigt.

In [None]:
import chess
board = chess.Board()
board

In [None]:
move = chess.Move.from_uci('e2e4')
board.push(move)
board

Schwieriger ist es an dieser Stelle, die Ein- und Ausgaben für das Modul entsprechend einzustellen.
Die Züge sollen schließlich nicht über den Quelltext des Programms eingegeben werden.
Außerdem ist es unübersichtlich, wenn jede neue Spielsituation in einer neuen, zusätzlichen Ausgabe erscheinen.

Die Eingabe des Zuges können wir über die Python Eingabe-Funktion `input()` erledigen, die vom Benutzer eine Tastatureingabe abfragt.

In [None]:
text = input()
print("Sie haben " + text + " eingegeben!")

Um die Ausagben in einem Notebook schöner darzustellen kann man einige Funktionen aus dem Modul `IPython.display` verwenden:

- `IPython.display.SVG` Stellt ein svg-Bild dar
- `clear_output` löscht die Ausgabe einer Code-Zelle

In [None]:
import webbrowser
url = 'https://ipython.readthedocs.io/en/stable/api/generated/IPython.display.html'
webbrowser.open(url)

Um Züge darzustellen, kann man dann folgendes Muster verwenden.

In [None]:
import chess, time
from IPython.display import SVG, clear_output

sizilianisch = ['e2e4','c7c5','g1f3','d7d6','d2d4','c5d4']

board = chess.Board()
display(SVG(board._repr_svg_()))
for zug in sizilianisch:
    time.sleep(1)
    board.push(chess.Move.from_uci(zug))
    clear_output(wait=True)
    display(SVG(board._repr_svg_()))

Um nun ein sipmples Schachprogramm zu schreiben, ist die Funktion `list(board.legal_moves)` hilfreich.
Damit kann man eine Liste der aktuell auf dem Speilbrett gültigemn Züge berechen lassen.

Nutzen Sie die beschribenen (und weitere) Funktionen, um ein Schachprogramm zu schreiben.
Es ist Ihnen überlassen, wie *schlau* Ihr Computerprogramm spielt und welchen Funktionsumfang es hat.

## 3. Web-Zugriffe mit der *Requests* Bibliothek
**Hinweis: Das Lehrbuch behandelt ausschließlich die *urllib* und zwar auf den Seiten 643-651.**

[Requests](http://docs.python-requests.org/de/latest/user/quickstart.html) ist eine frei verfügbare Python Bibliothek zum Durchführen von HTTP-Anfragen. Im Vergleich zu der in der Standardbibliothek enthaltenen _urllib_ führt der Einsatz der _requests_ Bibliothek meistens zu etwas kürzerem und übersichtlicherem Code.

Vom Funktionsumfang sind beide Bibliotheken sehr ähnlich. Sie erlauben den (lesenden und schreibenden) Zugriff auf URL-Ressourcen über verschiedene Methoden.

Mittels `r = requests.get(<URL>)` kann eine Internetseite gelesen werden. Auf den Inhalt der Seite kann dann z.B. mit `r.text` (Inhalt als Schriftzeichen) oder `r.content` (Inhalt als Rohdaten/Bytes) zugegriffen werden.

Im folgenden Beispiel wird der aktuelle Börsenkurs einiger US-Unternehmen vom [Yahoo! Finance Portal](finance.yahoo.com) ausgelesen.
Die Börsen-Kürzel von *Apple*, *Facebook*, *Google*, *Netflix* und *Microsoft* stehen im Dictionary `stocks`.
Mit der `get`-Methode laden wir die entsprechende Seite unter Angabe des Query -Parameters `s` herunter.

Den Inhalt (ASCII-Text) der Seite erhalten wor über das Attribut `page.text`.
Darauf wir ein [Regulärer Ausdruck](https://docs.python.org/3/library/re.html) angewendet, der im html-Code nach dem ersten Auftreten eines HTML-Tags `<span class="Trsdu` sucht.
Wir überspringen die nächsten Zeichen, bis zum abschließenden `>` des Tags.
Die nächsten Zeichen (bis ausschließlich dem abschließenden `</span>` markieren wir mit dem Regulären Ausdruck `(.*?)` als Gruppe.

Mit `re.search(pattern,page.text)` finden wir das erste Auftreten des Musters im HTML-Text.
Aus der Fundstelle wird dann die erste Gruppe mit `group(1)` extrahiert und ausgegeben.

In [None]:
import requests
import re

stocks = {'Apple': 'aapl', 'Facebook':'fb', 'Google':'goog', 'Netflix':'nflx', 'Microsoft':'msft'}

for comp in stocks:
    page = requests.get("https://finance.yahoo.com/q?s={}".format(stocks[comp]))
    #<span class="Trsdu(0.3s) Fw(b) Fz(36px) Mb(-4px) D(ib)" data-reactid="32">1,326.80</span>
    regex = '<span class="Trsdu.*?>(.*?)</span>'
    pattern = re.compile(regex)
    match = re.search(pattern,page.text)
    print("Der Kurs von {} ist ${}".format(comp, match.group(1)))


Das gleiche kann man auch über die _urllib_ aus der Standardbibliothek erreichen, allerdings ist der Code etwas komplexer. Hier sind z.B. einige zusätzliche Aufrufe nötig um den Zugriff auf eine verschlüsselte _https_ Seite zu ermöglichen.

In [None]:
import urllib
import ssl
import re   
    
stocks = {'Apple': 'aapl', 'Facebook':'fb', 'Google':'goog', 'Netflix':'nflx', 'Microsoft':'msft'}

for comp in stocks:
    url = "https://finance.yahoo.com/q?s={}".format(stocks[comp])
    ssl_handler = urllib.request.HTTPSHandler(context=ssl.SSLContext())
    opener = urllib.request.build_opener(ssl_handler)
    urllib.request.install_opener(opener)
    resp = opener.open(url)
    page = resp.read().decode('utf-8')

    #<span class="Trsdu(0.3s) Fw(b) Fz(36px) Mb(-4px) D(ib)" data-reactid="32">1,326.80</span>
    regex = '<span class="Trsdu.*?>(.*?)</span>'
    pattern = re.compile(regex)
    match = re.search(pattern,page)
    print("Der Kurs von {} ist ${}".format(comp, match.group(1)))


Man kann die _requests_ Bibliothek auch verwenden um Binärdaten, wie z.B. Bilder, aus dem Internet zu laden. Im folgenden Beispiel laden wir eine _png_ Datei von _wikimedia.org_ und speichern sie lokal ab.

In [None]:
import requests
url = "https://upload.wikimedia.org/wikipedia/commons/thumb/8/87/Karl_Marx.png/478px-Karl_Marx.png"
r = requests.get(url)
if r.status_code == 200:
    try:
        f = open("image.png", 'wb')
        f.write(r.content)
    except:
        print("Irgendetwas ist schief gegangen!")

from IPython.display import Image
Image(filename = "image.png")

## 4. Webserver-Entwicklung mit _Flask_
**Hinweis: Das Lehrbuch verwendet _Django_ (Kapitel 40, Seiten 889-938) als Beispiel für die Web-Anwendungsentwicklung mit Python. Flask wird im Lehrbuch nicht behandelt.**

Mit den Paketen _request_ oder _urllib_ können Sie Zugriffe auf Inhalte durchführen, die auf Web-Servern verfügbar sind. Sie können aber auch mit sehr einfachen Mitteln eigene Web-Anwendungen mit Python implementieren. Ein Paket dazu, dass sich in den letzten Jahren wachsender Beliebtheit erfreut, ist [_Flask_](http://flask.pocoo.org). 

Flask bezeichnet sich als Micro-Framework für Web-Anwendungen. Das Paket enthält einen elementaren Web-Server, der vor allem bei der Entwicklung der Web-Anwendungen benutzt wird. Im Produktiveinsatz können Flask-Anwendungen über nahezu beliebige Webserver bereitgestellt werden.

Flask und seine Abhängigkeiten (z.B. die [_Template Engine_](https://de.wikipedia.org/wiki/Template-Engine) _Jinja2_ und die [_WSGI_](https://de.wikipedia.org/wiki/Web_Server_Gateway_Interface) Bibliothek _Werkzeug_) können bequem über den Paketmanager _pip_ installiert werden. (Hinweis: Die aktuelle flask Version scheint ein Problem mit Jupyter zu haben. [Hier](https://github.com/plotly/dash/issues/257) ist ein work-around beschrieben um das "Not writable"-Problem zu umgehen.)

In [None]:
import sys
!{sys.executable} -m pip install python-chess flask

Mit dem Dekorator `route` kann eine Funktion an eine bestimmten URL-Pfad gebunden werden. Wird diese URL zugegriffen, so wird die entsprechende Funktion serverseitig ausgeführt. Der URL-Pfad kann auch Variablen enthalten, diese sind mit spitzen Klammern markiert (z.B. `<name>`).  

In [None]:
import webbrowser
from flask import Flask
app = Flask(__name__)


@app.route('/')
def hello():
    return "Hello World!"

@app.route('/<name>')
def hello_name(name):
    return "Hallo %s!" % name

webbrowser.open("http://127.0.0.1:5000/Heiner")

# Der folgende Aufruf blockiert und muss über
# Kernel->Interrupt gestoppt werden:
app.run()

**Erweitern Sie die obige Flask-Applikation um eine Methode `umdrehen` die ein Wort "umgedreht" ausgibt. Die Methode soll über die URL `/umdrehen/<wort>` erreichbar sein.**

## 5. Wissenschaftliches Rechnen mit Numpy, Scipy und Matplotlib
**Hinweis: Dieses Thema wird im Lehrbuch auf den Seiten 939-959 behandelt.**

Python hat sich in den letzten Jahren als Standard-Programmiersprache in Bereichen des Wissenschaftlichen Rechnens und der Datenanalysen etabliert. Dies ist auch schon anhand der Vielzahl von Buchveröffentlichungen zu dem Thema zu erkennen.

Auf den ersten Blick erscheint der Einsatz von Python in diesem Bereich etwas unerwartet, denn ingenieursmäßige oder naturwissenschaftliche Anwendungen erfordern oft eine hohe Rechenleistung. Python, als interpretierte Programmiersprache ist in Punkto Performanz kompilierten Sprachen (wie etwa C/C++) normalerweise unterlegen. 
Mehrere Aspekte sprechen allerdings für den Einsatz von Skriptsprachen im wissenschaftlichen Rechnen:
1. Skriptsprachen erlauben häufig eine deutlich kompaktere und übersichtliche Programmstruktur. Bei Aufgaben, in denen es vor allem um eine korrekte und nachvollziehbare Implementierung eines algorithmischen Verfahrens geht, ist dies besonders wichtig.
2. Der Umfang an (frei verfügbaren) Bibliotheken und Paketen für Python ist enorm, was Entwicklern die Arbeit ungemein erleichtert. Außerdem ist der Einsatz von Drittanbieter-Software sehr einfach. Pakete sind direkt auf allen Plattformen lauffähig und müssen nicht, wie in kompilierten Programmiersprachen, zunächst in Maschinencode übersetzt werden. 
3. Die laufzeitkritischen Elemente vieler Algorithmen lassen sich auf wenige *Standardroutinen* reduzieren. Für diese Routinen gibt es oft hoch-effiziente Implementationen, die sogar auf die speziellen Eigenschaften der vorliegen CPU optimiert werden. Sind solche Bibliotheken auf dem Computer verfügbar, so können sie von Python aus benutzt werden. Die rechenintensiven Teile eines Programms werden dann nicht mehr im Python Interpreter ausgeführt, sondern durch eine externe Bibliothek. Somit können die Performanz-Nachteile, die Python als interpretierte Sprache mitbringt, weitestgehend bereinigt werden.

In der Vielzahl der verfügbaren Pakete für numerische Berechnungen mit Python gibt es einige Bibliotheken, die als quasi-Standard die Basis für viele Anwendungen und andere Pakete bilden:

**NumPy** ist die elementare Python-Bibliothek für wissenschaftliches Rechnen. NumPy definiert Objekte für mehrdimensionale Arrays und Matrizen sowie mathematische Grundoperationen auf diesen Objekten. NumPy's "Datentypen" sind zwar eingeschränkter als die bekannten sequentiellen Typen in Python (*list*, *tuple*, etc.), dafür sind die Daten aber kompakter im Hauptspeicher abgelegt, so dass Operationen auf mehrdimensionalen Arrays effizienter durchgeführt werden können. Für Vektor- und Matrix-Operationen besitzt NumPy effiziente Implementierungen und benutzt, sofern auf dem Computer installiert, optimierte Bibliotheken für *Lineare Algebra* ([BLAS](https://de.wikipedia.org/wiki/Basic_Linear_Algebra_Subprograms) und [LAPACK](https://de.wikipedia.org/wiki/LAPACK))

**SciPy** ist eine Bibliothek von Mathematischen Algorithmen die größtenteils auf NumPy aufbauen. SciPy ist sehr umfangreich und enthält unter anderem Module zur numerischen Berechnung von Integralen, zum Lösen von Differentialgleichungen, zur Berechnung von Optimierungsproblemen, zur digitalen Signalverarbeitung und zur Datenvisualisierung.

**Matplotlib** ist die Standard-Bibliothek zum Erstellen von (mathematischen) Diagrammen. Sie Syntax von matplotlib orientiert sich an den Diagramm-Funktionen von [Matlab](https://de.mathworks.com) was Entwicklern den Umstieg von dem kommerziellen Tool auf Python deutlich erleichtert.

### NumPy

Im wissenschaftlichen Rechnen und in den datengetriebenen Wissenschaften sind Berechnungen mit Vektoren und Matrizen allgegenwärtig.
In NumPy werden diese mathematischen Datenstrukturen als n-dimensionale Arrays mit dem Datentyp `ndarray` abgebildet. Wenn Sie die NumPy-Bibliothek mittels `import numpy as np` eingebunden haben, können Sie ein NumPy Array mit der Funktion `np.array()` anlegen:

In [None]:
import numpy as np
x = np.array([1,2,3])
print(x, type(x))

Es gibt auch den Datentyp `matrix` in NumPy. Dieser Typ ist von `ndarray` abgeleiteten.
Matrizen haben immer 2-dimensionale Struktur und Operatoren funktionieren etwas anders als bei "normalen" NumPy Arrays.
Um Missverständnisse zu vermeiden, werden wir im folgenden vornehmlich den Typ `ndarray` benutzen.

Ein `ndarray` kann aus Folgen von Zahlen gebildet werden. Dies sind üblicherweise Tupel oder Listen. Die Dokumentation zur Funktion `array` sagt, dass ein *Array-artiger* Parameter übergeben werden soll. Es ist also so, dass alle Objekte, *die NumPy zu einem Array konvertieren kann*, an dieser Stelle Funktionieren:

In [None]:
a = np.array([1, 7, 1, 2])
b = np.array((1, 7, 1, 2))
print("a: %s" % a)
print("b: %s" % b)

Auf einzelne Elemente von eindimensionalen Arrays greift man über einen "einfachen" Index in `[]`-Klammern zu.
Bei mehrdimensionalen Arrays werden die Zugriffe etwas komplizierter.

In [None]:
b[2]

NumPy liefert auch einige Funktionen, um spezielle Arrays zu erzeugen. Über `arange` können z.B. Arrays über Zahlenfolgen gebildet werden:

In [None]:
a = np.arange(8)
a

Die Länge eines Arrays erhält man über das Attribut `size`:


In [None]:
a.size

Die Dimension wiederum, kann man mit dem Attribut `ndim` abfragen. Eindimensionalen Arrays haben die Dimension 1. Wir werden diese Arrays von nun an auch **Vektoren** nennen. Für zweidimensionale Arrays verwenden wir auch den Begriff **Matrix**.

In [None]:
a.ndim

Als eine Art Kombination der Attribute `size` und `ndim` kann man `shape` verstehen.
Dieses Attribut liefert ein Tupel mit `ndim`-Elementen zurück, wobei das $i$-te Element die Größe der $i$-ten Dimension angibt. (Vielleicht fragen Sie sich, warum in dem Tupel `(8,)` das einzelne Komma steht? Das ist dazu da, die Schriftweise eindeutig zu halten. Ansonsten könnte man die Ausgabe mit einem `int` in Klammern verwechseln.)

In [None]:
a.shape

Die Indizierung von NumPy Arrays beginnt immer bei der $0$.
Neben der Adressierung von konkreten Indizes gibt es noch weitere Zugriffsregeln:

In [None]:
print(a[0])     # Das erste Element
print(a[-1])    # Das letzte Element
print(a[2:7])   # Die Elemente von Index 2 bis 7 (ausschließlich)
print(a[2:7:2]) # Wie oben, nur mit einer Schrittweite von 2
print(a[::3])   # Alle Elemente mit einer Schrittweite von 3

### Mehrdimensionale Arrays

Wie schon angesprochen, ist `ndarray` ein mehrdimensionaler Datentyp. Sie können also ohne Weiteres NumPy Arrays aus verschachtelten Listen oder Array erzeugen:

In [None]:
a = np.arange(6)
b = np.arange(6,12)
c = np.arange(12,18)
d = np.arange(18,24)
A = np.array((a,b,c,d))
A

Dabei müssen aber immer alle niedrigeren Dimensionen voll besetzt sein, damit `np.array` ein "echtes" Array generieren kann:

In [None]:
A = np.array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23]])
A

Passen die Größen der einzelnen Vektoren oder Matrizen nicht zusammen, so liefert die Funktion ein vermutlich ungewolltes Resultat. Im folgenden Beispiel, hat die 3. Zeile der Matrix nur 2 Elemente, und nicht 6 wie alle anderen. `np.array` legt daher ein eindimensionales Array mit Listen als Elemente an: 

In [None]:
B = np.array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13],
       [18, 19, 20, 21, 22, 23]])
B

Einzelne Elemente eines mehrdimensionalen `ndarrays` adressieren Sie mit einer Folge von Index-Klammern. `A[3][1]` z.B. liefert das zweite Element der vierten Zeile der Matrix.

In [None]:
A[3][1]

Etwas komplizierter wird es, wenn wir nicht nur auf einzelne Werte, sondern ganze Bereiche einer Matrix zugreifen wollen.
Mit `[x:y]` greift man auf die Zeilen $X$ bis einschließlich $y-1$ zu. Der $x$-Wert kann auch weg gelassen werden, `[:2]` liefert z.B. die ersten 2 Zeilen der Matrix

In [None]:
print(A[:3])

In [None]:
print(A[1:3])

Auf einzelne Spalten der Matrix greift man über den Komma-Operator:

In [None]:
print(A[:,3])

Das ist in etwa so zu verstehen, dass das Komma die einzelnen Dimensionen voneinander abgrenzt.
Man nimmt also von der ersten Dimension alle Elemente (angegeben durch das Fehlen vonj Grenzen bei dem `:`-Operator) und von der zweiten Dimension nur die "dritten".
Das folgende Beispiel liefert von den Elementen der dritten Zeile die Elemente im Bereich der zweiten bis dritten Spalte.

In [None]:
print(A[2,1:3])

### Arrays Anlegen

Wir haben bereits gesehen, wie man NumPy Arrays mit den Funktionen `array` und `arange` anlegen kann.
Es gibt aber noch weitere Methoden, mit denen Arrays angelegt werden können.
So kann man z.B. Arrays generieren, die nur aus Nullen oder Einsen bestehen

In [None]:
np.zeros(9)

In [None]:
np.ones((4,4))

Die Methode `linspace(Start, Ende, Anzahl-Werte)` ist eine Erweiterung von `arange` mit der fortlaufende Folgen von Zahlen generiert werden können. Die Funktion liefert `Anzahl-Werte` Zahlen im Bereich `[Start,Ende]`.

In [None]:
x = np.linspace(-1,1,20)
x

Die Werte steigen bei `linspace` linear an. Falls Sie eine logarithmische Skalierung benötigen, können Sie die Funktion `logspace` verwenden. Dabei ist darauf zu achten, dass `Start` und `Ende` als Exponenten angenommen werden. `np.logspace(0,2,20)` etwa, generiert 20 Werte im Bereich 1 (10 hoch 0) bis 100 (10 hoch 2).

In [None]:
start = 0 # 10^0 = 1
ende = 2 # 10^2 = 100
n = 20

np.logspace(0,2,20)

Wir haben gesehen, wie wir eindimensionale Arrays generieren können.
Oftmals benötigt man aber mehrdimensionale Arrays.
NumPy stellt einige Methoden bereit, um die Struktur von Arrays zu verändern.
Die Daten selbst, bleiben von diesen Operationen unverändert.

Die wichtigsten Funktionen zum Umstrukturieren von Matrizen sind `reshape` und `flatten`.

In [None]:
a = np.arange(20)
b = a.reshape((4,5))
print("b als 4x5 Matrix:\n", b)
b = b.reshape((5,4))
print("\nb als 5x4 Matrix:\n", b)

Eine Wichtige Operation in der Linearen Algebra ist das Transponieren von Matrizen. Dabei werden die Spalten und Zeilen der Matrix vertauscht. Die Werte in der Matrix bleiben gleich, werden aber in einer umgedrehten Rehenfolge durchlaufen.
In NumPy greift man auf die Transponierte Form eines Arrays über das Attribut `T` zu.

In [None]:
b.T

Das Umstrukturieren und Transponieren funktioniert auch bei Arrays mit einer Dimension >2 

In [None]:
a = np.arange(24).reshape((2,3,4))
a

In [None]:
a = a.T
a

Mit der Methode `flatten` kann man mehrdimensionale Arrys linearisieren.

In [None]:
a.flatten()

### Zufallszahlen

Zufallszahlen und die Erzeugung von bestimmten Wahrscheinlichkeitsverteilungen ist an vielen Stellen der Mathematik wichtig.
Das *Modul* `np.random` liefert Methoden um Zufallswerte und -verteilungen zu generieren.

Wie es Ihnen vielleicht aus Sprachen wie C oder Java geläufig ist, köönen Sie auch in Python vor Benutzung des Zufallszahlengenerators mit einem Ausgangswert, dem sogenannten *seed*, initialisieren. Der Zufallszahlengenerator selbst ist  *deterministisch*, d.h., er erzeugt zu einem seed immer die gleiche Folge von Zufallszahlen.

In [None]:
np.random.seed(seed=1)
np.random.random(4)

In [None]:
np.random.random(5)

In [None]:
np.random.seed(seed=1)
np.random.random(5)

`random` liefert gleichverteilte Werte im Bereich `[0,1[`.
Wenn Sie normalverteilte (also nach der Gaußschen Normalverteilung verteilte) Werte benötigen, können Sie die Funktion `np.random.normal(loc, scale, size)` verwenden. Der Parameter `loc` bezeichnet den Erwartungswert und `scale` die Standardabweichung. Mit `size` können Sie die Anzahl der zu generierenden Werte angeben.

In [None]:
np.random.normal(0.0, 4.0, 10)

Über ihre Namen, können Sie in Python auch nur einzelne Parameter angeben. Z.B. funktioniert auch der folgende Aufruf, in dem wir nur die Anzahl der Zahlen in der Funktion `normal` angeben. Für die Standardabweichung und die Varianz werden dann Default-Werte angenommen (0 bzw. 1).

In [None]:
np.random.normal(size=20)

NumPy bietet auch einige elementare statistische Funktionen, z.B. für den Mittelwert (`mean`) oder die Standardabweichung (`std`).

In [None]:
a = np.random.normal(3,7,10000)
print("Erwartungswert: ", a.mean())
print("Standardabweichung: ", a.std())

### Operationen

Wir haben nun sehr ausführlich betrachtet, wie man Arrays anlegt und mit Werten füllen kann.
Was wir bisher ausgelassen haben ist, wie man Operationen mit und auf NumPy Arrays durchführt.
Dies wollen wir nun nachholen.

Wenn man mit Vektoren und Matrizen rechnet, unterscheidet man Skalar- und Matrix-Operationen.
Eine Skalar-Addition mit einem Vektor führt z.B. zu folgendem Resultat:

In [None]:
np.arange(8) + 10

Addieren wir 2 Vektoren, so werden alle Werte an ihrer jeweiligen Stelle miteinander addiert.

In [None]:
np.arange(8) + np.arange(8)

Gleiches gilt für die Multiplikation

In [None]:
np.arange(10) * 5

In [None]:
np.arange(8) * np.arange(8)

Arrays kann man auch mit Skalaren und Arrays vergleichen

In [None]:
np.arange(8) > 2

In [None]:
np.arange(8) == (np.arange(8) *2)

Das Skalarprodukt (auch inneres Produkt genannt) ist eine eigene Form der Multiplikation zweier Vektoren. Dabei wird die Summe der Produkte aller Komponenten der beiden Vektoren.

In [None]:
a = np.arange(5)
print("a: ", a)
b = np.arange(5)*2
print("b: ", b)
c=a*b
print("c = a*b: ", c)
d=a.dot(b)
print("d = a.b: ", d)

Die Summe aller Elemente eines Arrays bilden Sie mit der Funktion `sum`.

In [None]:
np.arange(8).sum()

Darüberhinaus gibt es noch Operationen für Matrizen

In [None]:
A = np.arange(20).reshape((4,5))
B = np.arange(20).reshape((4,5))
print("A+B:\n", A+B)
print("A∘B:\n", A*B)

Beachten Sie, dass die Multiplikation mit dem `*`-Operator die elementweise Multiplikation ist. Diese Operation wird auch Hadamard-Produkt oder Schur-Produkt genannt. Bei der elementweisen Multiplikation müssen beide Matrizen dieselbe Struktur besitzen.

Unter einer Matrixmultiplikation versteht man eine andere Operation. Zwei Matrizen $A$ und $B$ werden miteinander multipliziert, indem man sämtliche Skalarprodukte der Zeilenvektoren von $A$ mit den Spaltenvektoren von $B$ bildet.
Die Spaltenzahl von $A$ muss daher mit der Zeilenzahl von $B$ übereinstimmen.

In [None]:
A = np.arange(20).reshape((4,5))
B = np.arange(20).reshape((5,4))
print("A⋅B:\n", A@B)

### Warum ist NumPy effizient

Im folgenden wollen wir kurz analysieren, warum NumPy-Datentypen für Operationen auf großen Datensätzen besser geeignet sind, als die eingebauten Typen von Python.
Wir Vergleichen hier 2 Vektoren $X$ und $Y$: $X$ wird dabei als NumPy Array erzeugt, $Y$ ist ein reguläres Tupel-Objekt. Die Daten/Werte in $X$ und $Y$ sind aber gleich.

In [None]:
import math
N = 1000000
# X ist ein NumPy Array
X = np.linspace(0,N-1,num=N)/N
# Y Ist ein Tupel
Y = tuple(y/N for y in range(0,N))
print(sum(X-Y)) # X und Y sind 'gleich'

Dass die unterschiedlichen Datentypen (im Beisiel, Tupel und NumPy Array) sehr unterschiedliche Speicherbedarfe haben, ist nicht ganz leicht nachzuprüfen. Zwar besitzt das Modul sys die Funktion getsizeof, welche auf beliebeige Objekte angewendet werden kann. Wenn man aber getsizeof auf ein Objekt eines Sequentiellen Datentyps anwendet, so werden nur die enthaltenen Objektreferenzen in die Berechnung der Größe miteinbezogen; nicht die referenzierte Objekte selbst. Die folgende Funktion deep_getsizeof analysiert die Größe eines Objekts und exploriert dabei alle enthaltenen Objekte in rekursiever Weise. Damit erhält man den "echten" Speicherbedarf eines Objektes.

In [None]:
from sys import getsizeof
from collections.abc import Mapping, Container
def deep_getsizeof(o, ids=None):
    if not ids:
        ids = set()
                   
    d = deep_getsizeof
    if id(o) in ids:
        return 0

    r = getsizeof(o)
    ids.add(id(o))

    if isinstance(o, str) or isinstance(0, str):
        return r

    if isinstance(o, Mapping):
        return r + sum(d(k, ids) + d(v, ids) for k, v in o.iteritems())

    if isinstance(o, Container):
        return r + sum(d(x, ids) for x in o)

    return r

In [None]:
sX = deep_getsizeof(X)
sY = deep_getsizeof(Y)
print("NumPy Array X ist %d kByte groß." % (sX/1024))
print("Tupel Y ist %d kByte groß." % (sY/1024))

Wenn Sie wissen möchten, welche mathematischen Bibliotheken NumPy intern verwendet, können Sie sich die entsprechenden Systempfade mit `np.__config__.show()` ausgeben lassen.

In [None]:
np.__config__.show()

### Matplotlib

Mit der Matplotlib Bibliothek können in Python mit recht einfachen Mitteln gutaussehende Grafiken erstellt werden. Der Funktionsumfang der Bibliothek ist sehr groß, daher werden wir Sie hier nur anhand einiger Beispiele vorstellen. Für die Darstellung spezieller Graphen gibt es viele Beispiele in der [Matplotlib Galerie](https://matplotlib.org/gallery/index.html).

Denken Sie daran, zuerst die Bibliotheksfunktionen einzubindnen.

In [None]:
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
%matplotlib inline
#%matplotlib notebook

Die obigen `import` Anweisungen sind _boilerplate code_, also ein Textbaustein, den Sie immer in gleicher Form verwenden, wenn Sie mit _numpy_ und _matplotlib_ arbeiten. Auch die Abkürzungen der Modulnamen haben sich in dieser Form etabliert.

`%matplotlib` hingegen ist eine _magic function_ in ipython. Mit diesen Funktionen lassen sich generelle Einstellungen für die interaktive shell vornehmen. Mit dem Parameter `inline` stellt man ein, das die Grafiken im interaktiven Modus direkt unter dem Code dargestellt werden. Die Option `notebook` ist eine erweiterte Variante mit interaktiven Elementen für Python Notebooks.

Die folgende Code-Zelle zeigt ein einfaches Beispiel, in dem eine Sinus- und eine Cosinus-Funktion mittels NumPy erzeugt und die Graphen der Funktionen mit dem Modul _pyplot_ aus dem Paket matplotlib dargestellt werden.

In [None]:
x = np.linspace(0,2*np.pi)
fig = plt.figure()
plt.plot(x,np.sin(x),label="Sinus")
plt.plot(x,np.cos(x),label="Cosinus")
l_sine, l_cos = plt.gca().lines
l_cos.set_linewidth(10)
plt.legend(loc='lower left')
plt.show()

Numpy stellt den Dekorator `numpy.vectorize` zur Vektorisierung von Funktionen zur Verfügung. Wird dieser Dekorator auf eine Funktion angewendet, so wird die Funktion zur Laufzeit auf alle Elemente der als Argumente übergebenen NumPy Arrays angewendet. Dieser Dekorator dient nicht unbedingt der Effizienz (intern ist der Dekorator als einfache Schleife über alle Elemente implementiert) erlaubt es aber, Funktionen mit skalaren Parametern auch auf Vektoren anzuwenden.

Die in NumPy definierten Vektor-Operationen hingegen sind sehr effizient. Im folgenden Beispiel vergleichen wir die Laufzeit von verschiedenen Implementierungsvarianten anhand der Operation $e^{x_i}*\sin(y_i)$ auf den Vektoren $X$ und $Y$. $X$ wird dabei als NumPy Array erzeugt, $Y$ ist ein reguläres Tupel-Objekt. Die Daten/Werte in $X$ und $Y$ sind aber gleich.

In [None]:
import math
N = 1000000
# X ist ein NumPy Array
X = np.linspace(0,N-1,num=N)/N
# Y Ist ein Tupel
Y = tuple(y/N for y in range(0,N))
print(sum(X-Y)) # X und Y sind 'gleich'

Dass die unterschiedlichen Datentypen (im Beisiel, Tupel und NumPy Array) sehr unterschiedliche Speicherbedarfe haben, ist nicht ganz leicht nachzuprüfen. Zwar besitzt das Modul `sys` die Funktion `getsizeof`, welche auf beliebeige Objekte angewendet werden kann. Wenn man aber `getsizeof` auf ein Objekt eines Sequentiellen Datentyps anwendet, so werden nur die enthaltenen Objektreferenzen in die Berechnung der _Größe_ miteinbezogen; nicht die referenzierte Objekte selbst. Die folgende Funktion `deep_getsizeof` analysiert die Größe eines Objekts und exploriert dabei alle enthaltenen Objekte in rekursiever Weise. Damit erhält man den "echten" Speicherbedarf eines Objektes.

In [None]:
from sys import getsizeof
from collections import Mapping, Container
def deep_getsizeof(o, ids=None):
    if not ids:
        ids = set()
                   
    d = deep_getsizeof
    if id(o) in ids:
        return 0

    r = getsizeof(o)
    ids.add(id(o))

    if isinstance(o, str) or isinstance(0, str):
        return r

    if isinstance(o, Mapping):
        return r + sum(d(k, ids) + d(v, ids) for k, v in o.iteritems())

    if isinstance(o, Container):
        return r + sum(d(x, ids) for x in o)

    return r

In [None]:
sX = deep_getsizeof(X)
sY = deep_getsizeof(Y)
print("NumPy Array X ist %d kByte groß." % (sX/1024))
print("Tupel Y ist %d kByte groß." % (sY/1024))

In [None]:
@np.vectorize
def vect_exp(x,y):
    return np.exp(x) * np.sin(y)

print("Mit List Comprehension:")
%time A = tuple(math.exp(a)*math.sin(a) for a in Y)

print("\nMit der map Funktion:")
%time B = tuple(map(lambda a,b: math.exp(a)*math.sin(b), Y, Y))

print("\nMit numpy Funktionen:")
%time C = np.exp(X)*np.sin(X)

print("\nMit einer vektorisierten Funktion:")
%time D = vect_exp(X,X)

print("\nTesten, ob die Arrays gleich sind:")
if sum(B-C)==0.0 and sum(B-D)==0.0:
    print("OK")
else:
    print("Der Fehler ist %e" % max(sum(B-C),sum(B-D)))

Matplotlib kann nicht nur Funktionsgraphen zeichnen, sondern bietet eine Fülle von verschiedenen Diagrammtypen. Eine gute Übersicht finden Sie [hier](https://matplotlib.org/gallery.html). Im folgenden Beispiel benutzen wir ein Histogramm um die Verteilung einer Zufallsvariablen darzustellen. Mit dem NumPy Modul _random_ generieren wir uns einen Vektor mit 20000 Einträgen auf Basis der Normal-Verteilung (auch Gauß-Verteilung genannt). Ein Histogramm ist ein Säulendiagramm, das darstellt, wie viele Elemente in einen bestimmten Wertebereich fallen. Der Parameter `bins` gibt an, in wie viele Bereiche die Darstellung aufgeteilt werden soll. Im Beispiel wollen wir also ein Sälendiagramm mit 200 Säulen zeichnen. Man erkennt im Diagramm die typische _Glockenkurve_ mit dem Erwartungswert (hier: 0) in der "Mitte".

In [None]:
fig = plt.figure()
N = 20000
W = np.random.standard_normal(size=N)
plt.hist(W,bins=(N//100))
plt.show()

Zufallszahlen sind in vielen Bereichen des wissenschaftlichen Rechnens und der angewandten Mathematik (z.B. in der Finanzmathematik) wichtig. Häufig geht es darum, komplexe Prozesse zu simulieren, deren Ausgang von Wahrscheinlichkeiten abhängt.
Im nächsten Beispiel, generieren wir wieder Folgen von (normalverteilten) Zufallszahlen. Auf dieser Folge berechnen wir dann mit `numpy.cumsum` die kumulierte Summe (auch [Präfixsumme](https://de.wikipedia.org/wiki/Präfixsumme) genannt). Das bedeutet, wir berechnen für jede Position in der Folge die Summe aller Folgenglieder bis zu dieser Position. Dazu addieren wir noch einen Startwert. Da der Erwartungswert der Normalverteilung Null ist und die einzelnen Elemente der Folge unabhängig sind, ist auch der Erwartungswert der Summe gleich Null.
Wir sehen aber im Beispiel, dass sich einige der Zufallsprozesse extremer in positive oder negative Richtung entwickeln.

In [None]:
fig = plt.figure()
N = 100
Startwert=10
Runden=100
Mittelwert=0
for i in range(0,Runden):
    X = np.random.standard_normal(size=N)
    X = np.cumsum(X)+Startwert
    plt.plot(X)
    Mittelwert += np.average(X)
Mittelwert /= Runden
plt.show()
Mittelwert

Wenn Sie diese Zufallsprozesse mathematisch etwas erweitern kommen Sie zu Modellen, die heutzutage von Banken und Finanzdienstleistern eingesetzt werden, um Optionspapiere zu bewerten.

Auch wenn an dieser Stelle die Details des Beispiels nicht weiter behandelt werden, sehen Sie, dass der Code sehr übersichtlich ist. Das ist sowohl bei der Entwicklung, als auch beim Verstehen von Algorithmen sehr vorteilhaft. Python, mit den Erweiterungen NumPy, SciPy und Matplotlib, hat sich für Ingenieure und Wissenschaftler zu einer echten Alternative zu kommerziellen Tools wie etwa Matlab entwickelt.


In [None]:
fig = plt.figure()
Laufzeit = 250
Drift = 0.0005
Volatilitaet = 0.01
Startpreis = 20
t = np.linspace(0, Laufzeit-1, Laufzeit)
Endpreis = 0
Simulationen=200
for i in range(0,Simulationen):
    # Standard-Wiener-Prozess simuliert durch einen Gaußschen Random Walk
    W = np.random.standard_normal(size = Laufzeit)
    W = np.cumsum(W)
    # # Geometrische Brownsche Bewegung mit Drift
    X = (Drift-0.5*Volatilitaet**2)*t + Volatilitaet*W 
    S = Startpreis*np.exp(X)
    plt.plot(t, S)
    Endpreis += S[-1]
plt.plot(t, [Startpreis]*Laufzeit, lw=3, color='black')
plt.show()
print("Erwarteter Preis: %f" % (Endpreis/Simulationen))

Das Paket **SciPy** liefert eine Reihe weiterer mathematischer Funktionen, die über den Umfang von NumPy hinaus gehen.
Ein relativ einfaches Beispiel ist das Ableiten von Funktionen mit der Methode `derivative` aus dem Module `scipy.misc`. Im Beispiel erzeugen wir eine Kubische Funktion $f(x)=x^3+x^2$ und stellen sie dann, zusammen mit ihrer ersten und zweiten Ableitung' mit der _matplotlib_ dar.

In [None]:
import sys
!{sys.executable} -m pip install Scipy

In [None]:
from scipy.misc import derivative
def f(x):
    return x**3 + x**2

fig = plt.figure()
X = np.linspace(-3,3)
plt.plot(X,f(X),label="f",lw=3)
plt.plot(X,derivative(f,X),label="f'")
plt.plot(X,derivative(f,X,n=2),label="f''")
plt.legend(loc='best',fontsize='large')
plt.show()

### Interaktion

Das die Plots direkt im Jupyter Notebook erscheinen ist sehr praktisch.
So können Sie Ihre Daten analysieren und direkt in nächsten Code-Zelle weiter bearbeiten.
 
Jupyter bietet aber noch mehr Möglichkeiten, um auf Ausgaben einzuwirken.
Für IPython kibt es Zusatzmodule, die interaktive Widgets im Browser bereitstellen.
Mit diesen Widgets kann man den Code-Zellen Bedienelemente hinzufügen, mit denen der Code interaktiv gesteuert werden kann.

Ein recht einfaches Bedienelement ist ein Schieberegler, mit sich ein skalarer Parameter einstellen lässt.
Ein solcher Slider lässt sich mit der Methode `interact` aus dem Modul `ipywidgets.widgets` leicht umsetzen.
`interact` ist dabei recht flexibel.
Falls der Parameter kein Skalar, sonder ein Boolean ist, wird eine Chackbox dargestellt.
Bei einem String entsprechend ein Eingabefeld.

Die Methode verlangt als erstes Argument eine Funktionsreferenz, danach folgen die einzustellenden Parameter der Funktion.

In [None]:
import webbrowser
url = 'https://jupyter-tutorial.readthedocs.io/de/latest/workspace/jupyter/ipywidgets/examples.html'
webbrowser.open(url)

In [None]:
from ipywidgets.widgets import interact, interactive, fixed
from ipywidgets import widgets
def f(x):
    print(x)
    
interact(f, x=10)

`interact` kann übrigens auch als Dekorator verwendet werden:

In [None]:
@interact
def f(x=10):
    print(x)

In der folgenden Code-Zelle greifen wir das Beispiel mit der Ableitung von oben nochmal auf.
Statt einer festen Funktion $f(x)=x^3+x^2$ nehmen wir hier eine allgemeine Polynomfunktion $f(x)=ax^3+bx^2+cx+d$ an.
Die Parameter $a$ bis $d$ werden über einzelne Regler interaktiv bedienbar gemacht.

In [None]:
from scipy.misc import derivative

def g(a,b,c,d):
    def foo(x):
        return a*x**3 + b*x**2 + c*x +d
    return foo

def plotte_funktionen(a,b,c,d):
    fig = plt.figure()
    X = np.linspace(-3,3)
    f = g(a,b,c,d)
    plt.plot(X,f(X),label="f",lw=3)
    plt.plot(X,derivative(f,X),label="f'")
    plt.plot(X,derivative(f,X,n=2),label="f''")
    plt.legend(loc='best',fontsize='large')
    plt.draw()

interact(plotte_funktionen, a=1.0, b=1.0, c=1.0, d=1.0)    


In einem abschließenden Beispiel geht es nochmal um Matrix-Berechnungen mit NumPy.
Wir wollen Bilder bearbeiten und mit matplotlib anzeigen. Hierzu laden wir zuerst das Graustufen Bild aus dem Beispiel in [Abschnit 3](#3.-Web-Zugriffe-mit-der-Requests-Bibliothek) als Instanz `img`. Im zweiten Schritt formen wir das Graustufenbild in ein RGB-Format um, indem wir aus dem Grauwert eines Pixels ein Array mit 3 identischen Werten generieren (hierzu benutzen wir die `stack`Funktion).

In [None]:
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import numpy as np
%matplotlib inline

img=mpimg.imread('image.png')
#Mache aus dem Graustufenbild ein RGB Bild
#Dazu muss der "Grau-Kanal" verdreifacht werden
#(in Form eines 3-Tupels):
rgb_img = np.stack((img,)*3, axis=-1)
imgplot = plt.imshow(rgb_img)

Nun können wir z.B. die Farbgebung der Bilder verändern, indem wir einzelnen Farbkanäle im additiven RGB (Rot-Grün-Blau) Farbraum, auf Null setzen:

<!-- ![](https://upload.wikimedia.org/wikipedia/commons/2/28/RGB_illumination.jpg) -->

In [None]:
rg_img = np.copy(rgb_img)
#Blau-Kanal auf Null -> Gelb
rg_img[:,:,2] = 0
rb_img = np.copy(rgb_img)
#Grün-Kanal auf Null -> Violett
rb_img[:,:,1] = 0
gb_img = np.copy(rgb_img)
#Rot-Kanal auf Null -> Türkis
gb_img[:,:,0] = 0

plt.figure()
plt.subplot(131)
plt.imshow(rg_img)
plt.gca().axes.get_xaxis().set_visible(False)
plt.gca().axes.get_yaxis().set_visible(False)

plt.subplot(132)
plt.imshow(rb_img)
plt.gca().axes.get_xaxis().set_visible(False)
plt.gca().axes.get_yaxis().set_visible(False)

plt.subplot(133)
plt.imshow(gb_img)
plt.gca().axes.get_xaxis().set_visible(False)
plt.gca().axes.get_yaxis().set_visible(False)

**Erzeugen Sie ein neues Bild, indem Sie Bereiche (horizontale "Streifen") aus den Arrays `rg_img`, `rb_img` und `gb_img` selektieren und zu einem neuen Bild zusammenfügen.**

## 6. Grafische Benutzeroberflächen mit Tkinter
**Tkinter wird auf den Seiten 791-839 im Lehrbuch behandelt.**

Für Python existieren mehrere Toolkits zur Programmierung grafischer Oberflächen. Im Lehrbuch finden Sie auf den Seiten 791-793 eine gute Übersicht dazu.
In der Standardbibliothek enthalten ist das Paket Tkinter, das eine objektorientierte Schnittstelle für Tk-Anwendungen bereitstellt. Tk ist ein GUI-Toolkit das ursprünglich für die Skriptsprache _Tcl_ entworfen wurde. 

Die Programmierung graphischer Benutzerschnittstellen ist ein komplexes Thema, das weit über den Umfang dieser Veranstaltung hinausgeht. Daher wird an dieser Stelle nur ein Minimalbeispiel kommentarlos vorgestellt.

In [None]:
import tkinter
class CtoF(tkinter.Frame):
    def __init__(self, master=None):
        super().__init__(master)
        self.pack()
        self.createWidgets()
    def createWidgets(self):
        self.celEntry = tkinter.Entry(self)
        self.celEntry.pack()
        self.cel = tkinter.DoubleVar()
        self.cel.set("Temperatur in Celsius")
        self.celEntry["textvariable"] = self.cel
        self.ok = tkinter.Button(self)
        self.ok["text"] = "Schließen"
        self.ok["command"] = self.quit
        self.ok.pack(side="right")
        self.conv = tkinter.Button(self)
        self.conv["text"] = "Umrechnen"
        self.conv["command"] = self.convert
        self.conv.pack(side="right")
    def convert(self):
        self.cel.set(self.cel.get()*1.8+32)

In [None]:
root = tkinter.Tk()
app = CtoF(root)
app.mainloop()

**Schreiben Sie ein GUI-Anwendung mit Tkinter, die in einem Textfeld einen String erwartet. Fügen Sie einen Button hinzu der bewirkt, dass der String im Text umgedreht erscheint.**