<figure>
  <IMG SRC="https://upload.wikimedia.org/wikipedia/commons/thumb/d/d5/Fachhochschule_Südwestfalen_20xx_logo.svg/320px-Fachhochschule_Südwestfalen_20xx_logo.svg.png" WIDTH=250 ALIGN="right">
</figure>

# Skriptsprachen
### Winterersemester 2023/24
Prof. Dr. Heiner Giefers

## Wissenschaftliches Rechnen mit Numpy, Scipy und Matplotlib

Python hat sich in den letzten Jahren als Standard-Programmiersprache in Bereichen des Wissenschaftlichen Rechnens und der Datenanalysen etabliert. Dies ist auch schon anhand der Vielzahl von Buchveröffentlichungen zu dem Thema zu erkennen.

Auf den ersten Blick erscheint der Einsatz von Python in diesem Bereich etwas unerwartet, denn ingenieursmäßige oder naturwissenschaftliche Anwendungen erfordern oft eine hohe Rechenleistung. Python, als interpretierte Programmiersprache ist in Punkto Performanz kompilierten Sprachen (wie etwa C/C++) normalerweise unterlegen. 
Mehrere Aspekte sprechen allerdings für den Einsatz von Skriptsprachen im wissenschaftlichen Rechnen:
1. Skriptsprachen erlauben häufig eine deutlich kompaktere und übersichtliche Programmstruktur. Bei Aufgaben, in denen es vor allem um eine korrekte und nachvollziehbare Implementierung eines algorithmischen Verfahrens geht, ist dies besonders wichtig.
2. Der Umfang an (frei verfügbaren) Bibliotheken und Paketen für Python ist enorm, was Entwicklern die Arbeit ungemein erleichtert. Außerdem ist der Einsatz von Drittanbieter-Software sehr einfach. Pakete sind direkt auf allen Plattformen lauffähig und müssen nicht, wie in kompilierten Programmiersprachen, zunächst in Maschinencode übersetzt werden. 
3. Die laufzeitkritischen Elemente vieler Algorithmen lassen sich auf wenige *Standardroutinen* reduzieren. Für diese Routinen gibt es oft hoch-effiziente Implementationen, die sogar auf die speziellen Eigenschaften der vorliegen CPU optimiert werden. Sind solche Bibliotheken auf dem Computer verfügbar, so können sie von Python aus benutzt werden. Die rechenintensiven Teile eines Programms werden dann nicht mehr im Python Interpreter ausgeführt, sondern durch eine externe Bibliothek. Somit können die Performanz-Nachteile, die Python als interpretierte Sprache mitbringt, weitestgehend bereinigt werden.

In der Vielzahl der verfügbaren Pakete für numerische Berechnungen mit Python gibt es einige Bibliotheken, die als quasi-Standard die Basis für viele Anwendungen und andere Pakete bilden:

**NumPy** ist die elementare Python-Bibliothek für wissenschaftliches Rechnen. NumPy definiert Objekte für mehrdimensionale Arrays und Matrizen sowie mathematische Grundoperationen auf diesen Objekten. NumPy's "Datentypen" sind zwar eingeschränkter als die bekannten sequentiellen Typen in Python (*list*, *tuple*, etc.), dafür sind die Daten aber kompakter im Hauptspeicher abgelegt, so dass Operationen auf mehrdimensionalen Arrays effizienter durchgeführt werden können. Für Vektor- und Matrix-Operationen besitzt NumPy effiziente Implementierungen und benutzt, sofern auf dem Computer installiert, optimierte Bibliotheken für *Lineare Algebra* ([BLAS](https://de.wikipedia.org/wiki/Basic_Linear_Algebra_Subprograms) und [LAPACK](https://de.wikipedia.org/wiki/LAPACK))

**SciPy** ist eine Bibliothek von Mathematischen Algorithmen die größtenteils auf NumPy aufbauen. SciPy ist sehr umfangreich und enthält unter anderem Module zur numerischen Berechnung von Integralen, zum Lösen von Differentialgleichungen, zur Berechnung von Optimierungsproblemen, zur digitalen Signalverarbeitung und zur Datenvisualisierung.

**Matplotlib** ist die Standard-Bibliothek zum Erstellen von (mathematischen) Diagrammen. Sie Syntax von matplotlib orientiert sich an den Diagramm-Funktionen von [Matlab](https://de.mathworks.com) was Entwicklern den Umstieg von dem kommerziellen Tool auf Python deutlich erleichtert.

## NumPy

Im wissenschaftlichen Rechnen und in den datengetriebenen Wissenschaften sind Berechnungen mit Vektoren und Matrizen allgegenwärtig.
In NumPy werden diese mathematischen Datenstrukturen als n-dimensionale Arrays mit dem Datentyp `ndarray` abgebildet. Wenn Sie die NumPy-Bibliothek mittels `import numpy as np` eingebunden haben, können Sie ein NumPy Array mit der Funktion `np.array()` anlegen:

In [None]:
import numpy as np
x = np.array([1,2,3])
print(x, type(x))

Es gibt auch den Datentyp `matrix` in NumPy. Dieser Typ ist von `ndarray` abgeleiteten.
Matrizen haben immer 2-dimensionale Struktur und Operatoren funktionieren etwas anders als bei "normalen" NumPy Arrays.
Um Missverständnisse zu vermeiden, werden wir im folgenden vornehmlich den Typ `ndarray` benutzen.

Ein `ndarray` kann aus Folgen von Zahlen gebildet werden. Dies sind üblicherweise Tupel oder Listen. Die Dokumentation zur Funktion `array` sagt, dass ein *Array-artiger* Parameter übergeben werden soll. Es ist also so, dass alle Objekte, *die NumPy zu einem Array konvertieren kann*, an dieser Stelle Funktionieren:

In [None]:
a = np.array([1, 7, 1, 2])
b = np.array((1, 7, 1, 2))
print("a: %s" % a)
print("b: %s" % b)

Auf einzelne Elemente von eindimensionalen Arrays greift man über einen "einfachen" Index in `[]`-Klammern zu.
Bei mehrdimensionalen Arrays werden die Zugriffe etwas komplizierter.

In [None]:
b[2]

NumPy liefert auch einige Funktionen, um spezielle Arrays zu erzeugen. Über `arange` können z.B. Arrays über Zahlenfolgen gebildet werden:

In [None]:
a = np.arange(8)
a

Die Länge eines Arrays erhält man über das Attribut `size`:


In [None]:
a.size

Die Dimension wiederum, kann man mit dem Attribut `ndim` abfragen. Eindimensionalen Arrays haben die Dimension 1. Wir werden diese Arrays von nun an auch **Vektoren** nennen. Für zweidimensionale Arrays verwenden wir auch den Begriff **Matrix**.

In [None]:
a.ndim

Als eine Art Kombination der Attribute `size` und `ndim` kann man `shape` verstehen.
Dieses Attribut liefert ein Tupel mit `ndim`-Elementen zurück, wobei das $i$-te Element die Größe der $i$-ten Dimension angibt. (Vielleicht fragen Sie sich, warum in dem Tupel `(8,)` das einzelne Komma steht? Das ist dazu da, die Schriftweise eindeutig zu halten. Ansonsten könnte man die Ausgabe mit einem `int` in Klammern verwechseln.)

In [None]:
a.shape

Die Indizierung von NumPy Arrays beginnt immer bei der $0$.
Neben der Adressierung von konkreten Indizes gibt es noch weitere Zugriffsregeln:

In [None]:
print(a[0])     # Das erste Element
print(a[-1])    # Das letzte Element
print(a[2:7])   # Die Elemente von Index 2 bis 7 (ausschließlich)
print(a[2:7:2]) # Wie oben, nur mit einer Schrittweite von 2
print(a[::3])   # Alle Elemente mit einer Schrittweite von 3

### Mehrdimensionale Arrays

Wie schon angesprochen, ist `ndarray` ein mehrdimensionaler Datentyp. Sie können also ohne Weiteres NumPy Arrays aus verschachtelten Listen oder Array erzeugen:

In [None]:
a = np.arange(6)
b = np.arange(6,12)
c = np.arange(12,18)
d = np.arange(18,24)
A = np.array((a,b,c,d))
A

Dabei müssen aber immer alle niedrigeren Dimensionen voll besetzt sein, damit `np.array` ein "echtes" Array generieren kann:

In [None]:
A = np.array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23]])
A

Passen die Größen der einzelnen Vektoren oder Matrizen nicht zusammen, so liefert die Funktion ein vermutlich ungewolltes Resultat. Im folgenden Beispiel, hat die 3. Zeile der Matrix nur 2 Elemente, und nicht 6 wie alle anderen. `np.array` legt daher ein eindimensionales Array mit Listen als Elemente an: 

In [None]:
B = np.array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13],
       [18, 19, 20, 21, 22, 23]])
B

Einzelne Elemente eines mehrdimensionalen `ndarrays` adressieren Sie mit einer Folge von Index-Klammern. `A[3][1]` z.B. liefert das zweite Element der vierten Zeile der Matrix.

In [None]:
A[3][1]

Etwas komplizierter wird es, wenn wir nicht nur auf einzelne Werte, sondern ganze Bereiche einer Matrix zugreifen wollen.
Mit `[x:y]` greift man auf die Zeilen $X$ bis einschließlich $y-1$ zu. Der $x$-Wert kann auch weg gelassen werden, `[:2]` liefert z.B. die ersten 2 Zeilen der Matrix

In [None]:
print(A[:3])

In [None]:
print(A[1:3])

Auf einzelne Spalten der Matrix greift man über den Komma-Operator:

In [None]:
print(A[:,3])

Das ist in etwa so zu verstehen, dass das Komma die einzelnen Dimensionen voneinander abgrenzt.
Man nimmt also von der ersten Dimension alle Elemente (angegeben durch das Fehlen vonj Grenzen bei dem `:`-Operator) und von der zweiten Dimension nur die "dritten".
Das folgende Beispiel liefert von den Elementen der dritten Zeile die Elemente im Bereich der zweiten bis dritten Spalte.

In [None]:
print(A[2,1:3])

### Arrays Anlegen

Wir haben bereits gesehen, wie man NumPy Arrays mit den Funktionen `array` und `arange` anlegen kann.
Es gibt aber noch weitere Methoden, mit denen Arrays angelegt werden können.
So kann man z.B. Arrays generieren, die nur aus Nullen oder Einsen bestehen

In [None]:
np.zeros(9)

In [None]:
np.ones((4,4))

Die Methode `linspace(Start, Ende, Anzahl-Werte)` ist eine Erweiterung von `arange` mit der fortlaufende Folgen von Zahlen generiert werden können. Die Funktion liefert `Anzahl-Werte` Zahlen im Bereich `[Start,Ende]`.

In [None]:
x = np.linspace(-1,1,20)
x

Die Werte steigen bei `linspace` linear an. Falls Sie eine logarithmische Skalierung benötigen, können Sie die Funktion `logspace` verwenden. Dabei ist darauf zu achten, dass `Start` und `Ende` als Exponenten angenommen werden. `np.logspace(0,2,20)` etwa, generiert 20 Werte im Bereich 1 (10 hoch 0) bis 100 (10 hoch 2).

In [None]:
start = 0 # 10^0 = 1
ende = 2 # 10^2 = 100
n = 20

np.logspace(0,2,20)

Wir haben gesehen, wie wir eindimensionale Arrays generieren können.
Oftmals benötigt man aber mehrdimensionale Arrays.
NumPy stellt einige Methoden bereit, um die Struktur von Arrays zu verändern.
Die Daten selbst, bleiben von diesen Operationen unverändert.

Die wichtigsten Funktionen zum Umstrukturieren von Matrizen sind `reshape` und `flatten`.

In [None]:
a = np.arange(20)
b = a.reshape((4,5))
print("b als 4x5 Matrix:\n", b)
b = b.reshape((5,4))
print("\nb als 5x4 Matrix:\n", b)

Eine Wichtige Operation in der Linearen Algebra ist das Transponieren von Matrizen. Dabei werden die Spalten und Zeilen der Matrix vertauscht. Die Werte in der Matrix bleiben gleich, werden aber in einer umgedrehten Rehenfolge durchlaufen.
In NumPy greift man auf die Transponierte Form eines Arrays über das Attribut `T` zu.

In [None]:
b.T

Das Umstrukturieren und Transponieren funktioniert auch bei Arrays mit einer Dimension >2 

In [None]:
a = np.arange(24).reshape((2,3,4))
a

In [None]:
a = a.T
a

Mit der Methode `flatten` kann man mehrdimensionale Arrys linearisieren.

In [None]:
a.flatten()

### Zufallszahlen

Zufallszahlen und die Erzeugung von bestimmten Wahrscheinlichkeitsverteilungen ist an vielen Stellen der Mathematik wichtig.
Das *Modul* `np.random` liefert Methoden um Zufallswerte und -verteilungen zu generieren.

Wie es Ihnen vielleicht aus Sprachen wie C oder Java geläufig ist, köönen Sie auch in Python vor Benutzung des Zufallszahlengenerators mit einem Ausgangswert, dem sogenannten *seed*, initialisieren. Der Zufallszahlengenerator selbst ist  *deterministisch*, d.h., er erzeugt zu einem seed immer die gleiche Folge von Zufallszahlen.

In [None]:
np.random.seed(seed=1)
np.random.random(4)

In [None]:
np.random.random(5)

In [None]:
np.random.seed(seed=1)
np.random.random(5)

`random` liefert gleichverteilte Werte im Bereich `[0,1[`.
Wenn Sie normalverteilte (also nach der Gaußschen Normalverteilung verteilte) Werte benötigen, können Sie die Funktion `np.random.normal(loc, scale, size)` verwenden. Der Parameter `loc` bezeichnet den Erwartungswert und `scale` die Standardabweichung. Mit `size` können Sie die Anzahl der zu generierenden Werte angeben.

In [None]:
np.random.normal(0.0, 4.0, 10)

Über ihre Namen, können Sie in Python auch nur einzelne Parameter angeben. Z.B. funktioniert auch der folgende Aufruf, in dem wir nur die Anzahl der Zahlen in der Funktion `normal` angeben. Für die Standardabweichung und die Varianz werden dann Default-Werte angenommen (0 bzw. 1).

In [None]:
np.random.normal(size=20)

NumPy bietet auch einige elementare statistische Funktionen, z.B. für den Mittelwert (`mean`) oder die Standardabweichung (`std`).

In [None]:
a = np.random.normal(3,7,10000)
print("Erwartungswert: ", a.mean())
print("Standardabweichung: ", a.std())

### Operationen

Wir haben nun sehr ausführlich betrachtet, wie man Arrays anlegt und mit Werten füllen kann.
Was wir bisher ausgelassen haben ist, wie man Operationen mit und auf NumPy Arrays durchführt.
Dies wollen wir nun nachholen.

Wenn man mit Vektoren und Matrizen rechnet, unterscheidet man Skalar- und Matrix-Operationen.
Eine Skalar-Addition mit einem Vektor führt z.B. zu folgendem Resultat:

In [None]:
np.arange(8) + 10

Addieren wir 2 Vektoren, so werden alle Werte an ihrer jeweiligen Stelle miteinander addiert.

In [None]:
np.arange(8) + np.arange(8)

Gleiches gilt für die Multiplikation

In [None]:
np.arange(10) * 5

In [None]:
np.arange(8) * np.arange(8)

Arrays kann man auch mit Skalaren und Arrays vergleichen

In [None]:
np.arange(8) > 2

In [None]:
np.arange(8) == (np.arange(8) *2)

Das Skalarprodukt (auch inneres Produkt genannt) ist eine eigene Form der Multiplikation zweier Vektoren. Dabei wird die Summe der Produkte aller Komponenten der beiden Vektoren.

In [None]:
a = np.arange(5)
print("a: ", a)
b = np.arange(5)*2
print("b: ", b)
c=a*b
print("c = a*b: ", c)
d=a.dot(b)
print("d = a.b: ", d)

Die Summe aller Elemente eines Arrays bilden Sie mit der Funktion `sum`.

In [None]:
np.arange(8).sum()

Darüberhinaus gibt es noch Operationen für Matrizen

In [None]:
A = np.arange(20).reshape((4,5))
B = np.arange(20).reshape((4,5))
print("A+B:\n", A+B)
print("A∘B:\n", A*B)

Beachten Sie, dass die Multiplikation mit dem `*`-Operator die elementweise Multiplikation ist. Diese Operation wird auch Hadamard-Produkt oder Schur-Produkt genannt. Bei der elementweisen Multiplikation müssen beide Matrizen dieselbe Struktur besitzen.

Unter einer Matrixmultiplikation versteht man eine andere Operation. Zwei Matrizen $A$ und $B$ werden miteinander multipliziert, indem man sämtliche Skalarprodukte der Zeilenvektoren von $A$ mit den Spaltenvektoren von $B$ bildet.
Die Spaltenzahl von $A$ muss daher mit der Zeilenzahl von $B$ übereinstimmen.

In [None]:
A = np.arange(20).reshape((4,5))
B = np.arange(20).reshape((5,4))
print("A⋅B:\n", A@B)

### Warum ist NumPy effizient

Im folgenden wollen wir kurz analysieren, warum NumPy-Datentypen für Operationen auf großen Datensätzen besser geeignet sind, als die eingebauten Typen von Python.
Wir Vergleichen hier 2 Vektoren $X$ und $Y$: $X$ wird dabei als NumPy Array erzeugt, $Y$ ist ein reguläres Tupel-Objekt. Die Daten/Werte in $X$ und $Y$ sind aber gleich.

In [None]:
import math
N = 1000000
# X ist ein NumPy Array
X = np.linspace(0,N-1,num=N)/N
# Y Ist ein Tupel
Y = tuple(y/N for y in range(0,N))
print(sum(X-Y)) # X und Y sind 'gleich'

Dass die unterschiedlichen Datentypen (im Beisiel, Tupel und NumPy Array) sehr unterschiedliche Speicherbedarfe haben, ist nicht ganz leicht nachzuprüfen. Zwar besitzt das Modul `sys` die Funktion `getsizeof`, welche auf beliebeige Objekte angewendet werden kann. Wenn man aber `getsizeof` auf ein Objekt eines Sequentiellen Datentyps anwendet, so werden nur die enthaltenen Objektreferenzen in die Berechnung der _Größe_ miteinbezogen; nicht die referenzierte Objekte selbst. Die folgende Funktion `deep_getsizeof` analysiert die Größe eines Objekts und exploriert dabei alle enthaltenen Objekte in rekursiever Weise. Damit erhält man den "echten" Speicherbedarf eines Objektes.

In [None]:
from sys import getsizeof
from collections.abc import Mapping, Container
def deep_getsizeof(o, ids=None):
    if not ids:
        ids = set()
                   
    d = deep_getsizeof
    if id(o) in ids:
        return 0

    r = getsizeof(o)
    ids.add(id(o))

    if isinstance(o, str) or isinstance(0, str):
        return r

    if isinstance(o, Mapping):
        return r + sum(d(k, ids) + d(v, ids) for k, v in o.iteritems())

    if isinstance(o, Container):
        return r + sum(d(x, ids) for x in o)

    return r

In [None]:
sX = deep_getsizeof(X)
sY = deep_getsizeof(Y)
print("NumPy Array X ist %d kByte groß." % (sX/1024))
print("Tupel Y ist %d kByte groß." % (sY/1024))

Wenn Sie wissen möchten, welche mathematischen Bibliotheken NumPy intern verwendet, können Sie sich die entsprechenden Systempfade mit `np.__config__.show()` ausgeben lassen.

In [None]:
np.__config__.show()

## Matplotlib

Mit der Matplotlib Bibliothek können in Python mit recht einfachen Mitteln gutaussehende Grafiken erstellt werden. Der Funktionsumfang der Bibliothek ist sehr groß, daher werden wir Sie hier nur anhand einiger Beispiele vorstellen. Für die Darstellung spezieller Graphen gibt es viele Beispiele in der [Matplotlib Galerie](https://matplotlib.org/gallery/index.html).

Denken Sie daran, zuerst die Bibliotheksfunktionen einzubindnen.

In [None]:
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
%matplotlib inline
#%matplotlib notebook

Die obigen `import` Anweisungen sind _boilerplate code_, also ein Textbaustein, den Sie immer in gleicher Form verwenden, wenn Sie mit _numpy_ und _matplotlib_ arbeiten. Auch die Abkürzungen der Modulnamen haben sich in dieser Form etabliert.

`%matplotlib` hingegen ist eine _magic function_ in ipython. Mit diesen Funktionen lassen sich generelle Einstellungen für die interaktive shell vornehmen. Mit dem Parameter `inline` stellt man ein, das die Grafiken im interaktiven Modus direkt unter dem Code dargestellt werden. Die Option `notebook` ist eine erweiterte Variante mit interaktiven Elementen für Python Notebooks.

Die folgende Code-Zelle zeigt ein einfaches Beispiel, in dem eine Sinus- und eine Cosinus-Funktion mittels NumPy erzeugt und die Graphen der Funktionen mit dem Modul _pyplot_ aus dem Paket matplotlib dargestellt werden.

In [None]:
x = np.linspace(0,2*np.pi)
fig = plt.figure()
plt.plot(x,np.sin(x),label="Sinus")
plt.plot(x,np.cos(x),label="Cosinus")
l_sine, l_cos = plt.gca().lines
l_cos.set_linewidth(10)
plt.legend(loc='lower left')
plt.show()

Numpy stellt den Dekorator `numpy.vectorize` zur Vektorisierung von Funktionen zur Verfügung. Wird dieser Dekorator auf eine Funktion angewendet, so wird die Funktion zur Laufzeit auf alle Elemente der als Argumente übergebenen NumPy Arrays angewendet. Dieser Dekorator dient nicht unbedingt der Effizienz (intern ist der Dekorator als einfache Schleife über alle Elemente implementiert) erlaubt es aber, Funktionen mit skalaren Parametern auch auf Vektoren anzuwenden.

In [None]:
@np.vectorize
def vect_exp(x,y):
    return np.exp(x) * np.sin(y)

print("Mit List Comprehension:")
%time A = tuple(math.exp(a)*math.sin(a) for a in Y)

print("\nMit der map Funktion:")
%time B = tuple(map(lambda a,b: math.exp(a)*math.sin(b), Y, Y))

print("\nMit numpy Funktionen:")
%time C = np.exp(X)*np.sin(X)

print("\nMit einer vektorisierten Funktion:")
%time D = vect_exp(X,X)

print("\nTesten, ob die Arrays gleich sind:")
if sum(B-C)==0.0 and sum(B-D)==0.0:
    print("OK")
else:
    print("Der Fehler ist %e" % max(sum(B-C),sum(B-D)))

Matplotlib kann nicht nur Funktionsgraphen zeichnen, sondern bietet eine Fülle von verschiedenen Diagrammtypen. Eine gute Übersicht finden Sie [hier](https://matplotlib.org/gallery.html). Im folgenden Beispiel benutzen wir ein Histogramm um die Verteilung einer Zufallsvariablen darzustellen. Mit dem NumPy Modul _random_ generieren wir uns einen Vektor mit 20000 Einträgen auf Basis der Normal-Verteilung (auch Gauß-Verteilung genannt). Ein Histogramm ist ein Säulendiagramm, das darstellt, wie viele Elemente in einen bestimmten Wertebereich fallen. Der Parameter `bins` gibt an, in wie viele Bereiche die Darstellung aufgeteilt werden soll. Im Beispiel wollen wir also ein Sälendiagramm mit 200 Säulen zeichnen. Man erkennt im Diagramm die typische _Glockenkurve_ mit dem Erwartungswert (hier: 0) in der "Mitte".

In [None]:
fig = plt.figure()
N = 20000
W = np.random.standard_normal(size=N)
plt.hist(W,bins=(N//100))
plt.show()

Zufallszahlen sind in vielen Bereichen des wissenschaftlichen Rechnens und der angewandten Mathematik (z.B. in der Finanzmathematik) wichtig. Häufig geht es darum, komplexe Prozesse zu simulieren, deren Ausgang von Wahrscheinlichkeiten abhängt.
Im nächsten Beispiel, generieren wir wieder Folgen von (normalverteilten) Zufallszahlen. Auf dieser Folge berechnen wir dann mit `numpy.cumsum` die kumulierte Summe (auch [Präfixsumme](https://de.wikipedia.org/wiki/Präfixsumme) genannt). Das bedeutet, wir berechnen für jede Position in der Folge die Summe aller Folgenglieder bis zu dieser Position. Dazu addieren wir noch einen Startwert. Da der Erwartungswert der Normalverteilung Null ist und die einzelnen Elemente der Folge unabhängig sind, ist auch der Erwartungswert der Summe gleich Null.
Wir sehen aber im Beispiel, dass sich einige der Zufallsprozesse extremer in positive oder negative Richtung entwickeln.

In [None]:
fig = plt.figure()
N = 100
Startwert=10
Runden=100
Mittelwert=0
for i in range(0,Runden):
    X = np.random.standard_normal(size=N)
    X = np.cumsum(X)+Startwert
    plt.plot(X)
    Mittelwert += np.average(X)
Mittelwert /= Runden
plt.show()
Mittelwert

Wenn Sie diese Zufallsprozesse mathematisch etwas erweitern kommen Sie zu Modellen, die heutzutage von Banken und Finanzdienstleistern eingesetzt werden, um Optionspapiere zu bewerten.

Auch wenn an dieser Stelle die Details des Beispiels nicht weiter behandelt werden, sehen Sie, dass der Code sehr übersichtlich ist. Das ist sowohl bei der Entwicklung, als auch beim Verstehen von Algorithmen sehr vorteilhaft. Python, mit den Erweiterungen NumPy, SciPy und Matplotlib, hat sich für Ingenieure und Wissenschaftler zu einer echten Alternative zu kommerziellen Tools wie etwa Matlab entwickelt.


In [None]:
fig = plt.figure()
Laufzeit = 250
Drift = 0.0005
Volatilitaet = 0.01
Startpreis = 20
t = np.linspace(0, Laufzeit-1, Laufzeit)
Endpreis = 0
Simulationen=200
for i in range(0,Simulationen):
    # Standard-Wiener-Prozess simuliert durch einen Gaußschen Random Walk
    W = np.random.standard_normal(size = Laufzeit)
    W = np.cumsum(W)
    # # Geometrische Brownsche Bewegung mit Drift
    X = (Drift-0.5*Volatilitaet**2)*t + Volatilitaet*W 
    S = Startpreis*np.exp(X)
    plt.plot(t, S)
    Endpreis += S[-1]
plt.plot(t, [Startpreis]*Laufzeit, lw=3, color='black')
plt.show()
print("Erwarteter Preis: %f" % (Endpreis/Simulationen))

Das Paket **SciPy** liefert eine Reihe weiterer mathematischer Funktionen, die über den Umfang von NumPy hinaus gehen.
Ein relativ einfaches Beispiel ist das Ableiten von Funktionen mit der Methode `derivative` aus dem Module `scipy.misc`. Im Beispiel erzeugen wir eine Kubische Funktion $f(x)=x^3+x^2$ und stellen sie dann, zusammen mit ihrer ersten und zweiten Ableitung' mit der _matplotlib_ dar.

In [None]:
import sys
!{sys.executable} -m pip install --user Scipy

In [None]:
from scipy.misc import derivative
def f(x):
    return x**3 + x**2

fig = plt.figure()
X = np.linspace(-3,3)
plt.plot(X,f(X),label="f",lw=3)
plt.plot(X,derivative(f,X),label="f'")
plt.plot(X,derivative(f,X,n=2),label="f''")
plt.legend(loc='best',fontsize='large')
plt.show()

### Interaktion

Das die Plots direkt im Jupyter Notebook erscheinen ist sehr praktisch.
So können Sie Ihre Daten analysieren und direkt in nächsten Code-Zelle weiter bearbeiten.
 
Jupyter bietet aber noch mehr Möglichkeiten, um auf Ausgaben einzuwirken.
Für IPython kibt es Zusatzmodule, die interaktive Widgets im Browser bereitstellen.
Mit diesen Widgets kann man den Code-Zellen Bedienelemente hinzufügen, mit denen der Code interaktiv gesteuert werden kann.

Ein recht einfaches Bedienelement ist ein Schieberegler, mit sich ein skalarer Parameter einstellen lässt.
Ein solcher Slider lässt sich mit der Methode `interact` aus dem Modul `ipywidgets.widgets` leicht umsetzen.
`interact` ist dabei recht flexibel.
Falls der Parameter kein Skalar, sonder ein Boolean ist, wird eine Chackbox dargestellt.
Bei einem String entsprechend ein Eingabefeld.

Die Methode verlangt als erstes Argument eine Funktionsreferenz, danach folgen die einzustellenden Parameter der Funktion.

In [None]:
import webbrowser
url = 'https://jupyter-tutorial.readthedocs.io/de/latest/workspace/jupyter/ipywidgets/examples.html'
webbrowser.open(url)

In [None]:
from ipywidgets.widgets import interact, interactive, fixed
from ipywidgets import widgets
def f(x):
    print(x)
    
interact(f, x=10)

`interact` kann übrigens auch als Dekorator verwendet werden:

In [None]:
@interact
def f(x=10):
    print(x)

In der folgenden Code-Zelle greifen wir das Beispiel mit der Ableitung von oben nochmal auf.
Statt einer festen Funktion $f(x)=x^3+x^2$ nehmen wir hier eine allgemeine Polynomfunktion $f(x)=ax^3+bx^2+cx+d$ an.
Die Parameter $a$ bis $d$ werden über einzelne Regler interaktiv bedienbar gemacht.

In [None]:
%matplotlib notebook
from scipy.misc import derivative

def g(a,b,c,d):
    def foo(x):
        return a*x**3 + b*x**2 + c*x +d
    return foo

def plotte_funktionen(a,b,c,d):
    fig = plt.figure()
    X = np.linspace(-3,3)
    f = g(a,b,c,d)
    plt.plot(X,f(X),label="f",lw=5)
    plt.plot(X,derivative(f,X),label="f'")
    plt.plot(X,derivative(f,X,n=2),label="f''")
    plt.legend(loc='best',fontsize='large')
    plt.draw()

interact(plotte_funktionen, a=1.0, b=1.0, c=1.0, d=1.0)    


In einem abschließenden Beispiel geht es nochmal um Matrix-Berechnungen mit NumPy.
Wir wollen Bilder bearbeiten und mit matplotlib anzeigen. Hierzu laden wir zuerst das Graustufen Bild aus dem Beispiel in [Abschnit 3](#3.-Web-Zugriffe-mit-der-Requests-Bibliothek) als Instanz `img`. Im zweiten Schritt formen wir das Graustufenbild in ein RGB-Format um, indem wir aus dem Grauwert eines Pixels ein Array mit 3 identischen Werten generieren (hierzu benutzen wir die `stack`Funktion).

In [None]:
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import numpy as np
%matplotlib inline

img=mpimg.imread('image.png')
#Mache aus dem Graustufenbild ein RGB Bild
#Dazu muss der "Grau-Kanal" verdreifacht werden
#(in Form eines 3-Tupels):
rgb_img = np.stack((img,)*3, axis=-1)
imgplot = plt.imshow(rgb_img)

Nun können wir z.B. die Farbgebung der Bilder verändern, indem wir einzelnen Farbkanäle im additiven RGB (Rot-Grün-Blau) Farbraum, auf Null setzen:

<!-- ![](https://upload.wikimedia.org/wikipedia/commons/2/28/RGB_illumination.jpg) -->

In [None]:
rg_img = np.copy(rgb_img)
#Blau-Kanal auf Null -> Gelb
rg_img[:,:,2] = 0
rb_img = np.copy(rgb_img)
#Grün-Kanal auf Null -> Violett
rb_img[:,:,1] = 0
gb_img = np.copy(rgb_img)
#Rot-Kanal auf Null -> Türkis
gb_img[:,:,0] = 0

plt.figure()
plt.subplot(131)
plt.imshow(rg_img)
plt.gca().axes.get_xaxis().set_visible(False)
plt.gca().axes.get_yaxis().set_visible(False)

plt.subplot(132)
plt.imshow(rb_img)
plt.gca().axes.get_xaxis().set_visible(False)
plt.gca().axes.get_yaxis().set_visible(False)

plt.subplot(133)
plt.imshow(gb_img)
plt.gca().axes.get_xaxis().set_visible(False)
plt.gca().axes.get_yaxis().set_visible(False)

**Aufgabe: Erzeugen Sie ein neues Bild, indem Sie Bereiche (horizontale "Streifen") aus den Arrays `rg_img`, `rb_img` und `gb_img` selektieren und zu einem neuen Bild zusammenfügen.**

In [None]:
# YOUR CODE HERE
raise NotImplementedError()