# Kommentare zur Bedienung dieses Notebooks

- Alle Zellen mit Python-Code sind ausführbar. Dazu muss in der Zelle `Strg + Enter` gedrückt werden und die Ausgabe wird unter der Zelle angezeigt.
- Die Zellen können beliebig verändert werden. Die Änderungen werden nicht gespeichert, daher startet man jedes Mal mit dem ursprünglichen Notebook
- Dieses Notebook ist dazu gedacht, parallel zur Vorlesung die behandelten Themen und Python-Codes testen zu können.


# Vorlesung: Numpy

# Wiederholung: Listen

Listen sind Kontainer mit mehreren Elementen. Zur Erzeugung von Listen können die Elemente einfach in `[..]` angegeben werden:

In [None]:
l = [1, 2, 3, 4] 
print(type(l))

Einzelne Elemente können mit `[?]` ausgerufen werden:

In [None]:
print(l[0], l[2])   # print the first and third element of the list 'l'.
                    # Indices of list elements start with 0 and end with 'n-1
                    # (for a container with 'n' elements) as in C)

Die Länge einer Liste kann man mit `len(l)` abfragen:

In [None]:
print(len(l))    

Einzelne Elemente der Liste können geändert werden:

In [None]:
l = [1, 2, 3, 4, 5]
print(l)
l[1] = 5  # lists can be modified after
          # they have been created! 
print(l)

Um auf alle Listenelemente zugreifen zu können, können sie einfach in Schleifen angesprochen werden:

In [None]:
l = list(range(1, 11))
print(l)

In [None]:
# replace all elements in 'l' with the double value
i = 0
# Note that the index runs from 0 to len(l)-1!
while i < len(l):
    l[i] = l[i] * 2
    i = i + 1
    
print(l)   

In [None]:
for i in l:
    print(i)

<div class="alert alert-warning">
__Hinweis:__
Die Zählung der Elemente beginnt immer bei 0 und geht bis `len(l)-1`!
</div>

## Bemerkung: Importieren von Bibliotheken

Sie haben schon häufiger den Befehle `import` gesehen, mit dem sie Bibliotheken laden können, so dass die Funktionen der Bibliothek ihnen zum Programmieren zur Verfügung stehen. 

Standardmäßig wird so eine Bibliothek über 

    import numpy
    
geladen. Die einzelnen Funktionen der Bibliothek können dann - hier ein Beispiel für die Berechnung des Sinus - über

    numpy.sin()
    
angesprochen werden. Um sich Tipparbeit zu sparen wird auch oft der folgende Befehl zum Laden von Bibliotheken verwendet:

    import numpy as np
    
Damit können die Funktionen der Bibliothek über die Abkürzung

    np.sin()
    
aufgerufen werden.

Beide Möglichkeiten sind dabei äquivalent und können je nach Preferenz verwendet werden.

#  Einführung in `numpy` -- Kontainer

Für mehrdimensionale numerische Rechnungen und zur Darstellung von Daten stehen in Python Kontainer der Bibliothek `numpy` zur Verfügung.

Diese Arrays sind homogen, d.h. alle Elemente müssen - im Gegensatz zu den Standard-Listen in Python - vom selben Typ sein. Eine Liste der möglichen Typen findet sich [hier](http://docs.scipy.org/doc/numpy/user/basics.types.html).
`numpy`-Arrays bestehen aus dem eigentlichen Array, sowie - optional - aus Informationen über den Typ der Elemente. 

Ein großer Vorteil von numpy ist die deutlich schnellere Bearbeitungszeit im Vergleich zu herkömmlichen Listen.  `numpy` kann dies deutlich verbessern, so dass auch größere Datenmengen mit Python verarbeitet werden können.


Zum Anlegen eines `numpy`-Arrays muss zuerst über `import` die numpy Bibliothek geladen werden. Anschließend erfolgt die Initialisierung ähnlich zu den Python-Listen, allerdings muss die Liste von einem `numpy.array()` umschlossen werden:

In [None]:
import numpy as np

# numpy-array creation from a list:
a = np.array([1.0, 2.0, 3.0, 4.0]) 

Mit den folgenden Befehlen können wichtige Informationen des `numpy`-Arrays abgefragt werden:

In [None]:
print(type(a))      # the type is numpy-array

In [None]:
print(a.dtype)     # the data-type object.

In [None]:
print(a.ndim)      # number of array dimensions

In [None]:
print(a.shape)     # shape of an array (interesting mainly for multi-dimensional arrays)

## Datentypen in `numpy`-Arrays

Insbesondere wenn man Daten einliest und anschließend in einem `numpy`-Array speichert und bearbeitet, ist es wichtig zu wissen welchen Datentyp man benötigt. Beim Anlegen eines `numpy`-Arrays mit

    a = np.array([1.0, 2.0, 3.0, 4.0])
    
is der Typ der Elemente von `a` abhängig von dem verwendeten Rechner. Die Elemente werden z.B. vom Typ `np.float32` sein auf 32-bit Maschinen, wohingegen auf 64-bit Maschninen der Typ `np.float64` verwendet werden würde. Dies kann in Extremfällen zu unterschiedlichen Ergebnissen führen, je nachdem auf welchem Rechner das Programm ausgeführt wird. Daher ist es wichtig genau zu spezifizieren, welchen Typs die Elemente des Arrays sind.

Dafür muss bei der Initialisierung des Arrays zusätzlich die Option `dtype` verwendet werden. Die Initialisierung kann dann z.B. so aussehen:

   ```
   # single precision (4-byte) float numbers
   a_single = np.array([1.0, 2.0, 3.0, 4.0], dtype=np.float32)
   
   # double precision (8-byte) float numbers
   a_double = np.array([1.0, 2.0, 3.0, 4.0], dtype=np.float64))
   ```


## Erzeugung von `numpy`-Arrays

Ähnlich wie bei den Standard-Listen von Python gibt es auch bei den `numpy`-Arrays verschiedene Möglichkeiten neue Arras zu erzeugen.

Die einfachste Möglichkeit ist, wie oben schon demonstriert, die direkte Übergabe der Werte zur Initialisierung des Arrays. Alternativ kann man auch den Start- und End-Wert zusammen mit der Schrittweite angeben. Hierbei muss das Array allerdings mit `numpy.arange()` initialisiert werden.

Beide Möglichkeiten demonstriert das folgende Beispiel:

In [None]:
import numpy as np

# there are many possibilities to create a numpy-array
a = np.array([1,2,3,4])       # conversion of a numerical list to a numpy-array
b = np.arange(0.0, 1.0, 0.1)  # array between two limits with a given distance
                              # between array elements. The array if a half-open
                              # interval!
print(a)
print(b)

Eine weitere Möglichkeit ist über die Festlegung der Anzahl der Zwischenschritte. Hierbei muss das Array mit `numpy.linspace()` erzeugt werden, wie das unten stehende Beispiel zeigt.

In [None]:
c = np.linspace(0.0, 1.0, 10) # array between two limits with a given number of
                              # array elements. Both limits are contained in the
                              # array
print(c)

Falls man ein Array möchte, in dem sich nur Nullen befinden, kann das mit der Funktion `numpy.zeros()` erzeugt werden:

In [None]:
d = np.zeros(10)             # array of 10 elements with 0 
print(d)

## Erweitern von `numpy`-Arrays

Wurde ein `numpy`-Array bereits angelegt und es soll um Elemente erweitert werden, kann die Funktion `append()` verwendet werden. Das neue Element wird hierbei immer am _Ende_ des Arrays eingefügt.

In [None]:
import numpy as np

a = np.arange(0, 11, 1)
print(a)

In [None]:
a = np.append(a,11)
print(a)

Alternativ kann auch die Funktion `insert()` verwendet werden. Hiermit kann ein Element auch an anderen Stellen des Arrays eingefügt werden:

In [None]:
a = np.arange(0, 11, 1)
print(a)
a = np.insert(a,2,22)
print(a)

Bitte achten Sie hier auf die Nummerierung. Mit `0` fügt man Elemente vor dem ersten Element ein, mit `len(a)` am Ende des Arrays (analog zu `append`).

In [None]:
a = np.arange(0, 11, 1)
print(a)
a = np.insert(a,0,0.001)
print(a)

In [None]:
a = np.insert(a,len(a),100)
print(a)

## Unterteilung von `numpy`-Arrays

Die Unterteilung von `numpy`-Arrays in kleinere Teil-Arrays (auch "Slicing" genannt) funktioniert analog zu den Standard-Listen von Python. 

In [None]:
import numpy as np

a = np.arange(0, 11, 1)
print(a)

In [None]:
print(a[5])    # access 6th element (zero-based arrays!)

In [None]:
print(a[2:6])  # access third up to the sixth element

In [None]:
print(a[1::2]) # access every other element starting from the second

In [None]:
print(a[:-1])# access all elements except the last

In [None]:
print(a[::-1])# access all elements in reverse order

Die so erzeugten Teil-Arrays sind dabei aber vom gleichen Typ wie das ursprüngliche `numpy`-Array:

In [None]:
print(type(a[:-1]))

Das Unterteilen von `numpy`-Arrays kann auch für andere Dinge verwendet werden. So kann es auch auf der _linken_ Seite einer Zuweisung verwendet werden. In dem untenstehenden Fall wird ein Teil des bestehenden `numpy`-Arrays mit dem Wert `0` überschrieben.

In [None]:
print(a)
a[2:5] = 0
print(a)

## Speichermanagement von `numpy`-Arrays

Das Speichermanagement von `numpy`-Arrays ist sehr ähnlich zu dem von Standard-Listen in Python. Es gibt allerdings einen wichtigen Unterschied. `numpy` wurde darauf ausgelegt, dass es sehr große Datenmengen händeln kann. Daher sind hier Teil-Arrays, welche durch das Zerschneiden entstehen bei `numpy` keine neuen Kopien. Das führt dazu, dass wenn das neue Teil-Array geändert wird, sich auch das Ursprungs-Array ändert!

Das wird im folgenden Beispiel demonstriert:

In [None]:
import numpy as np

l = list(range(7))
n = np.arange(0, 7, 1)
print('Liste: ', l, ' numpy-Array:', n)

# slices behave differently for lists and numpy-arrays:
ls = l[1:4] # uses different memory than l!
ns = n[1:4] # uses same memory as n!
print('Teil-Liste: ', ls, ' Teil-numpy-Array:', ns)

In [None]:
print("\nAendern des ersten Elements in der Teil-Liste und dem Teil-numpy-Array:\n")

ls[0] = 5  # does not modify l
ns[0] = 5  # modifies also n
print('Liste: ', l, ' numpy-Array:', n)
print('Teil-Liste: ', ls, ' Teil-numpy-Array:', ns)

## Operationen an `numpy`-Array 

Ein großer Vorteil von `numpy`-Arrays ist, dass sie mit Standard-Rechenoperationen bearbeitet werden können. Diese Operationen werden dann __elementweise__ auf den Arrays ausgeführt. Der Rückgabewert ist dann wieder ein `numpy`-Array!


In [None]:
x = np.array([1, 2, 3])
y = np.array([4, 5, 6])
print('Array 1: ',x,' und Array 2: ',y)

In [None]:
print('Addition: ',x + y)   # element-wise addition

In [None]:
print('Multiplikation: ',x * y)   # element-wise multiplication

In [None]:
print('Gemischte Rechnung: ',x + 2 * y)  # more complex manipulation

In [None]:
print('Potenz: ',x**y)

In [None]:
print('Vergleich: ',y > 4)    # element-wise comparison resulting in
                # a bool-array!

Die Anwendungen dafür sind Berechnungen mit diesen Arrays mit hoher Performanz.

Neben den einfachen Rechenarten stehen auch Funktionen wie z.B. `sin()` zur verfügung. Wird so eine Funktion aus der `numpy`-Bibliothek auf ein `numpy`-Array angewendet, so wird die Funktion für jedes Element einzeln ausgeführt.

In [None]:
x = np.linspace(0.0, 2.0 * np.pi, 50)
y = np.sin(x)
print(y)

An dieser Stelle zeigt sich gut der Vorteil von `numpy`. Dadurch, dass Rechenoperationen direkt auf das komplette Array angewendet werden und nicht über eine Schleife auf jedes einzelne Element, kann man deutlich höhere Geschwindigkeiten erreichen. 

Den Geschwindigkeitsgewinn kann man einfach testen. Das Kommando `%%timeit` kann hier im JupyterNotebook verwendet werden, um die Zeit für das Ausführen einer Zelle zu messen. In den folgenden zwei Beispielen werden dieselben Operationen durchgeführt:

- Es wird ein Array `x` angelegt mit 100 Werten zwischen 0 und 2Pi.
- Für jedes Element des Arrays `x` soll der Sinus berechnet und in einem neuen Array `y` gespeichert werden.

Wenn Sie die beiden Zellen ausführen wird unter den Zellen die Zeit für die Ausführung angegeben.

In [None]:
%%timeit
# fast vector operations
x = np.linspace(0.0, 2.0 * np.pi, 100)
y = np.sin(x)

In [None]:
%%timeit
# C-like element-wise array manipulation
x = np.linspace(0.0, 2.0 * np.pi, 100)
y = np.zeros(len(x))

for i in range(len(x)):
    y[i] = np.sin(x[i])

Wie sie sehen können gewinnt man durch die Verwendung von `numpy`-Arrays in etwa einen Faktor von 10 in der Geschwindigkeit. Daher ist es gerade für große Datensätze empfehlenswert `numpy` für die Verarbeitung zu verwenden.

## Einfaches Darstellen von `numpy`-Arrays

Zum Darstellen von Daten wird die `matplotlib` verwendet. Es wird noch ein gesondertes Tutorial dazu geben, aber hier gibt es schon mal ein paar einfache Möglichkeiten um Daten darzustellen.

Im folgenden Beispiel werden zwei Arrays erstellt, eines enthält 100 Zahlen von 0 bis 2Pi als `x`, das andere die Sinus-Werte als`y` aus dem ersten Array. Diese beiden Arrays wollen wir jetzt darstellen. Dies kann einfach über 
    
    plt.plot(x,y)
    
geschehen. Um dem Histogramm noch Achsenbeschriftungen und eine Überschrift zu geben, werde die Befehle

    plt.xlabel(r"$x$")
    plt.ylabel(r"$y$")
    plt.title(r"The $\sin(x)$ function")
    
verwendet.

In [None]:
%matplotlib inline
# The previous line is necessary that matplotlib plots
# appear within the Jupyter documents. It is sufficent to
# give it once within a document.
import numpy as np
import matplotlib.pyplot as plt

plt.rcParams["figure.figsize"] = (12, 9) # (w, h)

# matplotlib plots numpy-array values!
x = np.linspace(0.0, 2.0 * np.pi, 100)
y = np.sin(x)

# Note that you can use LaTeX in for labels, titles
# etc.
plt.xlabel(r"$x$")
plt.ylabel(r"$y$")
plt.title(r"The $\sin(x)$ function")

# a simple x-y plot
plt.plot(x, y)


Analog können auch mehrere Graphen in ein Diagramm eingezeichnet werden.

In [None]:
%matplotlib inline

plt.rcParams["figure.figsize"] = (12, 9) # (w, h)

# Note that you can use LaTeX in for labels, titles
# etc.
plt.xlabel(r"$x$")
plt.ylabel(r"$y$")
plt.title(r"The $\sin(x)$ and $\cos(x)$ functions")

x = np.linspace(0.0, 2.0 * np.pi, 100)
sinx = np.sin(x)
cosx = np.cos(x)

# a simple x-y plot
plt.plot(x, sinx, "*-")
plt.plot(x, cosx, "ro")
plt.show()

# Zweidimensionale `numpy`-Arrays

Wie auch bei Listen können `numpy`-Arrays mehrere Dimensionen enthalten. Das kann nützlich sein, wenn zum Beispiel zusammenhängende Daten abgespeichert werden sollen.

Die Dimension eines solchen Arrays kann mit der Funktion `shape` abgefragt werden:

In [None]:
import numpy as np
x = np.array([ [67, 63, 87],
               [77, 69, 59],
               [85, 87, 99],
               [79, 72, 71],
               [63, 89, 93],
               [68, 92, 78]])
print(np.shape(x))

In [None]:
A = np.array([
[11, 12, 13, 14, 15],
[21, 22, 23, 24, 25],
[31, 32, 33, 34, 35],
[41, 42, 43, 44, 45],
[51, 52, 53, 54, 55]])
print(A)

In [None]:
print(A[2,3])

Analog zu eindimensionalen Arrays können auch mehrdimensionalen Arrays in kleinere Arrays zerteilt werden. Die Operation wird auch mittels `[?:?]`, wie es schon bei eindimensionalen Arrays der Fall war. Hier muss allerdings diese Syntax für jede Dimension angewendet werden.

In [None]:
print(A[:3, 2:])

In [None]:
print(A[3:, :])

In [None]:
print(A[:, 4:])

Auch zum Darstellen von Matrizen gibt es Funktionen. Der einfachste Weg eine Matrix darzustellen ist die Funktion `matshow()`. Hier wird jedes Matrixelement durch eine entsprechende Farbe dargestellt. Für unsere 4x4-Matrix sieht das dann folgendermaßen aus:

In [None]:
plt.rcParams["figure.figsize"] = (12, 9) # (w, h)

plt.matshow(A)
plt.colorbar()
plt.show()

## Weitere Beispiele

In [None]:
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams["figure.figsize"] = (12, 9) # (w, h)

a = np.zeros(shape=(100,100))

x = np.linspace(0.0, 2* np.pi, 100)
y = np.linspace(0.0, 2* np.pi, 100)

x_pos = 0
for i in x:
    y_pos=0
    for j in y:
        a[x_pos, y_pos] = np.cos(i)*np.sin(j)
        y_pos += 1
    x_pos += 1
      
plt.matshow(a)
plt.colorbar()

plt.show()

In [None]:
plt.plot(a[40])
plt.plot(a[20])
plt.plot(a[65])
plt.plot(a[:,35])
plt.show()

In [None]:
plt.plot(a[:,55:70:2])
plt.show()

In [None]:
plt.matshow(a[20:50,35:60])
plt.show()

# Fazit

Ein Beispiel für die Anwendung von `numpy`-Arrays ist die einfache Berechnung von Ableitungen. Im untenstehenden Beispiel soll die Ableitung von `sin(x)` berechnet werden.

Dafür werden zunächst die üblichen Module geladen:

In [None]:
# Skript zur Berechnung der Ableitung von sin(x)

import numpy as np
import matplotlib.pyplot as plt

plt.rcParams["figure.figsize"] = (12, 9) # (w, h)

Anschließend werden zwei Listen definiert, eine geht von $0$ bis $2\pi$ mit einer bestimmten Anzahl von Schritten, die andere enthält den entsprechenden Sinus der Werte.

In [None]:
x = np.linspace(0.0, 2.0 * np.pi, 10)
y = np.sin(x)

plt.plot(x, y, 'b-*')

Im oberen Plot sind die Punkte der Arrays mit einem blauen Sternchen `*` markiert. Diese Punkte stellen die Grenzen von Intervallen dar, die wir ab jetzt betrachten werden. Die Intervalle in `x` bzw. `y` sind gegeben durch:

In [None]:
# Wir nähern die Ableitung durch Delta y / Delta x
# in jedem Mittelpunkt der Intervalle [x_i; x_{i+1})

# Beachte dass delta_x, delta_y und mittel_x jeweils einen
# Punkt weniger enthalten als x und y!
delta_y = y[1:] - y[:-1]
delta_x = x[1:] - x[:-1]

Um die Ableitung zu berechnen wird in jedem Intervall der Mittelpunkt bestimmt. Um die Ableitung anzunähern, wird die Steigung der Geraden in diesem Punkt bestimmt. Dies kann einfach durch die Berechnung der Steigung von 
$$Steigung = \frac{\Delta y}{\Delta x}$$ geschehen:

In [None]:
mittel_x = (x[1:] + x[:-1]) / 2.
ableitung = delta_y / delta_x

Ein abschließendes Diagramm zeigt die Mittelpunkte (rote Punkte) im Vergleich zur richtigen Ableitung, dem Cosinus (grüne Linien).

In [None]:
plt.plot(x, y, 'b-*')
plt.plot(x, np.cos(x), 'g-')
plt.plot(mittel_x, ableitung, 'ro')
plt.show()

Sie können in der obersten Zelle auch die Anzahl der Punkte erhöhen, damit Sie sehen, dass sich wirklich eine Cosinus-Funktion ergibt.

# Nächste Woche: 
- Numpy Teil 2 
- Plotten
- Funktionen