## Notebook begleitend zum Video "Einführug Numpy"


### Numpy importieren

Bevor wir die volle Funktionalität von NumPy nutzen können, müssen wir als aller erstes die Bibliothek importieren. Mit dem Kürzel "as" geben wir numpy einen "Spitznamen" und können für alle Funktionen von Numpy ab jetzt schreiben np.some_function().

In [0]:
import numpy as np

### Numpy Funktionalitäten

#### Erstellen eines Vektors

Ein Vektor in Numpy wird als Array representiert. Hierbei ist ein horizontaler Vektor ein 1-dimensionaler und ein vertikaler Vektor ein 2-dimensionaler Vektor.

Die Funktion `np.array()` erzeugt dieses mehrdimensionale Numpy Array (ndarray).

In [0]:
vector_row = np.array([1,2,3]) # Horizontaler Vektor (1D)
vector_column = np.array([[1],[2],[3]]) # Vertikaler Vektor (2D und somit n x 1 Matrix)
print(vector_row)
print(vector_column)

[1 2 3]
[[1]
 [2]
 [3]]


#### Erstellen einer Matrix

Eine Matrix ist ebenfalls ein mehrdimensionales Array.

Auch hier wird dieses mit der Funktion `np.array()` erzeugt, wobei die Anzahl der Verschachtelungen (Array in einem Array) die Dimension der Matrix darstellt.

In [0]:
matrix = np.array([[1,2,3],[4,5,6]])
print(matrix)

[[1 2 3]
 [4 5 6]]


#### Hilfreiche Initialisierungen eines Arrays

Mittels einiger Funktionen lassen sich die Arrays unkompliziert mit Daten befüllen.

Hierbei bietet `np.arrange()` und `np.linspace()` mit unterschiedlichen Ansätzen die Möglichkeit ein Array mit einem bestimmten Intervall zu erzeugen.

In [0]:
# Werte von 0 bis 30 (exklusiv) mit Schrittgröße 2
range_with_fixed_interval = np.arange(0, 30, 2)
print(f"Vektor mit arange:\n{range_with_fixed_interval} \n")

# 9 gleichmäßig verteilte Werte zwischen 0 und 4
equally_spaced_range = np.linspace(0, 4, 9)
print(f"Vektor mit linspace:\n{equally_spaced_range} \n")

Vektor mit arange:
[ 0  2  4  6  8 10 12 14 16 18 20 22 24 26 28] 

Vektor mit linspace:
[0.  0.5 1.  1.5 2.  2.5 3.  3.5 4. ] 



#### Hilfreiche Initialisierungen einer Matrix

Ebenso gibt es fest definierte Funktionen um spezielle Matrizen zu erstellen. 

Es kann dabei ganz einfach eine Identitätsmatrix oder eine Matrix mit beliebiger Größe, welche ausschließlich aus Einsen oder Nullen besteht, erstellt werden. 

In [0]:
matrix_id = np.eye(3)           # 3 x 3 Identitätsmatrix
matrix_ones = np.ones((3, 2))   # Matrix aus Einsen
matrix_zeros = np.zeros((3, 2)) # Matrix aus Nullen
print(f"Identitätsmatrix:\n{matrix_id} \n")
print(f"Einermatrix:\n{matrix_ones} \n")
print(f"Nullermatrix:\n{matrix_zeros} \n")

Identitätsmatrix:
[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]] 

Einermatrix:
[[1. 1.]
 [1. 1.]
 [1. 1.]] 

Nullermatrix:
[[0. 0.]
 [0. 0.]
 [0. 0.]] 



#### Zugriff auf Elemente eines mehrdimensionalen Array

Der Zugriff auf die einzelnen Elemente funktioniert wie folgend gezeigt und wahrscheinlich auch aus anderen Programmiersprachen bekannt. 

Mit der :-Schreibweise kann ganz einfach ein bestimmter Bereich des Arrays abgefragt werden, in dem man einen Start- und Endindex angibt.
Beim Index mit negativen Zahlen geht das Array in umgedrehter Reihenfolge durch seine Werte.

In [0]:
vector = np.array([1,2,3])
matrix = np.array([[1,2,3],[4,5,6]])
print(f"Vektor: {vector}")
print(f"Matrix:\n{matrix}")

# Das 3. Element des Vektors
print(f"\nDas 3. Element des Vektors: {vector[2]}")

# Das 2. Element in der 2. Zeile der Matrix
print(f"\nDas 2. Element in der 2. Zeile der Matrix: {matrix[1,1]}")

# Alle Elemente bis zum und exklusive dem Element am Index 2
print(f"\nAlle Elemente bis zum und exklusive dem Element am Index 2: {vector[:2]}")

# Alles Elemente ab und inklusive dem Element am Index 2
print(f"\nAlles Elemente ab und inklusive dem Element am Index 2: {vector[2:]}")

# Alle Elemente des Vektors
print(f"\nAlle Elemente des Vektors: {vector[:]}")

# Das letzte Element (gleiche Ergebnis wie vector[len(vector)-1])
print(f"\nDas letzte Element des Vektors: {vector[-1]}")

Vektor: [1 2 3]
Matrix:
[[1 2 3]
 [4 5 6]]

Das 3. Element des Vektors: 3

Das 2. Element in der 2. Zeile der Matrix: 5

Alle Elemente bis zum und exklusive dem Element am Index 2: [1 2]

Alles ab und inklusive dem Element am Index 2: [3]

Alle Elemente des Vektors: [1 2 3]

Das letzte Element des Vektors: 3


#### Eigenschaften einer Matrix

In [0]:
matrix = np.array([[1,2,3],[4,5,6]])
print(f"Matrix:\n{matrix}")

# Anzahl von Reihen und Spalten
print(f"\nForm der Matrix (Anzahl von Reihen und Spalten): {matrix.shape}")

# Anzahl der Elemente (Reihen * Spalten)
print(f"\nAnzahl der Elemente (Reihen * Spalten): {matrix.size}")

# Anzahl der Dimensionen
print(f"\nDimension der Matrix: {matrix.ndim}")

Matrix:
[[1 2 3]
 [4 5 6]]

Form der Matrix (Anzahl von Reihen und Spalten): (2, 3)

Anzahl der Elemente (Reihen * Spalten): 6

Dimension der Matrix: 2


#### Transformationen auf Matrizen

Wie in der nächsten Zeile an einigen Beispielen gezeigt, lassen sich Numpy Arrays relativ einfach in eine andere Form (unterschidliches shape) verwandeln.

Hierbei muss ausschließlich darauf geachtet werden, dass die Elemente der neuen Form immernoch die gleiche Anzahl an Elementen besitzt wie die alte Form.

Die Matrix speichert die neue Form nicht, sondern dies muss mit einer neuen Variablenzuweisung geschehen.

`matrix.T` ist eine besondere Art der Umformung und spiegelt die Werte an der Diagonalen (Transponierte Matrix)

In [0]:
matrix = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
print(f"Matrix:\n{matrix}")

print(f"\nReshaped (12x1):\n{matrix.reshape(12,1)}")

print(f"\nReshaped (1x12):\n{matrix.reshape(1,12)}")

print(f"\nReshaped (2x6):\n{matrix.reshape(2,6)}")

print(f"\nReshaped (1 Zeile mit so vielen Spalten wie nötig (-1)):\n{matrix.reshape(1,-1)}")

print(f"\nFlattened (Umwandlung in ein unverschachteltes 1D Array):\n{matrix.flatten()}")

print(f"\nTransponiert (Spiegelung an der Diagonalen):\n{matrix.T}")

Matrix:
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]

Reshaped (12x1):
[[ 1]
 [ 2]
 [ 3]
 [ 4]
 [ 5]
 [ 6]
 [ 7]
 [ 8]
 [ 9]
 [10]
 [11]
 [12]]

Reshaped (1x12):
[[ 1  2  3  4  5  6  7  8  9 10 11 12]]

Reshaped (2x6):
[[ 1  2  3  4  5  6]
 [ 7  8  9 10 11 12]]

Reshaped (2x6):
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]

Reshaped (1 Zeile mit so vielen Spalten wie nötig (-1)):
[[ 1  2  3  4  5  6  7  8  9 10 11 12]]

Flattened (Umwandlung in ein unverschachteltes 1D Array):
[ 1  2  3  4  5  6  7  8  9 10 11 12]

Transponiert (Spiegelung an der Diagonalen):
[[ 1  5  9]
 [ 2  6 10]
 [ 3  7 11]
 [ 4  8 12]]


#### Punktprodukt

Der dot-Operator (oder @) bildet das bekannte Punktprodukt von 2 Vektoren. 

In [0]:
vector1 = np.array([1,2,3])
vector2 = np.array([1,1,1])
print(f"Vector1: {vector1}")
print(f"Vector2: {vector2}")

# Punktprodukt
print(f"\nPunktprodukt = {np.dot(vector1,vector2)}")

# Punktprodukt kann auch mit dem @ Operator geschrieben werden
# vector1 @ vector2

Vector1: [1 2 3]
Vector2: [1 1 1]

Punktprodukt = 6



#### Rechenoperationen von Matrizen

Die Elementbasierten Operationen funktionieren, wie der Name schon sagt auf den einzelnen Elementen. So wird das 1. Element der einen Matrix mit dem 1. Element der anderen Matrix verrechnet usw.

Die klassische Matrixmultiplikation funktioniert mit dem dot-Operator, welcher normalerweise das Punktprodukt von 2 Vektoren bildet.
Hierfür müssen die verrechneten Matrizen nur in die richtige Form gebracht werden, sodass die Spalten der ersten Matrix mit den Reihen der zweiten Matrix über einstimmen. 

In [3]:
matrix1 = np.array([[1,2,3],[4,5,6]])
matrix2 = np.array([[2,2,2],[2,2,2]])
print(f"Matrix1:\n{matrix1}")
print(f"\nMatrix2:\n{matrix2}")

# Elementweise Addition
print(f"\nmatrix1 + matrix2 =\n{matrix1 + matrix2}")

# Elementweise Subtraktion
print(f"\nmatrix1 - matrix2 =\n{matrix1 - matrix2}")

# Elementweise Multiplikation
print(f"\nmatrix1 * matrix2 =\n{matrix1 * matrix2}")

# Elementweise Division
print(f"\nmatrix1 / matrix2 =\n{matrix1 / matrix2}")

# Matrixmultiplikation (nur möglich für (n x m)-Matrix * (m x l)-Matrix)
# Reshape muss in diesem Fall vorgenommen werden
dot = np.dot(matrix1.reshape(3,2),matrix2)
# Die transponierte Matrix vertauscht genau die Zeilen und Spalten, wie von uns gewollt. 
# Somit wird das Transponieren in den meisten Fällen eher das gewünschte Ergebnis erzielen, da reshape() die Reihenfolge der Elemente anders betrachtet. 
# dot = np.dot(matrix1.T,matrix2)
print(f"\nMatrixmultiplikation =\n{dot}")

Matrix1:
[[1 2 3]
 [4 5 6]]

Matrix2:
[[2 2 2]
 [2 2 2]]

matrix1 + matrix2 =
[[3 4 5]
 [6 7 8]]

matrix1 - matrix2 =
[[-1  0  1]
 [ 2  3  4]]

matrix1 * matrix2 =
[[ 2  4  6]
 [ 8 10 12]]

matrix1 / matrix2 =
[[0.5 1.  1.5]
 [2.  2.5 3. ]]
[[1 2]
 [3 4]
 [5 6]]
[[1 4]
 [2 5]
 [3 6]]

Matrixmultiplikation =
[[10 10 10]
 [14 14 14]
 [18 18 18]]


#### Anwenden von Funktionen auf mehrere Elemente

Mit Hilfe des `lambda`-Operators können anonyme Funktionen, d.h. Funktionen ohne Namen erzeugt werden. Sie haben eine beliebige Anzahl von Parametern, führen einen Ausdruck aus und liefern den Wert dieses Ausdrucks als Rückgabewert zurück.

Bekommt die Funktion ein mehrdimensionales Numpy Array operiert es auf allen Elementen seperat. 

In [0]:
matrix = np.array([[1,2,3],[4,5,6],[7,8,9]])

# Ein lambda Ausdruck der die Eingabe mit 100 addiert und implizit returned
add_100 = lambda i: i+100

# Funktionsanwendung auf alle Elemente der Matrix
matrix = add_100(matrix)
print(matrix)

[[101 102 103]
 [104 105 106]
 [107 108 109]]


#### Berechnen von Durchschnitt, Standardabweichung und Varianz

Numpy bietet ebenso einige statistische Funktionalitäten, welche für unsere Zwecke erstmal nicht von Relevanz sind. 

In [0]:
matrix = np.array([[1,2,3],[4,5,6],[7,8,9]])

# Statistisches Mittel
print(np.mean(matrix))

# Standardabweichung
print(np.std(matrix))

# Varianz
print(np.var(matrix))

5.0
2.581988897471611
6.666666666666667


#### Berechnung von Zufallswerten

Wir wollen immer die gleiche pseudozufällige Folge an Werten erhalten, woraufhin wir den Zufallsgenerator "seeden".
Die mehrfache Ausführung der Zelle gibt somit die immer gleichen Elemente zurück, was ohne `np.random.seed(1)` nicht der Fall wäre. 

Versucht es gerne aus!!

In [0]:
# Generator seeden um reproduzierbare Ausgaben zu erhalten
 np.random.seed(1)

# Generiert 3 zufällige Integer zwischen 0 und 10
print(np.random.randint(0,11,3))

# Generiert eine zufällige 2x2 Matrix
# Die Werte der Matrix sind floats einer Normalverteilung mit Mittelwert 0 und Varianz 1
print(np.random.randn(2, 2))

# Generiert 5 zufällige Gleitkommazahlen in dem Inertvall 0-1 (exklusive der 1)
# numpy.random.random(5)

# 3 Zahlen aus einer Normalverteilung mit Mittelwert 1 und Varianz 2
print(np.random.normal(1.0, 2.0, 3))

[5 8 9]
[[-0.80217284 -0.44887781]
 [-1.10593508 -1.65451545]]
[-3.72693721  3.2706907  -1.03402827]


#### Datentyp ändern

In [0]:
matrix = np.array([[1,2,3],[4,5,6],[7,8,9]])

# Ändert Datentyp der Elemente zu floats
print(matrix.astype(float))

[[1. 2. 3.]
 [4. 5. 6.]
 [7. 8. 9.]]


#### Arrays verketten

Mittels der `append()` Funktion lassen sich Vektoren mit einander verketten. Sollten die Arrays von einem unterschiedlichen Datentyp sein, werden die Werte in den größeren Datentyp konvertiert (z.B. int -> float -> strings)

In [0]:
vector1 = np.array([1,2,3])
vector2 = np.array([4,5,6])

# Vektoren verketten
print(np.append(vector1, vector2))

# Alternativ concatenate
# np.concatenate((vector1, vector2))

[list([4, 5, 6]) 2 3 1 2 3 4 5 6]


#### Finden von Minimum und Maximum

Die Funktionen `min()` und `max()` sind in ihrer Bezeichnung recht eindeutig, wohingegen `argmax()` bzw `argmin()` für die Indizes dieser Elemente steht.

Durch die Angabe einer Achse werden die entsprechenden Elemente entlang dieser Achse beschrieben (mit 0 werden die maximalen Elemente in den Spalten und mit 1 die maximalen Elemente in den Reihen angegeben).

In [0]:
matrix = np.array([[1,4,3],[34,7,6],[27,18,9]])
print(matrix)

# Maximales Element
print(f"\nMax: {np.max(matrix)}")

# Minimales Element
print(f"Min: {np.min(matrix)}")

# Die Indizes der maximalen Elemente entlang einer Achse
print(f"Indizes der maximalen Elemente aus Achse 0: {np.argmax(matrix, axis=0)}")

# Das maximale Element entlang einer Achse zurückgeben
print(f"Maximale Elemente der Achse 0: {np.max(matrix,axis=0)}")

[[ 1  4  3]
 [34  7  6]
 [27 18  9]]

Max: 34
Min: 34
Indizes der maximalen Elemente aus Achse 0: [1 2 2]
Maximale Elemente der Achse 0: [34 18  9]


#### Matrixdiagonale, Spur

Auch auf diese Funktionalitäten wollten wir nicht weiter eingehen, da sie für unsere Zwecke keine große Bedeutung haben. Sie sind hier eher der vollständigkeitshalber mit aufgeführt. 

In [0]:
matrix = np.array([[1,4,3],[34,7,6],[27,18,9]])
print(matrix)

# Hauptdiagonale
print(f"\nHauptdiagonale: {matrix.diagonal()}")

# Diagonale direkt über der Hauptdiagonalen
print(f"Diagonale über der Hauptdiagonalen: {matrix.diagonal(offset=1)}")

# Spur der Matrix (Summe der Elemente der Hauptdiagonalen)
print(f"Spur: {matrix.trace()}")

[[ 1  4  3]
 [34  7  6]
 [27 18  9]]

Hauptdiagonale: [1 7 9]
Diagonale über der Hauptdiagonalen: [4 6]
Spur: 17
