# Python Grundlagen 7
## Numpy - Einführung
***
In diesem Notebook wird behandelt:
- die array-Klasse
- Erstellen, Indizieren und Bearbeiten
***

## Einführung

`numpy` (für *Numerical Python*) ist eine fortgeschrittene Programmbibliothek zur Verarbeitung großer mehrdimensionaler Arrays und mathematischer Routinen höherer Ordnung (lineare Algebra, Statistik, komplexe mathematische Funktionen, etc.). <br>

Die Objektklasse, mit der wir hauptsächlich arbeiten werden, ist die **`array`**-Klasse von `numpy`. <br>

Diese Arrays entsprechen N-dimensionalen Matrizen, die verschiedene Daten wie Tabellendaten, Zeitreihen oder Bilder enthalten können. <br>

Der Vorteil des `numpy`-Moduls liegt in seiner Fähigkeit, Array-Operationen sehr effizient auszuführen. Das bedeutet, dass sowohl die benötigte **Codelänge** als auch die **Rechenzeit** für diese Operationen im Vergleich zur konventionellen `Python`-Syntax deutlich minimiert werden.

## 1 Erstellen eines `numpy`-Arrays

Anders als bei üblichen Klassen, kann ein `numpy`-Array mit vielen verschiedenen Konstruktoren erstellt werden. <br>

Das Argument dieser Konstruktoren ist normalerweise ein **`tuple`**, das die gewünschten Matrix-Dimensionen enthält. Dieses Tuple wird als **Shape** (Form) eines Arrays bezeichnet:

```python
# Import des numpy-Moduls unter dem Alias 'np'
import numpy as np

# Erstellen einer 5x10 Matrix gefüllt mit Nullen
X = np.zeros(shape = (5, 10))

# Erstellen einer 3-dimensionalen 3x10x10 Matrix gefüllt mit Einsen
X = np.ones(shape = (3, 10, 10))
```

Es ist auch möglich, ein Array aus einer **Liste** mit dem `np.array`-Konstruktor zu erstellen:

```python
# Erstellen eines Arrays aus einer Liste durch List Comprehension
X = np.array([2*i for i in range(10)]) # 0, 2, 4, 6, ..., 18

# Erstellen eines Arrays aus einer Liste von Listen
X = np.array([[1, 3, 3],
              [3, 3, 1],
              [1, 2, 0]])
```

Diese drei Konstruktoren sind nur Beispiele. Wir werden später noch weitere Konstruktoren kennenlernen.

## 2 Indizierung eines `numpy`-Arrays

Anders als bei Listen ist ein `numpy`-Array mehrdimensional. Die Indizierung muss durch Eingabe des gewünschten Index **in jeder Dimension** erfolgen:

```python
# Erstellen einer 10x10 Matrix gefüllt mit Einsen
X = np.ones(shape = (10, 10))

# Anzeigen des Elements am Index (4, 3)
print(X[4, 3])

# Zuweisen des Wertes -1 zum Element mit Index (1, 5)
X[1, 5] = -1
```

Wie bei allen anderen indizierbaren Python-Objekten beginnt der Index einer Achse bei 0. <br>

<img src="../imgs/indexation_array_en.png" style = 'height:350px'> <br>

Wie bei Listen ist es möglich, ein Array mittels **Slicing** zu indizieren. <br>

<img src="../imgs/indexation_array_slicing_en.png" style = 'height:350px'>

Es ist möglich, in **jeder Dimension** eines Arrays zu slicen. Im folgenden Beispiel werden wir ein **Subarray** aus `X` mittels Slicing extrahieren. <br>

<img src="../imgs/indexation_array_slicing2_en.png" style = 'height:350px'>

Die vorherigen Beispiele zeigen die Indizierung eines 2-dimensionalen Arrays, aber diese Art der Indizierung kann auf N-dimensionale Arrays verallgemeinert werden. Es ist auch möglich, die **negative Indizierung** wie bei Listen zu verwenden.

#### 2.1 Aufgaben:
> (a) Erstelle und zeige folgende diagonale Blockmatrix mit Hilfe von Konstruktoren und Array-Slicing:
> 
>$$
\begin{pmatrix}
1 & 1 & 1 & 0 & 0 & 0 \\
1 & 1 & 1 & 0 & 0 & 0 \\
1 & 1 & 1 & 0 & 0 & 0 \\
0 & 0 & 0 & -1 & -1 & -1 \\
0 & 0 & 0 & -1 & -1 & -1 \\
0 & 0 & 0 & -1 & -1 & -1 \\
\end{pmatrix}
$$ 


In [1]:
import numpy as np
# Deine Lösung:





#### Lösung:

In [None]:
# Erstellen einer 6x6 Matrix gefüllt mit 0
X = np.zeros(shape = (6, 6))

# Zuweisen der Werte 1 für das obere linke Viertel
X[:3, :3] = 1

# Zuweisen der Werte -1 für das untere rechte Viertel
X[3:, 3:] = -1

# Displaying the matrix
print(X)

#### 
> (b) Erstelle und zeige folgende Matrix mit Hilfe von Array-Konstruktoren und Slicing:
>  
>$$
\begin{pmatrix}
0 & 1 & 2 & 3 & 4 & 5 \\
0 & 1 & 2 & 3 & 4 & 5 \\
0 & 1 & 2 & 3 & 4 & 5 \\
0 & 1 & 2 & 3 & 4 & 5 \\
0 & 1 & 2 & 3 & 4 & 5 \\
0 & 1 & 2 & 3 & 4 & 5 \\
\end{pmatrix}
$$ <br>
> Du kannst entweder jede Zeile einer Matrix aus Nullen mit `np.array([0, 1, 2, 3, 4, 5])` ersetzen oder jeder Spalte ihren Index zuweisen.

In [1]:
# Deine Lösung:





#### Lösung:

In [None]:
# Erste Lösung:
X = np.zeros(shape = (6, 6))

# Wir ersetzen jede Reiche mit: 'np.array([0, 1, 2, 3, 4, 5])' 
for i in range (6):
    X[i ,:] = np.array ([0, 1, 2, 3, 4, 5])

# Ausgabe:
print("Erste Lösung")
print(X)
print("\n")

# Zweite Lösung
Y = np.zeros(shape = (6, 6))

# Jeder Spalte von x wird ihr Index zugewiesen:
for i in range(6):
    Y[:, i] = i
    
# Ausgabe
print("Zweite Lösung")
print(Y)

## 3 Operationen auf Numpy-Arrays

 Meistens wirst du `numpy`-Arrays mit realen Daten verarbeiten. <br>

 Der Wert des `numpy`-Moduls liegt in seinem optimierten **Code**, der schnelle Berechnungen auf großen Matrizen ermöglicht. <br>

 Das `numpy`-Modul enthält grundlegende mathematische Funktionen wie:

 | Funktion                    | Numpy-Funktion              |
 |:---------------------------:|:---------------------------:|
 | $e^x$                       | `np.exp(x)`                 |
 | $\mathrm{log}(x)$           | `np.log(x)`                 |
 | $\mathrm{sin}(x)$           | `np.sin(x)`                 |
 | $\mathrm{cos}(x)$           | `np.cos(x)`                 |
 | Runden auf **`n`** Dezimalstellen| `np.round(x, decimals = n)` |

 Die vollständige Liste der mathematischen Operationen für `numpy` findest du [hier](https://numpy.org/doc/stable/reference/routines.math.html). <br>

 Diese Funktionen können auf alle `numpy`-Arrays angewendet werden, unabhängig von ihren Dimensionen:

 ```python
 X = np.array([i/100 for i in range(100)]) # 0, 0.01, 0.02, 0.03, ..., 0.98, 0.99

 # Berechne die Exponentialfunktion von x für x = 0, 0.01, 0.02, 0.03, ..., 0.98, 0.99
 exp_X = np.exp(X)
 ```

In der nächsten Zelle werden wir das Array erstellen:

$$
X =
\begin{pmatrix}
0.01 & 0.02 & ... & 0.98 & 0.99
\end{pmatrix}
$$

#### 3.1 Aufgaben:
> (a) Definiere eine Funktion `f`, die ein Array `X` nimmt und **in einer einzigen Codezeile** die folgende Funktion berechnet: <br>
>
> $$ f(x) = \mathrm{exp}(\mathrm{sin}(x) + \mathrm{cos}(x)) $$ <br>
>
> (b) Zeige die **ersten 10** Elemente des Ergebnisses **gerundet auf 2 Dezimalstellen** der Funktion `f` angewendet auf das Array `X`.

In [None]:
# Deine Lösung:





#### Lösung:

In [None]:
X = np.array([i/100 for i in range(100)])

# Definition der Funktion f
def f(X):
    return np.exp(np.sin(X) + np.cos(X))

# Berechnen von f(X)
result = f(X)

# Wir runden das Ergebnis auf 2 dezimalstellen
rounded = np.round(result, decimals = 2)

# und geben die ersten 10 Stellen des Ergebnis aus:
print(rounded[: 10])

#### 
> (c) Definiere eine Funktion namens `f_python`, die die gleiche Operation auf jedes Element von X mit einer `for`-Schleife ausführt. <br>
> 
> Die Dimensionen eines Arrays `X` können mit dem **`shape`**-Attribut von `X` abgerufen werden, welches ein **Tuple** ist: `shape = X.shape`. <br>
>
> Für ein Array mit **einer** Dimension entspricht die Anzahl der enthaltenen Elemente dem **ersten** Element seiner Form: `n = X.shape[0]`. <br>

In [None]:
# Deine Lösung:





#### Lösung:

In [None]:
def f_python(X):
    n = X.shape[0]
    for i in range(n):
        X[i] = np.exp(np.sin(X[i]) + np.cos(X[i]))
    return X

#### 
> Wir werden nun die Ausführungszeiten dieser beiden Funktionen vergleichen, die auf ein sehr großes Array mit 10 Millionen Werten angewendet werden. <br>
>
> Wir werden diese Ausführungszeiten mit dem `time`-Modul messen. Um die Ausführungszeit einer Funktion zu messen, nimm einfach die **Differenz** zwischen **der Startzeit der Ausführung** und **der Endzeit**. Wir gehen davon aus, dass die Zuweisung einer Variable sofort erfolgt. <br>
>
> (d) Führe die nächste Zelle aus, um die Ausführungszeiten zu vergleichen. Diese Zelle könnte einige Zeit zum Ausführen benötigen.

In [None]:
from time import time

# Wir erstellen ein Array mit 1000000 Werten
X = np.array([i/1e7 for i in range(int(1e7))])

time_start = time()
f(X)
time_end = time()

runtime = time_end - time_start

print ("Die Berechnung mit numpy dauert:", runtime, "Sekunden")

time_start = time()
f_python(X)
time_end = time()

runtime = time_end - time_start

print ("Die Berechnung mit einem loop dauert:", runtime, "Sekunden")

Wie du siehst dauert die Berechnung mit einem ```Loop``` Im Vergleich zur Berechnung mit ```numpy```. <br>
Besonders bei Berechnungen mit großen Datensätzen oder statistischen Berechnungen ist das oft von Vorteil, wie wir in kommenden Aufgaben sehen werden.