# Arrays umformen

Manchmal ist das Problem bei erhobenen Daten nicht, dass sie durch ein Schichtsystem in kleineren Matrixen oder Vektoren aufgeteilt sind, sondern dass sie in einem ungünstigen Format abgespeichert wurden. Um die NextBike Daten, die der Lehrstuhl für wissenschatliches Rechnen erhoben hat, gegenzuprügen, hat der Lehrstuhl für stochastische Numerik unabhängig von diesem ebenfalls die NextBike Ausleihen gezählt. Sie haben die Zahlen allerdings anders vermerkt. Es gab einen Zettel, der bei Schichtende an die nächste Person weitergegeben wurde. Auf diesem Zettel wurden alle Zahlen nebeneinander notiert. Das heißt die Daten haben nicht die Form 

$$
    \begin{pmatrix} 
         & \text{Mo} & \text{Di} & \text{Mi} & \text{Do} & \text{Fr} & \text{Sa} & \text{So}\\
        \text{Vormittag} & 32 & 47 & 42 & 42 & 22 & 21 & 14\\
        \text{Nachmittag} & 50 & 36 & 18 & 39 & 50 & 37 & 76\\
    \end{pmatrix}
$$

sondern

$$
    \begin{pmatrix} 
        32 & 47 & 42 & 42 & 22 & 21 & 14 & 50 & 36 & 18 & 39 & 50 & 37 & 76\\
    \end{pmatrix}.
$$

Unser Ziel in diesem Kapitel ist es, auch diese erhobenen Daten in unsere übersichtliche Matrixform zu bringen. 

Um dies zu erreichen, können wir uns die in `numpy` existierende Funktion `reshape` zu Nutze machen. Hängt man an eine Matrix oder einen Vektor den Befehl `.reshape(m,n)` an, wird diese in eine $(m \times n)$ Matrix umgeformt. 

```{figure} img/reshape_standard.png
:width: 60%
Vertikales und horizontales Zusammenfügen
<p style="font-size: 80%; text-align: center; margin-top: 0; padding-top: 0;">
<strong>Quelle:</strong> <a href="https://medium.com/towards-data-science/reshaping-numpy-arrays-in-python-a-step-by-step-pictorial-tutorial-aed5f471cf0b">Medium</a>
</p>
```

In [None]:
import numpy as np
a1 = np.arange(1,13)
a1_3x4_matrix = a1.reshape(3,4)
print(a1_3x4_matrix)

:::{admonition} Aufgabe 1.1
Erstellen Sie die Matrix `W1` 

$$
    \begin{pmatrix} 
         & \text{Mo} & \text{Di} & \text{Mi} & \text{Do} & \text{Fr} & \text{Sa} & \text{So}\\
        \text{Vormittag} & 32 & 47 & 42 & 42 & 22 & 21 & 14\\
        \text{Nachmittag} & 50 & 36 & 18 & 39 & 50 & 37 & 76\\
    \end{pmatrix}
$$

mit Hilfe der erhobenen Daten `rohdaten` in Vektorform.
:::

In [None]:
rohdaten = np.array([[32, 47, 42, 42, 22, 21, 14, 50, 36, 18, 39, 50, 37, 76]])
# Ihr Code 

:::{admonition} Hinweis
:class: note dropdown

Nutzen Die den Befehl `.reshape` und achten Sie auf die richtige Anzahl an Spalten und Zeilen. 
:::

:::{admonition} Lösung
:class: tip dropdown

``` python
W1 = rohdaten.reshape(2,7)
W1 = np.hstack((np.array([[""],["Vormittag"],["Nachmittag"]]), np.vstack((np.array([["Mo","Di","Mi","Do","Fr","Sa","So"]]), W1))))
print(W1)
```
:::

Die Funktion `reshape` bietet ebenfalls die Möglichkeit nur eine Dimension vorzugeben. Der Ausdruck `.reshape(-1,n)` formt eine Matrix oder einen Vektor in eine $(x \times n)$ Matrix um, wobei $x$ so gewählt wird, dass die die Anzahl der Einträge vor und nach der Umformung übereinstimmen. Analog funktioniert der Befehl `.reshape(m,-1)`, der eine $(m \times x)$ Matrix erzeugt. 


```{figure} img/reshape_one_input.png
:name: fig-meinbild
:width: 60%
Vertikales und horizontales Zusammenfügen
<p style="font-size: 80%; text-align: center; margin-top: 0; padding-top: 0;">
<strong>Quelle:</strong> <a href="https://medium.com/towards-data-science/reshaping-numpy-arrays-in-python-a-step-by-step-pictorial-tutorial-aed5f471cf0b">Medium</a>
</p>
```

In [None]:
a1_3x4_matrix_spalten = a1.reshape(-1,4)
a1_3x4_matrix_zeilen = a1.reshape(3,-1)
print(a1_3x4_matrix_spalten)
print(a1_3x4_matrix_zeilen)

:::{admonition} Aufgabe 1.2
Erstellen Sie erneut die Matrix `W1` mit Hilfe der erhobenen Daten `rohdaten` in Vektorform, indem Sie nur eine Dimension vorgeben
:::
:::

In [None]:
# Ihr Code 

:::{admonition} Hinweis
:class: note dropdown

Nutzen Die den Befehl `.reshape` und achten Sie auf die richtige Anzahl an Spalten oder Zeilen. 
:::

:::{admonition} Lösung
:class: tip dropdown

``` python
W1 = rohdaten.reshape(-1,7)
# Alternativ: W1 = rohdaten.reshape(2,-1)
W1 = np.hstack((np.array([[""],["Vormittag"],["Nachmittag"]]), np.vstack((np.array([["Mo","Di","Mi","Do","Fr","Sa","So"]]), W1))))
print(W1)
```
:::

Mit dem `.ravel()` Befehl kann man eine beliebige Matrix wieder in einen Vektor umformen. 

```{figure} img/reshape_ravel.png
:width: 60%
Vertikales und horizontales Zusammenfügen
<p style="font-size: 80%; text-align: center; margin-top: 0; padding-top: 0;">
<strong>Quelle:</strong> <a href="https://medium.com/towards-data-science/reshaping-numpy-arrays-in-python-a-step-by-step-pictorial-tutorial-aed5f471cf0b">Medium</a>
</p>
```

In [None]:
a1_kopie = a1_3x4_matrix.ravel()
print(a1_kopie)

:::{admonition} Aufgabe 1.3
Extrahieren Sie aus der Matrix `W1` wieder die Rohdaten 

$$
    \begin{pmatrix} 
        32 & 47 & 42 & 42 & 22 & 21 & 14 & 50 & 36 & 18 & 39 & 50 & 37 & 76\\
    \end{pmatrix}.
$$
unter dem Namen `rohdaten_kopie`.
:::

In [None]:
# Ihr Code 

:::{admonition} Hinweis
:class: note dropdown

Verwenden Sie `ravel.()`. Achten Sie darauf nur die relevanten Einträge aus `W1` zu verwenden. 
:::

:::{admonition} Lösung
:class: tip dropdown

``` python
rohdaten_kopie = W1[1:,1:].ravel()
print(rohdaten_kopie)
```
:::

Sie haben vielleicht bemerkt, dass jeder Eintrag als `string` gespeichert ist. Dies wurde von `numpy` automatisch gemacht, als wir eine Zeile/Spalte mit `strings` hinzugefügt haben. Um dies rückgängig zu machen, kann der Befehl `.astype(int)` angehängt werden. So werden alle Einträge wieder in ganze Zahlen umgewandelt. 

:::{admonition} Aufgabe 1.4
Wandels Sie `rohdaten_kopie` in einen Vektor mit ganzzahligen Einträgen um. 
:::

In [None]:
# Ihr Code 

:::{admonition} Hinweis
:class: note dropdown

Verwenden Sie `.astype(int)`.
:::

:::{admonition} Lösung
:class: tip dropdown

``` python
rohdaten_kopie = rohdaten_kopie.astype(int)
print(rohdaten_kopie)
```
:::

Bisher haben wir die Matrizen immer Zeilenweise gefüllt. Das heißt, die erste Zeile besteht aus den ersten Einträgen des Vektors, die Zweite aus den Einträgen danach usw.. Natürlich kann man eine Matrix auch Spaltenweise füllen. Dazu muss `reshape` die zusätzliche Eingabe `order = 'F'` hinzugefügt werden. 

```{figure} img/reshape_order.png
:width: 60%
Vertikales und horizontales Zusammenfügen
<p style="font-size: 80%; text-align: center; margin-top: 0; padding-top: 0;">
<strong>Quelle:</strong> <a href="https://medium.com/towards-data-science/reshaping-numpy-arrays-in-python-a-step-by-step-pictorial-tutorial-aed5f471cf0b">Medium</a>
</p>
```

In [None]:
a1_3x4_matrix_columnwise = a1.reshape(3,4,order='F')
print(a1_3x4_matrix_columnwise)

:::{admonition} Achtung
:class: warning

`reshape` kann lediglich verwendet werden, um Matrizen ineinander umzuformen, wenn sie die gleiche Anzahl an Einträgen haben. Das heißt eine $(p \times q)$ Matrix kann nur in eine $(m \times n)$ Matrix umgeformt werden, wenn $p \cdot q = m \cdot n$ erfüllt ist. 
:::

:::{admonition} Aufgabe 1.5

Versuchen Sie `a1` in eine $(5 \times 2)$ Matrix umzuformen. Was beobachten Sie?
:::

In [None]:
# Ihr Code 