# Praktikumsvorbereitung - Python und Numpy

In der Sprache Python werden Sie im Praktikum programmieren und werden dabei häufig auf die Bibliothek Numpy zurückgreifen. Es gibt vier Numpy-Themen, die Ihre Vorgänger in diesem Kurs zu Beginn meist als anspruchsvoll empfunden haben. Es handelt sich um 

1. Reshaping
2. Broadcasting
3. Advanced Indexing und
4. Vektor-/Matrizen-Multiplikation.

Aufgabe dieser Übung ist es, Sie gezielt auf diese Aspekte der Bibliothek Numpy hinzuweisen, etwaige Wissenslücken bei Ihnen aufzudecken und Ihnen den Start in diesen Kurs deutlich zu vereinfachen. 

**Wenn Sie Python noch nicht kennen sollten:**

Fokussieren Sie sich auf **Datentypen** (Lists, Dictionaries, Tuples) und **Kontrollstrukturen** (For-Schleifen) sowie auf **List-Comprehensions**:

1. Absolvieren Sie bitte den kostenlosen Kurs [Introduction to Python](https://www.datacamp.com/courses/intro-to-python-for-data-science) der Lernplattform Datacamp. Dieser Kurs dauert etwa 4 Stunden und führt Sie an die wichtigsten Grundkonzepte von Python und Numpy heran.

   - Wenn Sie Bücher statt interaktive Kurse bevorzugen, empfehle ich Ihnen das Buch "Schnellstart Python", welches Sie im Netz der FH Aachen [als PDF herunterladen](https://link.springer.com/book/10.1007%2F978-3-658-26133-7) können.

2. Schauen Sie in die "Lerngruppe Python", die im ILIAS-Kurs dieser Veranstaltung verlinkt ist und wo ich Ihnen weitere Lernressourcen aufliste. Ich lade Sie herzlich ein, weitere dort genannte Kurse zu belegen.

3. Fahren Sie anschließend mit den eigentlichen Aufgaben dieser Übung weiter unten fort.

**Wenn Sie Python schon kennen:**

- Fahren Sie direkt mit den eigentlichen Aufgaben dieser Übung weiter unten fort.


## Überblick

Numpy ist eine Python-Bibliothek, die eine effiziente Ausführung von mathematischen Operationen erlaubt. Sie werden im weiteren Verlauf der Veranstaltung Numpy dafür einsetzen, um Matrix-Vektor-Operationen, die Sie z.B. aus der linearen Algebra kennen, umzusetzen.

Die folgenden Übungsaufgaben werden Sie gezielt mit genau den Themen vertraut machen, die Ihren Vorgängerinnen und Vorgängern als Herausforderung empfunden haben: Reshaping, Broadcasting, Advanced Indexing und Vektor-/Matrizen-Multiplikation.

## 1 Shapes und Co.

Das Verständnis von *Shapes* solcher Arrays ist eine wichtige Voraussetzung für eine produktive Arbeit mit diesen Datenstrukturen.

Lesen Sie [diesen Buchabschnitt](https://jakevdp.github.io/PythonDataScienceHandbook/02.02-the-basics-of-numpy-arrays.html) durch, um mit wichtigen Eigenschaften von Numpy Arrays vertraut zu werden. Bearbeiten Sie dann die nachfolgenden Aufgaben.

**Ihre Aufgaben**

(1) Betrachten Sie den untenstehenden Code. Beantworten Sie: Welchen [Shape](https://docs.scipy.org/doc/numpy/reference/generated/numpy.ndarray.shape.html) hat das Numpy Array `a`? (Dies ist wichtig: Sie werden mit dem Shape-Befehl oft arbeiten.)

In [1]:
import numpy as np
a = np.array([5, 10, 15, 20])

In [2]:
print("Das Array `a` hat den Shape", a.shape)

Das Array `a` hat den Shape (4,)


(2) Lässt sich das Array `a` als (mathematischen) Vektor interpretieren? Wenn `a` ein Vektor ist, können Sie ihn [transponieren](https://docs.scipy.org/doc/numpy/reference/generated/numpy.ndarray.T.html)?

In [3]:
print(a.reshape(1,4).T)

[[ 5]
 [10]
 [15]
 [20]]


Das Array lässt sich transponieren, wenn man es um eine Dimension erweitert.

**Hinweis ([rot13](http://www.rot13.de)-kodiert):** Fvr xöaara qnf Neenl n avpug genafcbavrera, jrvy rf ahe rvar Qvzrafvba orfvgmg: Rf ung qra Funcr (4,). Vuz sruyg rvar mjrvgr Qvzrafvba, hz nyf Fcnygra- omj. Mrvyrairxgbe vagrecergvreg jreqra mh xöaara. Cebovrera Fvr rf nhf: n.G.funcr vfg qnffryor jvr n.funcr.

(3) Betrachten Sie das unten stehende Array `b`. Erzeugen Sie aus `b` bitte zwei neue Arrays `c` und `d`: `c` soll ein Spaltenvektor sein, und `d` soll ein Zeilenvektor sein. Wie gehen Sie vor?

In [4]:
b = np.array([2, 4, 6, 8, 10])

In [5]:
print(b)
c = b.reshape(5, 1)
d = b.reshape(1, 5)
print("c =", c, "\nd =", d)
print("\nOder mit newaxis:")
print(b[:, np.newaxis], "und", b[np.newaxis, :])

[ 2  4  6  8 10]
c = [[ 2]
 [ 4]
 [ 6]
 [ 8]
 [10]] 
d = [[ 2  4  6  8 10]]

Oder mit newaxis:
[[ 2]
 [ 4]
 [ 6]
 [ 8]
 [10]] und [[ 2  4  6  8 10]]


**Hinweis (rot13-kodiert):** Rf tvog irefpuvrqrar Jrtr, hz qvrf mh reervpura. Rva ordhrzre Jrt vfg qvr Neorvg zvg ac.arjnkvf. Qnmh svaqra Fvr hagre sbytraqrz Yvax zrue: uggcf://qbpf.fpvcl.bet/qbp/ahzcl/ersrerapr/pbafgnagf.ugzy#ahzcl.arjnkvf

Lässt sich `c` bzw. `d` transponieren? Warum?

In [6]:
print("c.T = ", c.T, "\nd.T = ", d.T)
print(b.ndim)

c.T =  [[ 2  4  6  8 10]] 
d.T =  [[ 2]
 [ 4]
 [ 6]
 [ 8]
 [10]]
1


`c` und `d` lassen sich transponieren, weil sie nun zweidimensional sind.

(4) Betrachten Sie die dritte Zeile des unten stehenden Codes: Hat sich durch die Zeile `k[0, 1] = 10` das Array `m` geändert? Falls ja, warum? Falls nein, warum hat es sich nicht geändert?

In [7]:
k = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
print("k =", k)
m = k[:2, 1:3]
print("m =", m)
k[0, 1] = 10
print("m =", m)

k = [[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
m = [[2 3]
 [6 7]]
m = [[10  3]
 [ 6  7]]


Das Array `m` hat sich geändert, weil Array Slices _views_, also Referenzen auf die eigentlichen Daten zurückliefern.

**Antwort (rot-13 kodiert):** Wn, qnf Neenl z ung fvpu träaqreg: z vfg ahe rva "Ivrj" nhs rvara Orervpu qrf Neenlf x. Rvar Äaqrehat iba x ireäaqreg qnzvg nhpu z. Ivrjf jreqra qhepu "Onfvp Fyvpvat" remrhtg. Fvr xöaara qvrf rvazny xbagebyyvrera, vaqrz Fvr zvg `cevag(z)` ibe qre qevggra Mrvyr haq anpu qre qevggra Mrvyr qra Vaunyg iba z nhftrora.

(5) Betrachten Sie die dritte Zeile des unten stehenden Codes: Hat sich durch die Änderung des Arrays `p` der Inhalt von `q` geändert? Falls ja, warum? Falls nein, warum hat es sich nicht geändert?

In [8]:
p = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
q = p[[1, 2], 0]
print(q)
p[1, 0] = 25
print(q)

[5 9]
[5 9]


Der Inhalt von `q` hat sich nicht geändert, da _Advanced indexing_ immer eine Kopie zurückliefert.

**Antwort (rot-13 kodiert):** Arva, qre Vaunyg iba d äaqreg fvpu qnqhepu avpug. Orv Nqinaprq Vaqrkvat jreqra vzzre Xbcvra qre Neenlf remrhtg. Yrqvtyvpu orvz Onfvp Vaqrkvat, qnf fvr va rvarz qre ibenatrtnatrara Pbqrorvfcvryr xraaratryreag unggra, jreqra yrqvtyvpu "Ivrjf" haq xrvar Xbcvra remrhtg.

## 2 Broadcasting - Teil 1

Broadcasting ist eine der häufigsten Fehlerquellen, die Sie nur verstehen können, wenn Sie sich mit den sogenannten Broadcasting-Regeln von Numpy beschäftigt haben. Diese Regeln legen fest, wie Numpy Arrays miteinander verrechnet werden können - und diese Regeln unterscheiden sich in Teilen von den Rechenregeln, die Sie aus der linearen Algebra kennen.

- Lesen Sie jetzt [diesen Buchabschnitt](https://jakevdp.github.io/PythonDataScienceHandbook/02.05-computation-on-arrays-broadcasting.html) und verstehen Sie die drei Broadcasting-Regeln.

Unten sehen Sie eine Operation mit zwei Numpy Arrays `a` und `b`.

**Ihre Aufgaben**

(1) Betrachten Sie die unten stehende Code-Zelle. Welchen Shape (Anzahl Zeilen, Anzahl Spalten) wird das Numpy Array `c` erhalten? 

  * Tragen Sie ihre Voraussage in die Variable `shape` ein. 
  * Begründen Sie Ihre Vorhersage mit den drei Broadcasting Regeln aus dem Buch.
  * Berechnen Sie auf Papier das zu erwartende Ergebnis. Tragen Sie es als Numpy Array in die Variable `ergebnis` ein.
  * Führen Sie dann jeweils die Zelle aus, um zu schauen, ob Sie richtig lagen.

In [9]:
import numpy as np

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

c = a + b

# Ihre Vorhersagen
shape = (3,) 
ergebnis = np.array([5, 7, 9])

print('{}\n'.format('Shape korrekt.' if np.all(shape==c.shape) else 'Shape nicht korrekt.'))
print('{}\n'.format('Ergebnis korrekt.' if np.array_equal(ergebnis, c) else 'Ergebnis nicht korrekt.'))

Shape korrekt.

Ergebnis korrekt.



"Binary operations are performed on an element-by-element basis."

(2) Betrachten Sie die unten stehende Code-Zelle. Welchen Shape (Anzahl Zeilen, Anzahl Spalten) wird das Numpy Array `c` erhalten? 

  * Tragen Sie ihre Voraussage in die Variable `shape` ein. 
  * Begründen Sie Ihre Vorhersage mit den drei Broadcasting Regeln aus dem Buch.
  * Berechnen Sie auf Papier das zu erwartende Ergebnis. Tragen Sie es als Numpy Array in die Variable `ergebnis` ein.
  * Führen Sie dann jeweils die Zelle aus, um zu schauen, ob Sie richtig lagen.

In [10]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])[:, np.newaxis]

c = a + b

shape = (3,3) # Ihre Vorhersage
ergebnis = np.array([[5, 6, 7],
                     [6, 7, 8],
                     [7, 8, 9]
                    ])

print('{}\n'.format('Shape Korrekt.' if np.all(shape==c.shape) else 'Shape nicht korrekt.'))
print('{}\n'.format('Ergebnis korrekt.' if np.array_equal(ergebnis, c) else 'Ergebnis nicht korrekt.'))

print("Da a die Dimension", a.ndim, "hat, füllen wir nach Regel 1 mit Einsen von links auf, sodass wir von der Shape", a.shape, "zu (1, 3) kommen.")
print("Nun dehnen wir nach Regel 2 an jeder Stelle der Shape, wo die Dimensionen unterschiedlich sind, die Dimension von 1 zu der höheren, also hier", 
      "bei a zu (3, 3) und bei b von", b.shape, "zu (3,3).")

Shape Korrekt.

Ergebnis korrekt.

Da a die Dimension 1 hat, füllen wir nach Regel 1 mit Einsen von links auf, sodass wir von der Shape (3,) zu (1, 3) kommen.
Nun dehnen wir nach Regel 2 an jeder Stelle der Shape, wo die Dimensionen unterschiedlich sind, die Dimension von 1 zu der höheren, also hier bei a zu (3, 3) und bei b von (3, 1) zu (3,3).


(3) Betrachten Sie die unten stehende Code-Zelle. Welchen Shape (Anzahl Zeilen, Anzahl Spalten) wird das Numpy Array `c` erhalten? 

  * Tragen Sie ihre Voraussage in die Variable `shape` ein. 
  * Begründen Sie Ihre Vorhersage mit den drei Broadcasting Regeln aus dem Buch.
  * Berechnen Sie auf Papier das zu erwartende Ergebnis. Tragen Sie es als Numpy Array in die Variable `ergebnis` ein.
  * Führen Sie dann jeweils die Zelle aus, um zu schauen, ob Sie richtig lagen.

In [11]:
a = np.array([[1, 0, 0], [0, 0, 2]])
b = np.ones(12).reshape((4, 1, 3))

c = a * b

shape = (4, 2, 3) # Ihre Vorhersage
ergebnis = np.array([
    [
        [1, 0, 0],
        [0, 0, 2]
    ],
    [
        [1, 0, 0],
        [0, 0, 2]
    ],
    [
        [1, 0, 0],
        [0, 0, 2]
    ],
    [
        [1, 0, 0],
        [0, 0, 2]
    ],
]) # Ich vermute, dass sie hierüber länger nachdenken werden. # Hahaha, ging doch ganz flott! Lol. :D

print('{}\n'.format('Shape korrekt.' if np.all(shape==c.shape) else 'Shape nicht korrekt.'))
print('{}\n'.format('Ergebnis korrekt.' if np.array_equal(ergebnis, c) else 'Ergebnis nicht korrekt.'))

print("Da a die Form", a.shape, "hat, füllen wir nach Regel 1 mit Einsen von links auf, sodass wir (1, 2, 3) erhalten.")
print("Nun vergleichen wir nach Regel 2 mit der Shape von b", b.shape, "und können vorhersagen, dass die Shape von c", c.shape, "ist.")

Shape korrekt.

Ergebnis korrekt.

Da a die Form (2, 3) hat, füllen wir nach Regel 1 mit Einsen von links auf, sodass wir (1, 2, 3) erhalten.
Nun vergleichen wir nach Regel 2 mit der Shape von b (4, 1, 3) und können vorhersagen, dass die Shape von c (4, 2, 3) ist.


## 3 Broadcasting Teil 2

Ein häufiger Vorverarbeitungsschritt, der Ihnen in verschiedenen Data Science Projekten begegnen wird, ist die Normierung von Daten. Häufig werden dabei Datensätze, z.B. Zeitreihen, auf Mittelwert $0$ und Standardabweichung $1$ normiert. Dieser Vorgang wird auch *z-scoring* (oder: *Standardisierung*) genannt:

Sei $x_i$ der $i$-te Datenpunkt einer Zeitreihe. Dann ist der z-score dieses Datenpunkts definiert als

$$\tilde{x}_i = \frac{x_i - \bar{x}}{\sigma},$$ 

wobei $\bar{x}$ den Mittelwert sowie $\sigma$ die Standardabweichung der Zeitreihe bezeichnen.

Das in der unten stehenden Code-Zelle definierte Numpy Array `X` enthält 5 Zeitreihen (Spalten) mit je 30 Einträgen (Zeilen). 

* Nutzen Sie Broadcasting sowie [np.mean](https://docs.scipy.org/doc/numpy/reference/generated/numpy.mean.html) und [np.std](https://docs.scipy.org/doc/numpy/reference/generated/numpy.std.html), um die Zeitreihen auf Mittelwert 0 und Varianz 1 zu normieren. Die transformierten Zeitreihen sollen im Numpy Array `Y` gespeichert werden. Dabei schreiben Sie nur eine Zeile Code, um die Zeitreihen zu transformieren.
* Beachten Sie das `axis` Argument bei `np.mean` und `np.std`.

In [12]:
import numpy as np

X = np.random.random((5, 2))
X.dtype = int
X %= 10
print("X =", X)
x_mean = np.mean(X, axis=0)
x_std = np.std(X, axis=0)

print("Mittelwert der Zeitreihen:\n", x_mean)
print("Standardabweichung der Zeitreihen:\n", x_std)
print("X - x_mean:\n", X - x_mean)
print("(X - x_mean) / x_std:\n", (X - x_mean)/x_std)

X = [[7 0]
 [2 0]
 [2 1]
 [0 4]
 [7 2]]
Mittelwert der Zeitreihen:
 [3.6 1.4]
Standardabweichung der Zeitreihen:
 [2.87054002 1.49666295]
X - x_mean:
 [[ 3.4 -1.4]
 [-1.6 -1.4]
 [-1.6 -0.4]
 [-3.6  2.6]
 [ 3.4  0.6]]
(X - x_mean) / x_std:
 [[ 1.18444612 -0.93541435]
 [-0.55738641 -0.93541435]
 [-0.55738641 -0.26726124]
 [-1.25411943  1.73719807]
 [ 1.18444612  0.40089186]]


In [13]:
import numpy as np
np.random.seed(0)

X = np.random.random((30, 5))
#print(X)

# Ihr Ergebnis: Y = 
Y = ((X - np.mean(X, axis=0)) / np.std(X, axis=0))

print(X)
print(Y)

[[0.5488135  0.71518937 0.60276338 0.54488318 0.4236548 ]
 [0.64589411 0.43758721 0.891773   0.96366276 0.38344152]
 [0.79172504 0.52889492 0.56804456 0.92559664 0.07103606]
 [0.0871293  0.0202184  0.83261985 0.77815675 0.87001215]
 [0.97861834 0.79915856 0.46147936 0.78052918 0.11827443]
 [0.63992102 0.14335329 0.94466892 0.52184832 0.41466194]
 [0.26455561 0.77423369 0.45615033 0.56843395 0.0187898 ]
 [0.6176355  0.61209572 0.616934   0.94374808 0.6818203 ]
 [0.3595079  0.43703195 0.6976312  0.06022547 0.66676672]
 [0.67063787 0.21038256 0.1289263  0.31542835 0.36371077]
 [0.57019677 0.43860151 0.98837384 0.10204481 0.20887676]
 [0.16130952 0.65310833 0.2532916  0.46631077 0.24442559]
 [0.15896958 0.11037514 0.65632959 0.13818295 0.19658236]
 [0.36872517 0.82099323 0.09710128 0.83794491 0.09609841]
 [0.97645947 0.4686512  0.97676109 0.60484552 0.73926358]
 [0.03918779 0.28280696 0.12019656 0.2961402  0.11872772]
 [0.31798318 0.41426299 0.0641475  0.69247212 0.56660145]
 [0.26538949 0

## 4 Advanced Indexing

Advanced Indexing, auch manchmal *fancy indexing* genannt, erlaubt Ihnen auf schnelle Art und Weise komplexe Zugriffe auf Arrays zu realisieren.

- Lesen Sie jetzt [diesen Buchabschnitt](https://jakevdp.github.io/PythonDataScienceHandbook/02.07-fancy-indexing.html) und verstehen Sie fancy indexing.

**Ihre Aufgaben**

(1) Betrachten Sie die unten stehenden Code-Zellen.
* Tragen Sie in der Variable `vorhersage` ein, welches Array Sie in Variable `y` erwarten.
* Prüfen Sie durch Ausführen des Codes, ob Ihre Vorhersage richtig war.
* Beantworten Sie die Frage: Wodurch wird der Shape des Arrays `y` bestimmt?

In [14]:
import numpy as np 

x = np.array([[1, 2], [3, 4], [5, 6]]) 
y = x[[0,1,2], [0,1,0]] 

vorhersage = np.array(
    [1, 4, 5]
) # Ihre Vorhersage

print('{}\n'.format('Ergebnis korrekt.' if np.array_equal(vorhersage, y) else 'Ergebnis nicht korrekt.'))

Ergebnis korrekt.



Die Shape von `y` wird bestimmt von den Koordinatenpaaren bei der Zuweisung. 

(2) Betrachten Sie den unten stehenden Code-Zellen.
* Tragen Sie in der Variable `vorhersage` ein, welches Array Sie in Variable `y` erwarten.
* Prüfen Sie durch Ausführen des Codes, ob Ihre Vorhersage richtig war.
* Beantworten Sie die Frage: Wodurch wird der Shape des Arrays `y` bestimmt?

In [15]:
x = np.array([[0,  1,  2], [3,  4,  5], [6,  7,  8], [9, 10, 11]]) 
   
rows = np.array([[0,0],[3,3]])
cols = np.array([[0,2],[0,2]]) 
y = x[rows,cols] 

vorhersage = np.array([
    [0, 2],
    [9, 11]
]) # Ihre Vorhersage

print('{}\n'.format('Ergebnis korrekt.' if np.array_equal(vorhersage, y) else 'Ergebnis nicht korrekt.'))

Ergebnis korrekt.



Die Shape wird durch die _broadcasted_ Shape der Indizes bestimmt.

(3) Betrachten Sie den unten stehenden Code-Zellen.
* Tragen Sie in der Variable `vorhersage` ein, welches Array Sie in Variable `y` erwarten.
* Prüfen Sie durch Ausführen des Codes, ob Ihre Vorhersage richtig war.
* Beantworten Sie die Frage: Wodurch wird der Shape des Arrays `y` bestimmt?

In [16]:
x = np.array([[0, 1, 2],
              [3, 4, 5],
              [6, 7, 8],
              [9, 10, 11]
             ]) 

y = x[1:4,[1,2]] # Kombination von Slicing und Advanced Indexing

vorhersage = np.array([
    [4, 5],
    [7, 8],
    [10, 11]
]) # Ihre Vorhersage

print('{}\n'.format('Ergebnis korrekt.' if np.array_equal(vorhersage, y) else 'Ergebnis nicht korrekt.'))

Ergebnis korrekt.



Die Shape wird durch die _broadcasted_ Shape der Indizes bestimmt.

Ich darf Ihnen gratulieren. Sie haben hiermit diesen Teil Ihrer Vorbereitungen erfolgreich beendet.

## 5 Vektor-/Matrizen-Multiplikationen

Wenn Sie Matrizen und/oder Vektoren in Numpy multiplizieren wollen, dann stehen Ihnen eine Reihe von Befehlen und Operatoren zur Verfügung. Manche dieser Befehle und Operatoren verhalten sich identisch:

- `*` verhält sich wie `np.multiply`:

  A \* B (bzw. np.multiply(A,B)) führt eine **elementweise Multiplikation** zwischen den Matrizen (oder Vektoren) A und B durch.

- `np.dot`:

   np.dot(u,v) berechnet das **Skalarprodukt** zwischen den Vektoren *u* und *v*. Wenn *u* und *v* 2-dimensionale Matrizen sind, dann wird das [Matrixprodukt](https://de.wikipedia.org/wiki/Matrizenmultiplikation) bestimmt.

- `@` verhält sich wie `np.matmul`:

  A @ B (bzw. np.matmul(A,B)) berechnet das [Matrixprodukt](https://de.wikipedia.org/wiki/Matrizenmultiplikation) zwischen den Matrizen A und B.

**Ihre Aufgaben**

(1) Führen Sie die unten stehenden Code-Zelle aus. Dort werden die beiden Matrizen A und B multipliziert. Erhalten Sie gleiche oder ungleiche Ergebnisse, wenn Sie `@` oder `np.dot` für die Multiplikation benutzen?


In [17]:
import numpy as np
A = np.array([[1,2,3], [4,5,6], [7,8,9]])
B = np.array([[2,1,3], [9,3,5], [1,4,2]])
C = A @ B
D = np.dot(A,B)

print('Matrix A:\n', A, ' shape: ', A.shape,'\n')
print('Matrix B:\n', B, ' shape: ', B.shape,'\n')
print('Matrix C:\n', C, ' shape: ', C.shape,'\n')
print('Matrix D:\n', D, ' shape: ', D.shape)

print('Die Matrizen C und D sind {}.'.format('gleich' if np.array_equal(C, D) else 'unterschiedlich'))

Matrix A:
 [[1 2 3]
 [4 5 6]
 [7 8 9]]  shape:  (3, 3) 

Matrix B:
 [[2 1 3]
 [9 3 5]
 [1 4 2]]  shape:  (3, 3) 

Matrix C:
 [[23 19 19]
 [59 43 49]
 [95 67 79]]  shape:  (3, 3) 

Matrix D:
 [[23 19 19]
 [59 43 49]
 [95 67 79]]  shape:  (3, 3)
Die Matrizen C und D sind gleich.


(2) Führen Sie nun auch die unten stehenden Code-Zelle aus. Dort werden die Matrizen K und L multipliziert. Erhalten Sie gleiche oder ungleiche Ergebnisse, wenn Sie `@` oder `np.dot` für die Multiplikation benutzen?

In [18]:
import numpy as np
K = np.full([2,2,2], 1)
L = np.full([2,2,2], 2)

X = K @ L
Y = np.dot(K,L)

print('Matrix K:\n', K, ' shape: ', K.shape, '\n')
print('Matrix L:\n', L, ' shape: ', L.shape, '\n')
print('Matrix X:\n', X, ' shape: ', X.shape,'\n')
print('Matrix Y:\n', Y, ' shape: ', Y.shape,)

print('Die Matrizen X und Y sind {}.'.format('gleich' if np.array_equal(X, Y) else 'unterschiedlich'))

Matrix K:
 [[[1 1]
  [1 1]]

 [[1 1]
  [1 1]]]  shape:  (2, 2, 2) 

Matrix L:
 [[[2 2]
  [2 2]]

 [[2 2]
  [2 2]]]  shape:  (2, 2, 2) 

Matrix X:
 [[[4 4]
  [4 4]]

 [[4 4]
  [4 4]]]  shape:  (2, 2, 2) 

Matrix Y:
 [[[[4 4]
   [4 4]]

  [[4 4]
   [4 4]]]


 [[[4 4]
   [4 4]]

  [[4 4]
   [4 4]]]]  shape:  (2, 2, 2, 2)
Die Matrizen X und Y sind unterschiedlich.


(3) Was ist der Grund dafür, dass Sie ein unterschiedliches Verhalten in Teilaufgabe (1) und (2) beobachten?

- Lesen Sie auf [dieser Webseite](https://web.archive.org/web/20230922151818/https://mkang32.github.io/python/2020/08/30/numpy-matmul.html) den Abschnitt *So.. what's with np.dot vs np.matmul (@)?*

Der Grund liegt darin, dass `np.dot` sich nur für 2 dimensionale Arrays wie die Matrixmultiplikation mit `@` verhält. Ansonsten verhält es sich so:
> For 2-D arrays it is equivalent to matrix multiplication,
> 
> for 1-D arrays to inner product of vectors (without complex conjugation)
> 
> For N dimensions it is a sum product over the last axis of a and the second-to-last of b.
> 
> If a is an N-D array and b is an M-D array (where M>=2), it is a sum product over the last axis of a and the second-to-last axis of b:
> $$dot(a, b)[i,j,k,m] = sum(a[i,j,:] * b[k,:,m])$$

(4) Wenn Sie in diesem Kurs Multiplikationen durchführen müssen, nutzen Sie immer

- `@`, wenn Sie Matrizen miteinander multiplizieren
- `np.dot`, wenn Sie ein Skalarprodukt berechnen wollen. Nutzen Sie `np.dot` **nicht** für Matrixmultiplikationen, um Fehlern vorzubeugen
- `np.multiply`, wenn Sie elementweise Multiplikationen durchführen wollen.

### Lernressourcen

Ich habe Ihnen in der ILIAS "Python Lerngruppe" viele Materialien zum Nachschlagen und Ihr Selbststudium hinterlegt. Sie finden aber natürlich auch im Netz weitere hilfreiche Tutorials:

1. Eine Fülle von Tutorials zum Erlernen von *Python* finden Sie [hier](https://wiki.python.org/moin/BeginnersGuide/Programmers). Es gibt auch eine ganze Reihe von Cheatsheets, zum Beispiel [dieses hier](https://s3.amazonaws.com/dq-blog-files/python-cheat-sheet-basic.pdf).
2. Wenn Sie Programmiererfahrung in Java, aber nicht in Python haben, dann könnten folgender [Vergleich](http://math-cs.gordon.edu/courses/cps122/handouts-2014/From%20Python%20to%20Java%20Lecture/A%20Comparison%20of%20the%20Syntax%20of%20Python%20and%20Java.pdf) sowie die Anleitung [Python for Java Programmers](http://python4java.necaiseweb.org/Main/TableOfContents) hilfreich sein.
3. Wenn Sie Programmiererfahrung in Matlab, aber nicht in Python haben, dann könnte folgende [Webseite](https://numpy.org/doc/stable/user/numpy-for-matlab-users.html) für Sie sehr hilfreich sein. Nutzen Sie daneben auch dieses [Cheatsheet](http://mathesaurus.sourceforge.net/matlab-python-xref.pdf).
4. Ein Tutorial für eine Einführung zu *numpy* finden Sie beispielsweise [hier](https://docs.scipy.org/doc/numpy/user/quickstart.html) oder [hier](https://www.pythonlikeyoumeanit.com/Module3_IntroducingNumpy/IntroducingTheNDarray.html).
5. Ein Tutorial, das Ihnen die wichtigste Plotting-Funktion von *Matplotlib* näher bringt, finden Sie beispielsweise [hier](https://matplotlib.org/tutorials/introductory/pyplot.html#sphx-glr-tutorials-introductory-pyplot-py).

