# Mathematik 4: Das Skalarprodukt

Auf der Seite zur Linearen Algebra haben wir das Skalarprodukt als eine der möglichen Multiplikationen zweier Vektoren kennengelernt. Sie ist aber mehr als eine reine (algebraische) Operation: Durch das Skalarprodukt erhalten die Vektoren eine **geometrische Struktur**. Mit dem Skalrprodukt ist es möglich, Längen, Winkel, Abstände u.ä. auch für Vektoren zu definieren.

Dies können wir uns am Beispiel der Ortsvektoren klarmachen. Sehen wir uns zunächst den einfachen Vektor $\vec{e_x} = \begin{pmatrix} 1 \\ 0 \end{pmatrix}$ an und bilden das Skalarprodukt $\vec{e_x} \cdot \vec{e_x} = 1 + 0 = 1$. Auf der Skizze ist $\vec{e_x}$ gerade der Pfeil zur 1 auf der $x$-Ache mit der Länge 1. Dasselbe gilt für den Vektor $\vec{e_y}$, der zur 1 auf der $y$-Achse zeigt; auch seine Länge und sein Skalarprodukt mit sich selbst ist 1. Was ist mit dem Punkt mit den Koordinaten $(1,1)$. Der Pfeil, der zu ihm zeigt, ist der Vektor $\vec{v} \begin{pmatrix} 1 \\ 1 \end{pmatrix}$. Seine Länge kennen wir aus dem Satz des Pythagoras: Sie beträgt $\sqrt{2}$. Wie steht es mit dem Skalarprodukt? Es ist $\vec{v} \cdot \vec{v} = 1 +1 = 2$, stimmt also bis auf die Wurzel mit der Länge überein.

Wir definieren (ohne weitere Erläuterung) als **Länge** oder allgemeiner als **Betrag** eines Vektors: 

> $$|\vec{v}| := \sqrt{\vec{v} \cdot \vec{v}}$$

Wir können nun große von kleinen Vektoren unterscheiden, was für unsere Berechnungen wichtig sein wird. Einen Vektor mit Betrag 1 nennen wir **normiert**. 

Jetzt, wo wir die Länge eines Vektors kennen, könnenw Wir auch Winkel zwischen Vektoren definieren. Nehmen wir die beiden Vektoren $\vec{v} = \begin{pmatrix} 1 \\ 2 \end{pmatrix}$ und $\vec{w} = \begin{pmatrix} 3 \\ 2 \end{pmatrix}$. Bilden wir einmal das Skalarprodukt: $ \vec{v} \cdot \vec{w} = \begin{pmatrix} 1 \\ 2 \end{pmatrix} \cdot \begin{pmatrix} 3 \\ 2 \end{pmatrix} = 3 + 4 = 7$

Es ist umso größer, je größer der Betrag der einzelnen Vektoren ist. Ein Winkel ist aber unabhängig von den Längen seiner Schenkel, daher teilen wir das Ergebnis durch das Produkt der beiden Beträge der Vektoren. Diese Zahl liegt immer zwischen -1 und 1, und wir definieren den Arcuscosinus als Winkel zwischen den Vektoren:

> $$ < \vec{v} , \vec{w} > := acos \frac{\vec{v} \cdot \vec{w}} {|\vec{v}| |\vec{w}|} $$

Das ist eine recht holprige Definition. Machen wir uns klar, was das für unsere beiden Vektoren $\vec{e_x} = \begin{pmatrix} 1 \\ 0 \end{pmatrix}$ und $\vec{e_y} = \begin{pmatrix} 0 \\ 1 \end{pmatrix}$ bedeutet, die ja normiert sind. Für ihr Vektorprodukt gilt $\vec{e_x} \cdot \vec{e_y} = 0 + 0 = 0$. Der Arcuscosinus von 0 ist $90^o$, d.h. die beiden Vektoren stehen senkrecht aufeinander. Solche Vektoren nennt man **orthogonal**, und man interpretiert dies häufig, dass sie "nicht viel miteinander zu tun haben".

In der Theorie der KNN spielt aber meist nur die Länge von Vektoren eine Rolle.

### Programmierbeispiele

Als Datenstrukturen für Vektoren und Matrizen bieten sich Arrays  bzw. Listenpassender Diemension an. Bei dern rechenoperationen führt dies dann zu den bekannten, tw. verschachtelten For-Schleifen, etwa in Java:
<code>
    for(i = 0 ; i < N ; i++){
       summe[i] = v[i] + w[i];
    }
</code>
    
Da Python Listen "von Natur aus" unerstützt (und auch - im Gegensatz zu Java - Überladung von Operatoren), sind viele Operationen leichter zu implementieren. Noch einfacher wird alles durch den Einsatz von NumPy.

#### Ohne NumPy

In [1]:
def summe(v,w):
    return [v+w for v,w in zip(v,w)]

def produkt(k,v):
    return [k * v for v in v]

from functools import reduce

def skalar_produkt(v,w):
    return reduce((lambda x, y: x + y), [v*w for v,w in zip(v,w)])

def produkt_matrix(m,v):
    return [[m*v for m,v in zip(m,v)]  ]

In [2]:
k = 3
v = [1,2]
w = [3,4]
m = [[1,2],[3,4]]

print(f'v = {v}, \nw = {w},\nM = {m}\n')

print(f'v + w = {summe(v,w)}')
print(f'k v = {produkt(k,v)}')
print(f'v . w = {skalar_produkt(v,w)}')
print(f'M v = {produkt_matrix(m,v)}')


v = [1, 2], 
w = [3, 4],
M = [[1, 2], [3, 4]]

v + w = [4, 6]
k v = [3, 6]
v . w = 11
M v = [[[1, 2], [3, 4, 3, 4]]]


### Mit NumPy

Mit NumPy geht alles sehr viel schöner und vor allem schneller, was man erst bei sehr großen Datenmengen merkt. NumPy rechnet intern mit anderen ("intelligenten") Datenstrukturen, daher müssen alle Werte zuerst in ein internes Format umgewandelt werden, das **ndarray** ("N-dimensionales Array"). Danach sind all unsere Operatoren bereits vorhanden. Dank Operator Overloading brauchen wir keine Funktionen zu definieren, und numpy weiß aufgrund der Datenstrukturen zu entscheiden, dass kv das Produkt einer  Konstanten mit einem Vektor ist, und Mv das entsprechende Produkt mit einer Matrix.


In [7]:
import numpy as np

In [8]:
k = 3
v = np.array([1,2])
w = np.array([3,4])
m = np.array([[1,2],[3,4]])


print(f'v = {v}, \nw = {w},\nM = {m}\n')

print(f'v + w = {v+w}')
print(f'k v = {k*v}')
print(f'v . w = {v @ w}')
print(f'M v = {m @ v}')

v = [1 2], 
w = [3 4],
M = [[1 2]
 [3 4]]

v + w = [4 6]
k v = [3 6]
v . w = 11
M v = [ 5 11]


Mit NumPy werden viele Aufgaben kinderleicht, und der Code ist wirklich einfach zu verstehen.

Aber **Achtung**: Zu den einzelnen Operatoren gibt es auch andere Implementierungen, etwa **np.dot** für das Skalarprodukt, die deutlich schneller sind als die Operationen in der "einfachen" Schreibweise. Wir werden sie auch an passenden Stellen bevorzugt einsetzen.