# Matrise-vektor operasjoner

Gitt en matrise $A \in \mathbb{R}^{2, 2}$ og en kolonnevektor $b \in \mathbb{R}^2$

$
A = \begin{pmatrix}
 1 & 2 \\
 3 & 4
\end{pmatrix}
$

$
b = \begin{pmatrix}
  5 \\
  6
\end{pmatrix}
$

Matrise-vektor produktet er

$
x = \begin{pmatrix}
 1 & 2 \\
 3 & 4
\end{pmatrix}
\begin{pmatrix}
 5 \\
 6
\end{pmatrix}=
\begin{pmatrix}
1 \cdot 5 + 2 \cdot 6 \\
3 \cdot 5 + 4 \cdot 6 
\end{pmatrix}
=\begin{pmatrix}
17 \\
39 
\end{pmatrix}
$


In [1]:
import numpy as np

A = np.array([[1, 2], [3, 4]])
b = np.array([[5], [6]])
x = np.dot(A, b)
print(x)

[[17]
 [39]]


Merk at `x` er en matrise av størrelse `2 x 1`, altså en kolonnevektor.

In [2]:
print(b.shape)

(2, 1)


Når man regner med vektorer i Numpy trenger man ikke bruke den ekstra dimensjonen. Altså, man trenger ikke bruke en `kolonnevektor` med først akse av størrelse 1. Det går fint med en vanlig vektor som vist under

In [3]:
b = np.array([5, 6])
x = np.dot(A, b)
print(x)
print(x.shape, b.shape)

[17 39]
(2,) (2,)


Numpy sin `dot` funksjon behandler her `b` som en kolonnevektor fordi det er det eneste som gir mening. Man kan ikke ta matriseproduktet av en matrise av størrelse `2 x 2` med en vektor av størrelse `1 x 2`. Så Numpy antar det eneste fornuftige, at `b` er en kolonnevektor.  

## Ytre produkt

Ytre produktet av to vektorer $\vec{a}=(1, 2, 3)$ og $\vec{b}=(4, 5, 6)$ er gitt ved 

$
P = \vec{a} \vec{b}
$

Indeksnotasjon

$
P_{ij} = a_ib_j
$

$
P = \begin{pmatrix}
1 \\
2 \\
3
\end{pmatrix}
\begin{pmatrix}
4 & 5 & 6 
\end{pmatrix}=
\begin{pmatrix}
1 \cdot 4 & 1 \cdot 5 & 1 \cdot 6 \\
2 \cdot 4 & 2 \cdot 5 & 2 \cdot 6 \\
3 \cdot 4 & 3 \cdot 5 & 3 \cdot 6 \\
\end{pmatrix}=
\begin{pmatrix}
4 & 5 & 6 \\
8 & 10 & 12 \\
12 & 15 & 18 \\
\end{pmatrix}
$


In [4]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
P = np.outer(a, b)
print(P)
print(P.shape)

[[ 4  5  6]
 [ 8 10 12]
 [12 15 18]]
(3, 3)


Vi kan få til det samme med egendesignet broadcasting

In [5]:
print(a[:, None]*b[None, :])

[[ 4  5  6]
 [ 8 10 12]
 [12 15 18]]


In [6]:
print(a[:, None].shape, b[None, :].shape)

(3, 1) (1, 3)


Altså, `a[:, None]` tar vektor `a` og lager en matrise av størrelse `3 x 1`, mens `b[None, :]` lager en matrise av størrelse `1 x 3`. `a[:, None]*b[None, :]` blir da et vanlig matrise - matrise produkt med resultat av størrelse `3 x 3`. 
Les mer om Numpy broadcasting [her](https://docs.scipy.org/doc/numpy/user/theory.broadcasting.html#array-broadcasting-in-numpy).
Merk at uten broadcasting får vi som vanlig elementvis multiplikasjon

In [7]:
print(a*b)

[ 4 10 18]
