# Module 5: Matrices

In de komende twee modules ga je _matrixfactorisatie_ implementeren. Dit is een veelgebruikte techniek voor _collaborative filtering_. 

Je mening over de film Pulp Fiction en je mening over de film Resevoir Dogs zijn niet twee totaal verschillende meningen. De films bevatten zoveel overeenkomsten (regisseur, acteurs, filmstijl, genres, etc...) dat de meeste mensen die de ene film goed vinden ook de ander film goed zullen vinden. Met matrixfactorisatie proberen we deze meningen op een slimme manier samen te vatten: In plaats van het onthouden van een rating voor Pulp Fiction en een rating voor Resevoir Dogs, gebruiken we een wiskundige truc die de filmsmaak van gebruikers op een efficiëntere manier codeert.

Het elegante van matrixfactorisatie is dat het een zeer algemene techniek is die veel meer toepassingen heeft dan alleen recommender systems. Je zal deze techniek (of tenminste aspecten/varianten ervan) in de toekomst waarschijnlijk nog wel vaker tegenkomen.

Om matrixfactorisatie te kunnen implementeren moeten we een aantal fundamentele aspecten van machine learning en lineaire algebra behandelen. Deze module gaat vooral over de lineaire algebra, en de volgende module gaat vooral over de benodigde machine learning.

Deze module bestaat uit vijf delen:
- Deel 1: matrix transponeren (_transpose_) 
- Deel 2: vector inproduct (vector _dot product_)
- Deel 3: matrix inproduct (matrix _dot product_)
- Deel 4: _mean square error_
- Deel 5: andere matrixoperaties



# Packages en data
Begin met het laden van de benodigde packages hieronder.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from tqdm import tqdm

from helpers import nice, random_df, display_side_by_side
import answers

data_folder = './data/'

Laad de onderstaande tabel:

In [None]:
pre_defined_items = pd.read_csv(f'{data_folder}three_genres_movies.csv', index_col = 'movieName')
display(nice(pre_defined_items))

Deze tabel bevat 19 films. Voor elke film is aangegeven in welke mate deze tot een bepaald genre behoort. Mat als maximum een 1 en als minimum een 0. Zoals je kan zien scoort _Pocahontas_ hoog voor het genre _drama_, scoort _Inception_ hoog voor zowel _drama_ als thriller en is _South Park: Bigger, Longer and Uncut_ vooral een _comedy_ film.

In dit geval zijn genres dus niet gemodelleerd als categorische data, maar numerieke data. Met andere woorden, een film kan in meer (1) of mindere (0) mate behoren tot een bepaald genre.

We focussen ons voor deze opdracht maar op drie genres (_drama_, _thriller_ en _comedy_). Zo houden we het een beetje overzichtelijk. In werkelijkheid zal je over het algemeen veel meer genres gebruiken. 

<table style= "width:100%"><tr><td style="border:1px solid black">
    
Je ziet trouwens dat we voor het tonen van de data de functie `nice` gebruiken. Deze geeft de kleurcodering die je in de tabel ziet. Dit is vooral later in deze module handig om het overzicht te houden. 
    
</td></tr></table>

We hebben een vergelijkbare tabel voor de gebruikers gemaakt. De onderstaande tabel bevat voor elke gebruiker informatie over welke genres hij/zij over het algemeen leuk vindt.

Ook voor deze tabel is per gebruiker, per genre een score toegekend. In dit geval zitten de scores tussen de -1 en de 1. Als de waarde voor een bepaald genre voor een bepaalde gebruiker negatief is, betekent dat dat de gebruiker bij voorkeur geen films van dat genre ziet.

In [None]:
pre_defined_users = pd.read_csv(f'{data_folder}three_genres_users.csv', index_col = 'userId')


display(nice(pre_defined_users))

## Matrices

We kunnen deze tabellen beschouwen als **matrices**. Matrices die de genres van films en de voorkeuren van gebruikers karakteriseren. De formele definitie in de lineaire algebra van matrices heeft een stuk meer voeten in de aarde, maar voor deze opdracht kunnen we een matrix simpelweg beschouwen als een tabel met getallen. Alle `DataFrame`s die we in deze opdracht gebruiken zijn matrices. 

In de lineaire algebra is het gebruikelijk om matrices met een hoofdletter aan te duiden. Voor alle vergelijkingen die we geven in de rest van deze module zullen we de matrix met films hierboven aanduiden met $M$ (movie matrix) en de matrix met gebruikers hierboven aanduiden met $U$ (user matrix).


## Dimensies

Het is vaak belangrijk om goed in de gaten te houden wat de dimensies van matrices zijn als je er mee gaat werken. De matrix $M$ hierboven bevat 19 rijen (19 films) en 3 kolommen (3 genres). Ofwel, $M$ heeft de dimensies $19 \times 3$. De matrix $U$ heeft dus de dimensies $30 \times 3$. 


# Deel 1: Transponeren

De eerste operatie die we moeten leren is het transponeren van de matrix. Het zal later duidelijk worden waarvoor dit nodig is.

Het transponeren van de matrix is simpelweg het verwisselen van de kolommen en rijen. Voor, bijvoorbeeld, de gebruikersmatrix $U$ ziet de getransponeerde versie $U^T$ er zo uit:


![title](src/users_transposed.png)

Ook voor deze tabel is er per gebruiker een score toegekend per genre, maar de dimensies van de getransponeerde matrix zijn omgewisseld: $U$ is een $30\times 3$ matrix (30 rijen en 3 kolommen), en $U^T$ is een $3\times 30$ matrix (3 rijen en 30 kolommen).

We schrijven de transpose van een matrix $X$ als $X^T$

In het algemeen, als we een matrix $X$ hebben:

$$
X =
\begin{pmatrix}
a_1    & b_1    & \cdots \\
a_2    & b_2    & \cdots \\
a_3    & b_3    & \cdots \\
\vdots & \vdots & \ddots
\end{pmatrix}
$$

ziet de de transpose van die matrix $X^T$ er zo uit:

$$
X^T = 
\begin{pmatrix}
a_1    & a_2    & a_3    & \cdots \\
b_1    & b_2    & b_3    & \cdots \\
\vdots & \vdots & \vdots & \ddots
\end{pmatrix}
$$

Dus de rijen van $X$ zijn de kolommen $X^T$.


### Vraag 1 

\[2 pt.\]

Schrijf hieronder de functie `tranpose` die als input een matrix (in dit geval dus een Pandas `DataFrame`) krijgt en als output de getransponeerde variant geeft. Het is de bedoeling dat je zelf deze functie schrijft met een `for`-loop. Je mag dus (nog) geen gebruik maken van de in Pandas ingebouwde transpose (`df.T`). Zorg er ook voor dat de labels van de kolommen en rijen ook wisselen: de labels van de rijen van de input zijn de labels van de kolommen van de output en vise versa. 

In [None]:
def transpose(matrix):
    # TODO
    

Probeer hieronder wat voorbeelden uit om te zien of je code naar verwachting werkt.

In [None]:
# example 1: the user matrix

pre_defined_users_transposed = transpose(pre_defined_users)
display(nice(pre_defined_users_transposed))


# try some more examples

# TODO


Gebruik de onderstaande test om te kijken of het correct is:

In [None]:
answers.test_1(pre_defined_users_transposed, pre_defined_users)

### checkpoint

Veel van de operaties uit de lineaire algebra zitten al in Pandas ingebouwd. Voor het berekenen transpose van de matrix `my_df` kan je simpelweg: 

`my_df_transposed = my_df.T` 

schrijven. Vanaf nu mag je dit gebruiken in plaats van je eigen transpose functie.

# Deel 2: Vector inproduct

Het volgende concept uit de lineaire algebra dat we nodig hebben is het **vector inproduct** (vector _dot product_). 

Uiteindelijk willen we weten hoe goed een bepaalde gebruiker een bepaalde film gaat vinden. We willen dus weer een rating voorspellen voor de combinatie van gebruiker en film.

### Voorbeeld 1

Stel dat we de rating van gebruiker 13 voor de film Inception willen voorspellen dan kunnen we daar het _inproduct_ voor gebruiken.

De rij van Inception in de user matrix bevat de scores voor die film. 

<img src = "src/movies_select_inception.PNG" width = 30%>

Deze rij kunnen we als een vector beschouwen:

$$
m_{\textrm{inception}} = (0.63, 0.92, 0.44)
$$

Waarbij het eerste element aangeeft dat de film 0.63 scoort voor het genre _drama_, het tweede element geeft aan dat de film 0.92 scoort voor het genre _thriller_ en het derde element geeft aan dat de film 0.44 scoort voor _comedy_.


<table style= "width:100%"><tr><td style="border:1px solid black">
    
Een vector is niet hetzelfde als een matrix. Een vector heeft net als een matrix een exacte definitie in lineaire algebra, maar voor nu volstaan we met een vector simpelweg te definiëren als een lijst van getallen. In dit notebook implemeneteren we een vector als een Pandas `Series`.
    
</td></tr></table>

We kunnen op dezelfde manier de scores van de gebruiker 13 uit de kolom van de getransponeerde gebruikersmatrix halen:

<img src = "src/users_select_13.PNG" width = 40%>

En ook deze kolom kunnen we interpreteren als een vector:

$$
u_{13} = (0.75, 0.75, 0.29)
$$

Deze gebruiker heeft dus een score van 0.75 voor zowel _drama_ als _thriller_ en een score van 0.29 voor _comedy_.



We kunnen nu de voorspelde rating berekenen door per genre de score van Inception te vermenigvuldigen met de score van gebruiker. We doen dit voor elk genre en tellen de uitkomsten bij elkaar op:

$$
m_{\textrm{inception, drama}} \cdot u_{13,\textrm{ drama}} + m_{\textrm{inception, thriller}} \cdot u_{13,\textrm{ thriller}} + m_{\textrm{inception, comedy}} \cdot u_{13,\textrm{ comedy}} = 0.63 \cdot 0.75 + 0.92 \cdot 0.75 + 0.44 \cdot 0.29 = 1.2901
$$

Dus, de voorspelde rating voor gebruiker 13 voor Inception is $1.2901$. We schrijven dit inproduct als volgt:

$$ 
m_{\textrm{inception}} \cdot u_{13} = 1.2901
$$

<table style= "width:100%"><tr><td style="border:1px solid black">
    
Dit is overigens geen rating op een schaal van 0 en 5 zoals in eerdere opdrachten. De score is op een schaal van 0 tot 1, waarbij alles boven de 1 wordt gezien als een 1 en alles onder de 0 wordt gezien als een 0. Een score van 1.29 is ruim de maximale rating.

</td></tr></table>

### Definitie

In het algemeen als we twee vectoren hebben $a = (a_1, a_2, \ldots, a_n)$ en $b = (b_1, b_2, \ldots, b_n)$ is het **inproduct** (_dot product_) gedefinieerd als volgt:

$$
a \cdot b = a_1\cdot b_1 + a_2\cdot b_2 + \ldots + a_n\cdot b_n
$$


### Voorbeeld 2

Als we in plaats van de film Inception de film Dumb & Dumber gebruiken krijgen we de volgende vector $m_{\textrm{dumb&dumber}} = (0.00, 0.17, 1.00)$. Als we de rating van gebruiker 13 voor Dumb & Dumber willen weten kunnen we weer het inproduct gebruiken:

$$
m_{\textrm{dumb&dumber}} \cdot u_{13} = 0.00 \cdot 0.75 + 0.17 \cdot 0.75 + 1.00 \cdot 0.29 = 0.4175
$$

De voorspelde rating voor Dumb & Dumber is veel lager dan die voor Inception. Dat is niet zo gek aangezien Dumb & Dumber vooral hoog scoort voor het genre _comedy_ (1.00) terwijl de gebruiker juist een relatief lage score heeft voor dat genre (0.29). Met andere woorden, Dumb & Dumber is vooral een _comedy_ film terwijl de gebruiker duidelijk niet veel van _comedy_ houdt.

### Beperking

Het is belangrijk om je te realiseren dat de bovenstaande aanpak alleen maar werkt omdat het aantal genres voor de gebruikers overeenkomen met het aantal genres voor de films. Als we bijvoorbeeld voor de films 4 genres weten en voor de gebruikers 2, dan werkt de bovenstaande logica niet, omdat we geen inproduct tussen een vector met 2 elementen en een vector met 4 elementen kunnen bepalen. Stel 

$$
m_{\textrm{inception}} = (0.63, 0.92, 0.44, 0.18)
$$

en

$$
u_{13} = (0.75, 0.75)
$$

Dan is het inproduct, $m_{\textrm{inception}} \cdot u_{13} = 0.63 \cdot 0.75 + 0.92 \cdot 0.75 + 0.44 \cdot \mathbf{??} + 0.18 \cdot \mathbf{??} = \mathbf{????}$, niet gedefinieerd.

Met andere woorden, het inproduct tussen twee vectoren is alleen gedefnieerd als beide vectoren dezelfde lengte hebben.

### Vraag 2

\[2 pt.\]

Schrijf hieronder de functie `dot_v`. Deze functie berekent het inproduct van twee vectoren (Pandas `Series`). Dit moet voor twee `Series` van arbitraire (maar gelijke) lengte werken.

Je mag hier niet de `@`-operator gebruiker, mocht je deze al kennen. Je moet het product echt zelf met een loop uitwerken.

In [None]:
def dot_v(v1, v2):
    # TODO
    

# get row for 'Inception' from film matrix
m_inception = pre_defined_items.loc['Inception']

# get column for 13 from the transposed user matrix 
u_13 = pre_defined_users_transposed.loc[:,13]

# show vectors (pd.Series)
print(m_inception)
print(u_13)
print()

# compute dot product between the two vectors
print(f'Predicted rating: {dot_v(m_inception, u_13)}')

Check hieronder je antwoord:

In [None]:
answers.test_2(dot_v)

# Deel 3: Matrix inproduct

We hebben hierboven gezien hoe je het _vector_ inproduct kan gebruiken voor het berekenen van een voorspelde rating voor een combinatie van film en gebruiker.

Uiteindelijk willen we, net als bij andere algoritmes die je hebt geschreven, een utility matrix maken. In dit geval bevat de matrix de _voorspelde ratings_ van _alle_ combinaties van films en gebruikers. De rijen van matrix bevatten de films en de kolommen de gebruikers. 

Als we alleen naar de eerste 10 bij 10 elementen kijken, ziet de matrix ziet er ongeveer zo uit:

<img src = "src/utility.PNG" width = 50%>

Hier zie je bijvoorbeeld dat de voorspelde rating van gebruiker 13 voor Inception ongeveer 1.29 is, zoals we hierboven al hadden berekend.

We noemen deze matrix van voorspelde ratings $\hat{R}$. Hierboven is een klein deel van de matrix getoond. In werkelijkheid heeft $\hat{R}$ de dimensies $19 \times 30$: 19 rijen (19 films) en 30 kolommen (30 gebruikers). 

Om deze matrix te bereken kunnen we simpelweg het _vector_ inproduct (de `dot_v` functie) gebruiken op elke combinatie van gebruiker en film. Als we even inzoomen op de eerste drie gebruikers en eerste twee films, dan berekenen we de utility matrix als volgt:

$$
\begin{array}
.                  & 6                               & 7                               & 8                               & \cdots\\ 
\textrm{Babe}      & m_\textrm{babe}\cdot u_{6}      & m_\textrm{babe}\cdot u_{7}      & m_\textrm{babe}\cdot u_{8}      & \cdots\\
\textrm{Inception} & m_\textrm{inception}\cdot u_{6} & m_\textrm{inception}\cdot u_{7} & m_\textrm{inception}\cdot u_{8} & \cdots\\
\hspace{1.5em}\vdots & \hspace{1.5em}\vdots & \hspace{1.5em}\vdots & \hspace{1.5em}\vdots & \ddots
\end{array}
$$

Laten we als voorbeeld even kijken naar het eerste element in de matrix: de voorspelde rating voor gebruiker 6 voor de film Babe. Deze wordt gegeven door het vector inproduct: $m_\textrm{babe}\cdot u_{6}$.

<table style= "width:100%"><tr><td style="border:1px solid black">
    
Concreet, geeft dit de volgende uitkomst:

De waarde voor de vector $m_\textrm{babe}$ kunnen we uit de matrix met films halen. Deze is $m_\textrm{babe} = (0.74, 0.22, 0.43)$ (dus, de film Babe heeft de score $0,74$ voor het genre _drama_, $0.22$ voor _thriller_ en $0.43$ voor _comedy_). 

De waarde voor de vector $u_{6}$ halen we uit de matrix met gebruikers.
  Dit geeft $u_{6} = (0.71, -0.65, 0.56)$ (dus, gebruiker 6 heeft de score $0,71$ voor het genre _drama_, $-0.65$ voor _thriller_ en $0.56$ voor _comedy_). 

Met deze waardes kunnen we het vector inproduct berekenen: $m_\textrm{babe}\cdot u_{6} = 0.74 \cdot 0.71 + 0.22 \cdot -0.65 + 0.43 \cdot 0.56 = 0.62$
</td></tr></table>

Als we dit voor alle velden van de utility matrix doen, dus alle combinaties van films en gebruikers, dan hebben we het **matrix inproduct** tussen de gebruikersmatrix en de filmmatrix berekend. 

Iets formeler: als $M$ de matrix is met de films en $U^T$ de transponeerde gebruikersmatrix, dan is de utility matrix met de voorspelde ratings ($\hat{R}$) het inproduct van $M$ en $U^T$. We schrijven dit als volgt:

$$
\hat{R} = M \cdot U^T
$$

Let erop dat we voor deze definitie voor de gebruikersmatrix de getransponeerde variant nemen ($U^T$). In lineaire algebra is het matrix inproduct zo gedefinieerd dat de *rijen* van de uitkomst (dus de films in matrix $\hat{R}$) overeen moet komen met de *rijen* in de linker component van de vermenigvuldiging ($M$). En de *kolommen* van uitkomst (dus de gebruikers in matrix $\hat{R}$) overeen moeten komen met de *kolommen* van de rechter component van de vermenigvuldiging ($U^T$).

Ter herinnering, de dimensies van $M$ zijn $19 \times 3$ (19 rijen/films en 3 kolommen/genres) en de dimensies van $U^T$ zijn $3 \times 30$ (3 rijen/genres en 30 kolommen/gebruikers). Het resultaat van de matrixvermenigvuldiging, $\hat{R}$, heeft de dimensies $19 \times 30$.

In het algemeen is het zo dat, met een $k \times l$ matrix $A$ en een $m \times n$ matrix $B$, het inproduct $A \cdot B$ de dimensies $k \times n$ heeft. 

Het is ook belangrijk om je te realiseren dat de bovenstaande berekening van $\hat{R}$ alleen maar werkte omdat het aantal genres voor de gebruikers overeenkwamen met het aantal genres voor de films. Als we bijvoorbeeld voor de films 4 genres weten en voor de gebruikers 2, dan werkt de bovenstaande logica niet, omdat we, zoals we boven hebben gezien alleen een inproduct kunnen bepalen tussen vectoren van gelijke lengte.

Dit betekent dat het inproduct van twee de $k \times l$ matrix $A$ en de $m \times n$ matrix $B$ alleen is gedefiniëerd als $l = m$.

Dus voor de berekening van $\hat{R}$ gaat het goed, want $l=m={\rm het\ aantal\ genres} = 3$.

### Vraag 3

\[3 pt.\]

Implementeer hieronder de functie `dot`. Deze functie implementeert het matrix inproduct. De DataFrame `output` is al gedefinieerd met de juiste dimensies, maar is nu nog gevuld met 0'en. Schrijf een stuk code dat `output` vult met de juiste waardes. 

Je mag weer geen gebruik maken van de `@`-operator voor deze opdracht, mocht je deze al kennen.

<table style= "width:100%"><tr><td style="border:1px solid black">
    
Tip 1: Je zal een dubbele loop moeten schrijven die over de rijen van matrix 1 en over de kolommen van matrix 2 itereert. 

Tip 2: In de dubbele loop kan je de `dot_v` van vraag 2 aanroepen voor het berekenen van de voorspelde rating. 
</td></tr></table>


In [None]:
def dot(matrix1, matrix2):
    if not matrix1.shape[1] == matrix2.shape[0]:
        raise Exception(f'Cannot multiply matrices of dimensions {matrix1.shape} and {matrix2.shape}')
    output = pd.DataFrame(0, index = matrix1.index, columns = matrix2.columns)
    
    # TODO
    
    
    return output


predicted = dot(pre_defined_items, pre_defined_users_transposed)

# laat de eerste 10x10 waardes zien:
display(nice(predicted.iloc[:10,:10]))

Test de uitwerking:

In [None]:
answers.test_3(predicted)

Pandas heeft ook het matrix inproduct al ingebouwd. Niet in de vorm van een functie maar in de voor van een operator: `@`. Het matrix inproduct $X = A \cdot B$ ziet er met Pandas zo uit:

    X = A @ B
    
Je kan vanaf nu de `@` operator gebruiken voor het berekenen van het matrix inproduct. We kunnen de `predicted` matrix dus ook zo berekenen:

In [None]:
predicted = pre_defined_items @ pre_defined_users_transposed
display(nice(predicted.iloc[:10,:10]))

# Deel 4: Error

We hebben nu gezien hoe we een utility matrix met voorspellingen kunnen genereren. Hiervoor maakten we gebruik van voorgedefinieerde matrices met scores voor genres per gebruiker en per film. Je hebt deze voorgedefinieerde matrices alleen lang niet altijd ter beschikking. Wat we uiteindelijk willen doen is de matrices voor de gebruiker en voor de films genereren (leren) aan de hand van de beschikbare data. Hiervoor hebben we een beetje _machine learning_ nodig.

Maar, voordat we daar induiken, willen we eerst weten hoe goed onze huidig voorspellingen zijn. We gaan hier weer de _MSE_ (_mean squared error_) voor gebruiken.

Eerst laden we wat review data:

In [None]:
ratings = pd.read_csv(f'{data_folder}three_genres_ratings.csv', index_col = 'movieName', dtype={'userId': np.int64})
display(ratings)

Deze data bevat ratings die gebruikers hebben gegeven voor films. De data is genormaliseerd: de hoogste rating is $1$ en de laagste rating is $0$.

We kunnen nu weer de _MSE_ gebruiken om te bepalen hoe goed de voorspellingen waren ten opzichte van deze data. We gaan het nu iets anders aanpakken dan voorheen. Om de _MSE_ te brekenen zetten we de data eerst om in matrixvorm:

In [None]:
target = ratings.pivot(columns = 'userId', values = 'value').loc[predicted.index, predicted.columns]

display(nice(target.iloc[:15,:15], nan = '&middot;'))

Lang niet alle combinaties van film en user hebben een rating. De combinaties waarvoor geen waarde bekend is zijn ingevuld met `nan`-waardes. Om het printen een beetje overzichtelijk te houden zijn alle `nan`-waardes weergegeven als een puntje ($\cdot$). 

Hieronder berekenen we de _mse_ voor de door onze voorspelde matrix `predicted`, gegeven de data `target`. De functie `MSE` hieronder negeert alle `nan` waardes. Dus voor het bereken van de mse wordt alleen gekeken naar de combinaties van films en gebruikers waarover we informatie hebben in onze data.


<table style= "width:100%"><tr><td style="border:1px solid black">
    
De onderstaande functie trekt twee matrices van elkaar af (`m2 - m1`). We bespreken in het laatste deel van deze module hoe dat precies werkt.
</td></tr></table>

In [None]:
def MSE(m1, m2):
    se = (m2 - m1)**2
    return se.mean().mean()

print(MSE(target,predicted))

Is dit een goede score? Laten we eerst eens kijken hoe goed dit is ten opzichte van willekeurig gokken:

In [None]:
random_prediction = random_df(target.index, target.columns)

print(MSE(target,random_prediction))

De `random_prediction` geeft een stuk hogere mse dan onze voorspelling. Dat is niet zo gek, want de gebruikers- en filmmatrices die we hebben gebruikt voor onze voorspellingen waren al redelijk geoptimaliseerd.

# Deel 5: Andere matrixoperaties

## Scalaire vermenigvuldiging

Zoals gezegd, willen we uiteindelijk de matrices voor de gebruiker en voor de films genereren (leren) aan de hand van de beschikbare data. Hier gaan we in de volgende module naar kijken. Maar, voor we dat kunnen doen hebben we nog een aantal andere matrixoperaties nodig.

Deze opraties hebben geen directe betrekking op de ratings van films (zoals de operaties hierboven wel hebben). Dit zijn operaties waarvan het nut pas echt duidelijk wordt in de volgende module. Hier kijken we alleen kort naar hoe ze werken.

Je kan matrices ook met een enkel getal ($\alpha$) vermenigvuldigen. In dat geval vermenigvuldig je elk getal in de matrix met $\alpha$:

$$
2 \cdot 
\begin{pmatrix}
3    & 4      \\
1    & 2      \\
0    & 4      \\
\end{pmatrix}
= 
\begin{pmatrix}
2\cdot3    & 2\cdot4      \\
2\cdot1    & 2\cdot2      \\
2\cdot0    & 2\cdot4      \\
\end{pmatrix}
=
\begin{pmatrix}
6    & 8      \\
2    & 4      \\
0    & 8      \\
\end{pmatrix}
$$

In het algemeen, gegeven getal $\alpha$ en matrix $X$:

$$
X =
\begin{pmatrix}
a_1    & b_1    & \cdots \\
a_2    & b_2    & \cdots \\
a_3    & b_3    & \cdots \\
\vdots & \vdots & \ddots
\end{pmatrix}
$$

is de scalaire vermigvuldiging (een vermenigvuldiging van een getal met een matrix) $\alpha \cdot X$ als volgt gedfiniëerd:

$$
\alpha \cdot X =
\begin{pmatrix}
\alpha \cdot a_1    & \alpha \cdot b_1    & \cdots \\
\alpha \cdot a_2    & \alpha \cdot b_2    & \cdots \\
\alpha \cdot a_3    & \alpha \cdot b_3    & \cdots \\
\vdots & \vdots & \ddots
\end{pmatrix}
$$

In Pandas kan je scalaire vermenigvulding met de `*` operator doen:

In [None]:
a = 2
X = pd.DataFrame([[3,4],[1,2],[0,4]])
M = a * X
display(M)

## Matrices optellen

Je kan ook twee matrices bij elkaar optellen:

$$
\begin{pmatrix}
3    & 4      \\
1    & 2      \\
0    & 4      \\
\end{pmatrix}
+
\begin{pmatrix}
0    & 0.5      \\
1    & 2      \\
1    & 1      \\
\end{pmatrix}
=
\begin{pmatrix}
3+0    & 4+0.5      \\
1+1    & 2+2      \\
0+1    & 4+1      \\
\end{pmatrix}
=
\begin{pmatrix}
3    & 4.5     \\
2    & 4      \\
1    & 5      \\
\end{pmatrix}
$$

In het algemeen als we twee matrices $X$ en $Y$ hebben:

$$
X =
\begin{pmatrix}
a_1    & b_1    & \cdots \\
a_2    & b_2    & \cdots \\
a_3    & b_3    & \cdots \\
\vdots & \vdots & \ddots
\end{pmatrix}
,
Y =
\begin{pmatrix}
i_1    & j_1    & \cdots \\
i_2    & j_2    & \cdots \\
i_3    & j_3    & \cdots \\
\vdots & \vdots & \ddots
\end{pmatrix}
$$

Dan is $X+Y$:

$$
X + Y =
\begin{pmatrix}
a_1    & b_1    & \cdots \\
a_2    & b_2    & \cdots \\
a_3    & b_3    & \cdots \\
\vdots & \vdots & \ddots
\end{pmatrix}
+
\begin{pmatrix}
i_1    & j_1    & \cdots \\
i_2    & j_2    & \cdots \\
i_3    & j_3    & \cdots \\
\vdots & \vdots & \ddots
\end{pmatrix}
=
\begin{pmatrix}
a_1+i_1    & b_1+j_1    & \cdots \\
a_2+i_2    & b_2+j_2    & \cdots \\
a_3+i_3    & b_3+j_3    & \cdots \\
\vdots & \vdots & \ddots
\end{pmatrix}
$$

Dit werk alleen als $X$ en $Y$ dezelfde dimensies hebben (hetzelfde aantal kolommen en rijen). Ja kan op precies dezelfde manier twee matrices van elkaar aftrekken.

Je kan in Pandas gewoon de `+` en de `-` operatoren gebruiken voor het optellen en aftrekken van Matrices:

In [None]:
a = 2
X = pd.DataFrame([[3,4],[1,2],[0,4]])
Y = pd.DataFrame([[0,0.5],[1,2],[1,1]])
M = X + Y
display(M)

### Vraag 4

\[1 pt.\]

Gebruik de matrix operatoren `+`, `-`, `*` en `@` om de volgende vergelijkingen uit te werken in Pandas:

$$
M = a \cdot (X \cdot Y^T) - 2 \cdot X
$$

Met de waardes voor $X$, $Y$ en $a$ zoals hieronder gegeven.

In [None]:
a = 2
X = pd.DataFrame([[3,4],[1,2],[0,4]])
Y = pd.DataFrame([[0,1],[1,2]])

# TODO

display(M)

Test je uitwerking:

In [None]:
answers.test_4(M)

### Vraag 5

\[2 pt.\]

De verminigvuldigen $3 \times 6$ is hetzelfde als $6 \times 3$. In het algemeen is het voor getallen zo dat vermenigvuldigen commutatief is. Dat wil zeggen dat $a \times b$ hetzelfde is als $b \times a$. 

Is het inproduct van matrices ook commutatief? Dus, is het zo dat voor twee matrices $A$ en $B$ het inproduct $A \cdot B$ hetzlefde is als $B \cdot A$? Waarom wel/niet?

YOUR ANSWER HERE

### Klaar

Je hebt gezien hoe je matrices kan vermenigvuldigen en hoe je dat kan inzetten om ratings te voorspellen aan de hand van genres. Je hebt gezien hoe je de MSE kan gebruiken om te zien hoe goed die voorspelling is. En je hebt gezien hoe scalaire vermenigvuldiging en optellen en aftrekken voor matrices werken. Hiermee heb je genoeg lineaire algebra gezien voor de volgende module.

In de volgende module ga je zien hoe je de matrices met genres kan leren aan de hand van gegeven data. Hiervoor ga je een zeer belangrijke machine learning techniek leren: _gradient descent_ (en een variatie daarop genaamd _alternating least squares_).