<img src="hs.png" width="200">

# Numpy, vektori i matrice

U ovomo se notebooku prikazuju osnove operacije nad vektorima i matricama, i kako se one mogu realizirati u Pythonu. Paket koji se koristi je Numpy, i počinjemo tako da ga učitamo i to kao *np*, tako da ne moramo uvijek pisati *numpy*

In [None]:
import numpy as np

## Vektori
Prvo ćemo prikazati vektore. Vektore ste već upoznali u svojem obrazovanju, ali su tamo imali drugačiji naziv: uređene $n$-torke. Ono što ste pak u srednjoj školi nazivali vektorima (tzv. "usmjerene duljine"), najbolje zaboravite. Pravi matematimatički vektori se mogu prikazati na taj način ali transformacije potrebne za to izlaze izvan gabarita ovog kolegija i neće vam vjerojatno nikad trebati za umjetnu inteligenciju. Ako će vam trebati, kada ćete trebati -- naučit ćete.

Za sad vektor je uređena $n$-torka. Veličina $n$ definira *dimenzionalnost* vektora. Tako je na primjer uređeni par *dvodimenzionalni* vektor, a uređena desetorka je *desetodimenzionalni vektor*. Vektore označavamo s boldanim malim slovima, ili s punim raspisom, na primjer: $$\mathbf{a} = (a_1, a_2, a_3)$$ je trodimenzionalni vektor, skraćeno nazvan $\mathbf{a}$, s komponentama $a_1$, $a_2$, $a_3$. 

U Pythonu vektore možemo stvoriti iz liste:

In [None]:
lista_a = [1,2,3]
lista_b = [9,8,7]

a = np.array(lista_a)
b = np.array(lista_b)

a

Ako nas zanima dimenzionalnost, onda koristimo sljedeći kod

In [None]:
a.shape

Ako želimo stvoriti vektor dimenzije 5 sa svim nulama, koristimo

In [None]:
nule = np.zeros(5)
nule

A ako želimo napraviti vektor s nasumičnim vrijednostima koristimo

In [None]:
rand = np.random.rand(5)
rand

Premda je uobičajeno vektore označavati s boldanim malim slovima, naći ćete i druge oznake. Bez obzira na oznaku svi vektori dozvoljavaju dvije osnove operacije na njima: zbrajanje vektora i skalarno množenje.
Vektori se zbrajaju tako da moraju imati istu dimenzionalnost i onda se zbroje komponente, odnosno ako $\mathbf{a}=(a_1, a_2, a_3)$ i $\mathbf{b}=(b_1, b_2, b_3)$, onda $$\mathbf{a} + \mathbf{b} = (a_1+b_1, a_2+b_2, a_3+b_3)$$

Tako da ako npr. $\mathbf{a}=(1, 2, 3)$ i $\mathbf{b}=(4, 5, 6)$, onda

$$\mathbf{a} + \mathbf{b} = (1+4, 2+5, 3+6) = (5,7,9)$$

Ovo s Numpyjem možemo napraviti na sljedeći način:

In [None]:
lista_a = [1,2,3]
lista_b = [4,5,6]
a = np.array(lista_a)
b = np.array(lista_b)

c = np.add(a,b)

c

Druga osnovna operacija nad vektorima je skalarni produkt. Skalar je naziv za običan broj, tako da je skalarni produkt u stvari samo množenje vektora s nekim brojem. Ako je $\mathbf{a}=(1,3,5)$ i a skalar $s=2$, onda $$s \cdot \mathbf{a} = \mathbf{a} \cdot s = (1,3,5) \cdot 2 = (2,6,10)$$

Uočimo da kod zbrajanja vektora, u operaciju ulaze dva vektora, i rezultat je također vektor, dok kod skalarnog produkta u operaciju ulaze broj (skalar) i vektor, a rezultat operacije je vektor. U Numpyju skalarni produkt dobijemo na sljedeći način:

In [None]:
lista_a = [1,3,5]
a = np.array(lista_a)
s = 2
c = s*a
c

Zadnja operacija s vektorima je dot produkt. Oba vektora, kao i kod zbrajanja trebaju imati jednaku dimenzionalnost. Dot produkt vektora $\mathbf{a}=(a_1, a_2, a_3)$ i $\mathbf{b}=(b_1, b_2, b_3)$, onda $$\mathbf{a} \cdot \mathbf{b} = \sum_{i=1}^3 (a_i\cdot b_i) = a_1\cdot b_1 + a_2\cdot b_2 + a_3\cdot b_3$$

Tako da ako npr. $\mathbf{a}=(1, 2, 3)$ i $\mathbf{b}=(4, 5, 6)$, onda

$$\mathbf{a} \cdot \mathbf{b} = 1\cdot 4 + 2\cdot 5 + 3 \cdot 6 = 4+10+18 = 32$$

Napomenimo da ovdje u operaciju ulaze dva vektora, ali rezultat je jedan jedini broj (skalar). Ovo s Numpyjem mozemo napraviti na sljedeci nacin:

In [None]:
lista_a = [1,2,3]
lista_b = [4,5,6]
a = np.array(lista_a)
b = np.array(lista_b)

c = np.dot(a,b)

c

## Matrice

Matrice su generalizacija vektora na dvije dimenzije. Matrica izgleda ovako:

$$A= \begin{bmatrix}
1 & 2 & 3\\
4 & 5 & 6
\end{bmatrix} $$

Jedno od temeljnih svojstava matrice je njena dimenzionalnost, koja kaže koliko ima redaka i koliko stupaca. Dimenzionalnost gornje matrice je $2\times 3$. Pripazite da uvijek prvo pišete broj redaka, a onda broj stupaca. 

Pojedini brojevi u matrici se nazivaju elementi, i hvataju se uz pomoć indeksa. Tako primjerice ako želimo uhvatiti 5 iz gornje matrice, to radimo oznakom $a_{2,2}$, a ako želimo 6 onda je to $a_{2,3}$

Ako želimo napraviti matricu u Pythonu, imamo nekoliko opcija. Najjednostavnije je napraviti matricu iz liste lista:

In [None]:
lista_a = [[1,2,3],[4,5,6]]
a = np.array(lista_a)
a

Čime smo dobili matricu

$$A= \begin{bmatrix}
1 & 2 & 3\\
4 & 5 & 6
\end{bmatrix} $$

Ako nas zanima koja je dimenzionalnost ili oblik matrice A iz prethodne ćelije, koristimo

In [None]:
a.shape

Također, matricu možemo inicijalizirati s nasumičnim vrijednostima direktno u Numpyju, ako mu kažemo koje dimenzije želimo. 

**random.rand** ima i druge neobvezatne parametre, poput na primjer distribucije iz koje se uzorkuje, pa ih slobodno samo proučite na StackOverflow.

In [None]:
d = np.random.rand(3,2)
d

Ako želimo "izvrnuti" matricu, tako da $m\times n$ matrica postane $n\times m$ na sustavan način, operacija koja to radi se zove *transpozicija*. Tako ako imamo matricu


$$A= \begin{bmatrix}
1 & 2 & 3\\
4 & 5 & 6
\end{bmatrix} $$

Njena transpozicija je


$$A^T= \begin{bmatrix}
1 & 4\\
2 & 5\\
3 & 6
\end{bmatrix} $$

In [None]:
a_T= np.transpose(a)
a_T

Ako želimo primjeniti funkciju na matricu, to je jednostavno primjena te funkcije na sve elemente matrice. Tako ako npr. imamo funkciju $f(x)=x^2$, i želimo je primjeniti na 

$$A= \begin{bmatrix}
1 & 2 & 3\\
4 & 5 & 6
\end{bmatrix} $$

Dobijemo

$$f(A)= \begin{bmatrix}
f(1) & f(2) & f(3)\\
f(4) & f(5) & f(6)
\end{bmatrix} = \begin{bmatrix}
1 & 4 & 9\\
16 & 25 & 36
\end{bmatrix} $$

Nama će u strojnom učenju biti bitna takozvana logistička ili sigmoidna funkcija, koja je definirana kao:

$$\sigma(x)=\frac{1}{1+e^{-x}}$$

Sada ćemo vidjeti kako tu funkciju primjeniti na matricu A:

In [None]:
def sig_arr(x):
    return 1 / (1 + np.exp(-x))

print(a)
print(sig_arr(a))

Zadnja stvar koja nam je potrebna kod matrica je produkt matrica odnosno dot produkt. Da bi se dot produkt mogao izračunati dvije matrice moraju biti ulančane. Dvije matrice dimenzija $m\times n$ i $i \times j$ su ulančane ako i samo ako $n=i$. Tako su na primjer matrice dimenzija $2\times 3$ i $3 \times 4$ ulančane, ali matrice dimenzija $3\times 4$ i $2 \times 3$ nisu. Ulančanost kao svojstvo je asimentrično, što će dalje implicirati da dot produkt matrica nije komutativan.

Ako imamo dvije ulančane matrice dimenzionalnosti $m\times n$ i $n \times k$, tada je dimenzionalnost njihovog dot produkta $m\times k$. Time znamo koje će elemente konačna matrica imati.

Ako koristimo oznake $A\cdot B = C$, tada na elemente matrice $C$ možemo referirati kao $c_{i,j}$. Svaki $c_{i,j}$ računamo tako da uzmemo $i$-ti redak iz matrice $A$ (i pretvorimo ga u vektor), i $j$-ti stupac iz matrice $B$ (i pretvorimo ga u vektor) i onda napravimo dot produkt ta dva vektora.

Svaki element matrice $C$ se računa zasebno što znači da se taj proces može paralelizirati. Python nam dot produkt dviju matrica vrlo brzo izračuna čak i za jako velike matrice.


In [None]:
lista_a = [[1,2,3],[4,5,6]]
a = np.array(lista_a)

lista_b = [[7,8],[9,10],[11,12]]
b = np.array(lista_b)

c = np.dot(a,b)
c

In [None]:
#TODO:
#csv to array and array to csv and pandas interactions
#ravel\reshape vector u matricu