# Podsetnik: Linearna algebra 

### Vektorski prostor

Vektorski prostor $(V, +, \cdot)$ je algebarska struktura sa jednom binarnom operacijom, u oznaci $+$, i jednom spoljnom $K$-operacijom, u oznaci $\cdot$, nad skupom skalara $K$ za koju vazi:
- zatvorenost u odnosu na sabiranje tj. ako $u,v \in V \text{tada je i } u+v \in V$
- zatvorenost u odnosu na mnozenje skalarom tj. ako $u \in V$ i $\alpha \in K$, tada $\alpha \cdot v \in V$

Neki primeri vektorskih prostora su: 
* prostor geometrijskih vektora
* prostor polinoma u odnosu na sabiranje i mnozenje skalarom
* prostor svih kvadratnih matrica u odnosu na sabiranje i mnozenje skalarom
* prostor svih uredjenih parova $(x_1, x_2, \ldots, x_n)$ u odnosu na sabiranje i mnozenje skalarom. 

Vektori $v_1,v_2,v_3,\ldots,v_n$ su **linearno zavisni** ako postoje skalari $\alpha_1, \alpha_2, \alpha_2, ..., \alpha_k$ od kojih je bar jedan razlicit od nule takvi da je $\alpha_1v_1 + \alpha_2v_2 + \ldots + \alpha_kv_k = 0$. 

Vektori $v_1, v_2, v_3, \ldots , v_n$ su **linearno nezavisni** ako iz $\alpha_1v_1 + \alpha_2v_2 + \ldots + \alpha_kv_k = 0$ sledi $\alpha_1 = \alpha_2 = \alpha_2 = \ldots = \alpha_k = 0$.

### Sopstveni vektori

Za matricu $A \in R^{n \times n}$, vektor $x \in R^{n}, x \neq 0$ je (desni) **sopstveni vektor** ukoliko vazi $Ax=\lambda x$ za neko $\lambda \in R$. Vrednost $\lambda$ se naziva **sopstvena vrednost** matrice $A$ koja odgovara sopstvenom vektoru $x$.

Smisao sopstvenih vektora mozemo objasniti graficki: to su vektori koji u transformaciji odredjenoj matricom $A$ ne menjaju svoj pravac; mogu se izduziti, skratiti ili promeniti smer, ali uvek zadrzavaju pravac. Na slici ispod, ljubicasti i plavi vektor predstavljaju sopstvene vektore. <img src='./assets/eigenvectors.gif'> 

Sopstvene vrednosti i njima odgovarajuci sopstveni vektori se mogu odrediti pomocu nula karakteristicnog polinoma matrice $A$ tj. resavanjem matricne jednacine $det(A-\lambda I)=0$

#### Primer. 

Za datu matricu
$A =\begin{bmatrix} 
2 & 1 \\
1 & 2
\end{bmatrix}$ sopstvene vektore mozemo odrediti resavajuci jednacinu:
<br> 

$ det (A-\lambda I) = \begin{vmatrix}
2-\lambda  & 1 \\
1 & 2-\lambda
\end{vmatrix} = (2-\lambda)^2 -1 = \lambda^2 - 4\lambda +3$ 

Resenja ove jednacine su $\lambda_1 = 1$ i $\lambda_2 = 3$.

Sopstvenoj vrednosti $\lambda_1 = 1$ odgovara sopstveni vektor $x_1 = \begin{bmatrix} 1 \\ -1 \end{bmatrix}$ dobijen resavanjem sistema $\begin{bmatrix} 
1 & 1 \\
1 & 1
\end{bmatrix} \cdot \begin{bmatrix} v_1 \\ v_2 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} $.

Sopstvenoj vrednost $\lambda_2 = 3$ odgovara sopstveni vektor $x_2 = \begin{bmatrix} 1 \\ 1 \end{bmatrix}$ dobijen resavanjem sistema $\begin{bmatrix} 
-1 & 1 \\
1 & -1
\end{bmatrix} \cdot \begin{bmatrix} v_1 \\ v_2 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} $.



U programskom jeziku Python sopstvene vrednosti i odgovarajuce (normirane) sopstvene vektore mozemo dobiti koriscenjem funkcije `eig` paketa `linalg` biblioteke `numpy`. 

In [6]:
import numpy as np

In [7]:
A = np.array([[2, 1], [1, 2]])

In [8]:
values, vectors = np.linalg.eig(A, )

In [9]:
print('Sopstvene vrednosti matrice A su: ', values)

Sopstvene vrednosti matrice A su:  [3. 1.]


In [10]:
print('Normirani sopstveni vektori matrice A su kolone rezultujuce matrice: ', vectors[:, 0], vectors[:, 1])

Normirani sopstveni vektori matrice A su kolone rezultujuce matrice:  [0.70710678 0.70710678] [-0.70710678  0.70710678]


Sopstveni vektori imaju mnoga zanimljiva matematicka svojstva.

**Teorema.**  

Sopstveni vektori koji odgovaraju razlicitim sopstvenim vrednostima su linearno nezavisni. 

**Teorema.** 

Neka je $V_i$ skup svih sopstvenih vektora $x$ koji odgovaraju sopstvenoj vrednosti $\lambda_i$ tj. za koje vazi $Ax=\lambda_ix$. Ovakav skup obrazuje sopstveni podprostor.

**Teorema.** 

Ako je zbir dimenzija podprostora koji odgovaraju sopstvenim vrednostima matrice $A$ jednak dimenziji matrice $A$, tada se $A$ moze svesti na dijagonalnu matricu oblika 
$ D = \begin{bmatrix} 
\lambda_1 & & & & \\
& ... & & & \\
& & \lambda_2 & & \\
& & & ... &  \\
& & & & \lambda_n \\
\end{bmatrix}$ tj. vazi $AX = DX$ gde je $X$ matrica svih sopstvenih vektora matrice $A$ (po kolonama).  

Iz prethodnog sledi da je $D = X^{-1}AX$ tj. da je $X$ matrica transformacija. 

Matrica $A$ je **ortogonalna** ako vazi $AA^T = I$ tj. $A^{-1} = A^T$.

**Teorema.** 

Ako je $A$ realna simetricna matrica, matrica njenih sopstvenih vektora je ortogonalna. 

### Definitnost matrica

Za kvadratnu matricu $A \in R^{n \times n}$ kazemo da je **pozitivno semidefinitna** ako vazi $x^TAx\geq0$ za sve $x \in R^n$.

#### Primer. 

Matrica $A =\begin{bmatrix} 
1 & 1 \\
1 & 1
\end{bmatrix}$ je pozitivno semidefinitna jer za proizvoljno $\begin{bmatrix} x_1 \\ x_2 \end{bmatrix}$ vazi: 
$ \begin{bmatrix} x_1 x_2 \end{bmatrix} \cdot \begin{bmatrix} 
1 & 1 \\
1 & 1
\end{bmatrix} \cdot \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} = (x_1 + x_2)^2 \geq 0$. 

Za kvadratnu matricu $A \in R^{n \times n}$ kazemo da je **pozitivno definitna** ako vazi $x^TAx > 0$ za sve $x \in R^n$ tj. ako je $x^TAx=0$ tada je $x=0$.

#### Primer. 

Matrica $A =\begin{bmatrix} 
1 & 2 \\
-2 & 1
\end{bmatrix}$ je pozitivno definitna jer za proizvoljno $\begin{bmatrix} x_1 \\ x_2 \end{bmatrix}$ vazi: 
$ \begin{bmatrix} x_1 x_2 \end{bmatrix} \cdot \begin{bmatrix} 
1 & 2 \\
-2 & 1
\end{bmatrix} \cdot \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} = x_1^2 + x_2^2 \geq 0$.

Vazi $x_1^2 + x_2^2 = 0$ samo ako je $x_1$=$x_2$=0 tj. ako je $x$ nula vektor. 

Definitnost matrice se može proveriti na par načina.

**Teorema (Silvestrov kriterijum).** 

Matrica $Q$ je pozitivno definitna akko je determinanta svih kvadratnih podmatrica koje ukljucuju element $q_{11}$ pozitivna.  <img src='assets/sylvester_criterion.jpg' style='width: 300px'>

Matrica A je **dijagonalno dominantna** ako vazi $|a_{ii}| \geq \sum_{i \neq j}{|a_{ij}|}$ za sve $i$ tj. ako je apsolutna vrednost svakog elementa na glavnoj dijagonali veca od zbira preostalih elemenata vrste kojoj pripada.  

**Teorema.** 

Ako je matrica $A$ dijagonalno dominantna i ako su dijagonalni elementi nenegativni, onda je $A$ pozitivno semidefinitna. 

**Teorema.** 

Kvadratna simetricna matrica je pozitivno definitna akko ima pozitivne sopstvene vrednosti. 

**Teorema (Coleski dekompozicija).** 

Kvadratna matrica je pozitivno definitna akko postoji gornje trougaona matrica L takva da je $A=LL^T$.

Smisao definitnosti, takodje, mozemo objasniti geometrijski: ako je matrica $M$ koja definise preslikavanje pozitivno semidefinitna, novi smer polaznog vektora ce se promeniti za najvise $\frac{\pi}{2}$.  
<img src='assets/positive_semidefinitness.png' style='width: 400px'>

### Norma

Neka je $X \subset R^n$. **Norma** je svako preslikavanje $||\cdot||: X \to R^+$ za koje vazi: 

1) $||x|| = 0$ akko $x=0$

2) $||\lambda x|| = |\lambda|||x||$, $\lambda \in R$

3) $||x+y|| \leq ||x||+||y||$


Intuitivno, normu povezujemo sa intenzitetom tj. dužinom vektora.

#### Primer: $l_p$ norme  

$||x||_p = \sqrt[p]{\sum_{i=1}^{n}{|x_i|^p}}$, $1\leq p < +\infty$

$||x||_{\infty} = max(|x_1|, ..., |x_n|)$


$l_1$ norma (taxicab, Menhetn norma): $||x||_1 = \sum_{i=1}^{n}{|x_i|}$

$l_2$ norma: $||x||_2 = \sqrt{\sum_{i=1}^{n}{x_i^2}}$

**Teorema o ekvivalentnosti p-normi:** 

Za svake dve p-norme $||\cdot||_a$ i $||\cdot||_b$ postoje konstante $0<c_1<c_2$ takve da vazi $c_1||x||_a \leq ||x||_b \leq c_2||x||_a$.

Ova teorema ukazuje da ako ostvarimo konvergenciju u jednoj p-normi, onda imamo konvergenciju i u drigim p-normama. 

Vektor $ x \in X$ je **normiran** ako vazi $||x||=1$. 

Normiranjem nazivamo korak $\frac{x}{||x||}$ kojim se dobija normirani vektor.

**Primer.**  Skupovi vektora jedinicne norme iz $R^2$ . 

<img src='./assets/vector_norms.svg'>

Norme pronalaze primene u zadacima regularizacije. Regularizacija je vid popravljanja uslovljenosti problema.

### Skalarni proizvod 

Neka je: 
* $X \subset R^n$
* $<>: X \times X \rightarrow R^{+}$
* $\alpha \in R$ 
* $+$ operacija sabiranja
* $\cdot$ operacija mnozenja skalarom


Ako vazi: 
* $<a, b> = <b, a>$
* $<a, b+c> = <a, b> + <a, c> $
* $<a, \alpha b> = \alpha <a, b>$
* $<a, a> \ge 0$
* $<a, a> = 0$ akko $a=0$
preslikavanje $<>$ nazivamo **skalarni proizvod**.

Ugao $\gamma$ izmedju vektora $a$ i $b$ je u vezi sa skalarnim proizvodom: $<a, b> = ||a||\cdot||b||\cdot cos(\gamma)$

Ako je $||a||=||b||=1$ tada je $<a, b> = cos(\gamma)$

### Kerneli 

Neka su dati podskup $X \subset R^n$ i preslikavanje $K: X \times X \rightarrow R$. Ako je matrica ciji su elementi vrednosti $K(x_i, x_j)$ pozitivno semidefinitna za sve izbore $x_1, ..., x_n \in X$ i prozvoljnu dimenziju $n \in R^{+}$, preslikavanje $K$ zovemo **pozitivno semidefinitni kernel**.  

#### Primeri kernela: 
    
* linearni kernel: $K(x, y) = x^Ty +c$
* polinomijalni kernel: $K(x, y) = (\alpha x^T y + c)^d$
* Gausov kernel: $K(x, y) = e ^{-\frac{||x-y||^2}{2\sigma^2}}$


<img src = 'assets/kernel_example.png'>

Intuitivno, kerneli predstavljaju meru slicnosti izmedju elemenata.