** Podsećanje na rad sa matricama ** 

In [2]:
import numpy as np

In [3]:
M = np.array([[2, 3, 4], [-1, 2, 3], [4, 3, 22]])

In [4]:
M.shape

(3, 3)

In [5]:
M.dtype

dtype('int64')

In [6]:
M[1, 1]

2

Python paket koji podržava osnovne funkcionalnosti u radu sa matricama kao što su izračunavanje determinanti, normi, inverza matrice, sopstvenih vrednosti i sopstvenih vektora, kao i razne vrste dekompozicija matrice je **numpy.linalg**.


In [7]:
dir(np.linalg)

['LinAlgError',
 '__builtins__',
 '__doc__',
 '__file__',
 '__name__',
 '__package__',
 '__path__',
 '_numpy_tester',
 '_umath_linalg',
 'absolute_import',
 'bench',
 'cholesky',
 'cond',
 'det',
 'division',
 'eig',
 'eigh',
 'eigvals',
 'eigvalsh',
 'info',
 'inv',
 'lapack_lite',
 'linalg',
 'lstsq',
 'matrix_power',
 'matrix_rank',
 'multi_dot',
 'norm',
 'pinv',
 'print_function',
 'qr',
 'slogdet',
 'solve',
 'svd',
 'tensorinv',
 'tensorsolve',
 'test']

** Norme matrica **

In [8]:
?np.linalg.norm

In [9]:
M

array([[ 2,  3,  4],
       [-1,  2,  3],
       [ 4,  3, 22]])

** L1 norma ** matrice (maksimalni zbir apsolutnih vrednosti kolone)

$\|M\|_{1} = max_{1\leq j \leq n} \sum_{i=1}^{n}|m_{ij}|$  

In [10]:
L1 = np.linalg.norm(M, ord = 1)
L1

29.0

**L2 norma** jer koren maksimalne singularne vrednosti matrice $M^{*}M$ pri čemu je $M^{*}=(\overline{m_{ji}})$

In [11]:
L2 = np.linalg.norm(M, ord = 2)
L2

23.242882345897012

** Frobeniusova norma ** matrice  (često se naziva i euklidska norma)  
$\|M\|_{frob} = \sqrt{\sum_{i=1}^{n} \sum_{j=1}^{m} a_{ij}^2}$  

In [12]:
Lfro = np.linalg.norm(M, ord = 'fro')
Lfro

23.49468024894146

Za odnos L2 i Frobeniusove norme važi 
$\|M\|_{2}\leq \|M\|_{frob} \leq \sqrt{n}\cdot\|M\|_{2}$ 
pa se često Frobeniusova norma koristi kao aproksimacija L2 norme zbog jednostavnijeg izračunavanja.

** Uniformna norma ** matrice  (maksimalni zbir apsolutnih vrednosti vrste)  
$\|M\|_{\infty} = max_{1\leq i \leq n} \sum_{j=1}^{m}|a_{ij}|$  

In [13]:
Linf = np.linalg.norm(M, ord = np.inf)
Linf

29.0

U prostoru konačne dimenzije ($R^n$ ili $R^{nxm}$ su slučajevi koje razmatramo) sve norme su međusobno ekvivalentne. To znači da za dve norme $\|\|_{n1}$ i $\|\|_{n2}$ postoje pozitivne konstante $c_1$ i $c_2$ takve da je $c_1\cdot\|x\|_{n1}\leq \|x\|_{n2} \leq c_2\cdot\|x\|_{n1}$  

** Uslovljenost matrice ** 

Uslovljenost matrice je broj $cond(A) = \|A\| \|A^{-1}\|$  

Po definiciji, uslovljenost singularne matrice (matrica čija je determinanta 0) je $+\infty$  

Odavde važi da je $1\leq cond(A) \leq +\infty$  

Ako je cond(A) *malo* matrica je dobro uslovljena.  

Ako je cond(A) *veliko* matrica je loše uslovljena.

Uslovoljenost matrice nam služi za ocenu numeričke stabilnosti.

In [14]:
M

array([[ 2,  3,  4],
       [-1,  2,  3],
       [ 4,  3, 22]])

In [15]:
invM =  np.linalg.inv(M)
invM

array([[ 0.2734375, -0.421875 ,  0.0078125],
       [ 0.265625 ,  0.21875  , -0.078125 ],
       [-0.0859375,  0.046875 ,  0.0546875]])

In [16]:
# izracunavanje uslovljenosti matrice po definiciji
condM = np.linalg.norm(M, 'fro') * np.linalg.norm(invM, 'fro')
condM

14.670402282316594

In [14]:
# podrazumevano se koristi L2 norma matrice 
np.linalg.cond(M)

11.905371208808212

** Zadatak: **  
Rešiti jednačinu AX=b

In [16]:
A = np.array([[1, 2], [2, 3.999]])
A

array([[ 1.   ,  2.   ],
       [ 2.   ,  3.999]])

In [17]:
B = np.array([4, 7.999])
b = B.transpose()
b

array([ 4.   ,  7.999])

In [18]:
# resenje po definiciji
X = np.linalg.inv(A).dot(b)
X

array([ 2.,  1.])

In [19]:
# male promene u vrednosti vektora b uzrokuju velike promene u resenju sistema
A1 = A.copy() 
B1 = B.copy() 
B1[0] =  B1[0] + 0.001 
B1[1] =  B1[1] - 0.001 
b1 = B1.transpose()
b1

array([ 4.001,  7.998])

In [207]:
X1 = np.linalg.inv(A1).dot(b1)
X1

array([-3.999,  4.   ])

In [20]:
# takodje, male promene u vrednostima matrice A uzrokuju velike promene u resenju sistema
A2 = A.copy() 
A2[0, 0] += 0.001
A2[0, 1] += 0.001
A2[1, 0] += 0.001
A2[1, 1] -= 0.001
B2 = B.copy() 
b2 = B2.transpose()

In [21]:
X2 = np.linalg.inv(A2).dot(b2)
X2

array([ 6.98901648, -1.49725412])

In [22]:
# namece se zakljucak da je matrica lose uslovljena
np.linalg.cond(A)

24992.00096006945

** Pitanje: ** da li se uslovljenost matrice dovodi u vezu sa determinantom? Razmotriti primer matrice $k \cdot A$.

** Metod najmanjih kvadrata **

Ideja je rešiti optimizacioni problem $min_{x} \|A\cdot x - b\|^2$


#### Primer korišćenja metode najmanjih kvadrata u rešavanju preuslovljenih sistema 

Sistem $Ax = b$ je preuslovljen ako je matrica $A$ dimenzije $m\times n$ i važi $m>n$.  

Rešenje je oblika $x=(A^{T}A)^{-1}A^{T}b$

In [17]:
A = np.array([[2, 0], [-1, 1], [0, 2]])
A

array([[ 2,  0],
       [-1,  1],
       [ 0,  2]])

In [18]:
B = np.array([1, 0, -1])
b = B.transpose()
b

array([ 1,  0, -1])

In [19]:
X = np.dot(np.dot(np.linalg.inv(np.dot(A.transpose(), A)), A.transpose()), b)
X

array([ 0.33333333, -0.33333333])

In [20]:
## RSS - residual square sum se koristi za ocenu greske
RSS = np.linalg.norm(A.dot(X) - b)**2
RSS

0.66666666666666663

Na nivou **linalg** paketa postoji metod **lstsq** kojim se rešavaju jednačine oblika **Ax = b**. 

Pored samog rešenja, metod izračunava sumu kvadrata reziduala, rang matrice i singularne vrednosti matrice A.

In [215]:
?np.linalg.lstsq

In [216]:
A1 = A.copy()
b1 = b.copy()
X1, RSS1, rank, singular_values = np.linalg.lstsq(A1, b1)
X1

array([ 0.33333333, -0.33333333])

In [217]:
RSS1

array([ 0.66666667])

#### Primer korišćenja metode najmanjih kvadrata u domenu linearne regresije

Linearna regresija je statistička metoda kojom se modeluje zavisnost između veličina. Ako je $X$ ulazna (nezavisna), a $Y$ izlazna (zavisna) veličina, zadatak je odrediti funkciju $f$ za koju je $Y=f(X)$. Forma zavisnosti koja se pretpostavlja je linearna tj. oblika $f(X)=\beta_{0}+\beta_{1}X$ gde su $\beta_{0}$ i $\beta_{1}$ parametri koje treba odrediti. 

Oblik za opšti slučaj sa većim brojem ulaznih veličina je $f(X_1, X_2, \ldots, X_n) = \beta_{0} + \beta_{1}X_1 + \ldots + \beta_{n}X_n$.

**Zadatak**:  
Ako su poznati skupovi parova vrednosti (0, 1.2), (0.5, 2.05), (1, 2.9), (-0.5, 0.1), odrediti koeficijente (parametre) linearne regresije.  

Tačke su birane tako da približno odgovaraju zakonitosti Y = 2x+1.


Računanje koeficijenata korišćenjem pomenute **lstsq** metode linalg paketa za A=[1 X] i b=Y

In [25]:
# vektori ulazne i izlazne velicine 
X = np.array([0, 0.5, 1, -0.5])
Y = np.array([1.2, 2.05, 2.9, 0.1])

# dimenzija vektora
n = X.shape[0]

In [26]:
#A = np.transpose(np.array([np.ones(n), X]))
A = np.vstack((np.ones(n), X)).T
A

array([[ 1. ,  0. ],
       [ 1. ,  0.5],
       [ 1. ,  1. ],
       [ 1. , -0.5]])

In [27]:
np.linalg.lstsq(A, Y)

(array([ 1.1 ,  1.85]), array([ 0.01875]), 2, array([ 2.0858526,  1.0720163]))

Do rešenja problema $min_{\beta_0, \beta_1}\|Y - (\beta_0+\beta_1X)\|$  se moglo doći i računanjem parcijalnih izvoda po $\beta_0$ i $\beta_1$ i njihovim izjedanačavanjem sa nulom.  

Time se dobijaju formule: 

$\beta_1 = \frac{\sum_{i=1}^{n}{(x_i-\overline{x})(y_i-\overline{y})}}{\sum_{i=1}^{n}{(x_i-\overline{x})^2}}$ i
$\beta_0 = \overline{y}-\beta_1\overline{x}$ u kojima su $\overline{x}$ i $\overline{y}$ srednje vrednosti veličina.


In [226]:
X = np.array([0, 0.5, 1, -0.5])
Y = np.array([1.2, 2.05, 2.9, 0.1])
x = X.mean()
y = Y.mean()
beta1 = np.sum((X-x)*(Y-y))/(np.sum((X-x)*(X-x)))
beta0 = y - beta1*x
(beta0, beta1)

(1.1000000000000001, 1.8499999999999996)

Rešenje problema korišćenjem ** scikit_learn ** paketa 

In [218]:
from sklearn import linear_model 
reg = linear_model.LinearRegression()
?linear_model.LinearRegression

In [219]:
X = np.array([0, 0.5, 1, -0.5]).reshape(4, 1)
X

array([[ 0. ],
       [ 0.5],
       [ 1. ],
       [-0.5]])

In [220]:
Y = np.array([1.2, 2.05, 2.9, 0.1])
Y

array([ 1.2 ,  2.05,  2.9 ,  0.1 ])

In [221]:
reg.fit(X, Y)

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)

In [222]:
reg.coef_

array([ 1.85])

In [223]:
reg.intercept_

1.1000000000000001

In [224]:
reg.predict(2)

array([ 4.8])