# SVD
## Opis
Jedna od najkorisnijih dekompozicija je dekompozicija singularnih vrednosti (SVD - <i>singular value decomposition</i>). Ona nam pruža mogućnost rešavanja ili razumevanja problema koji su definisani sistemima jednačina zasnovanih na sigularnim ili blisko singularnim matricama. Dok druge metode ne pokazuju dobre rezultate u tim slučajevima.<br />
Ovaj metod ima široku primenu: 
1. rešavanje linearnih jednačina, 
2. za kompresiju podataka, u algoritmu za preporučivanje, 
3. za konstrukciju frekvencije reči u dokumentima, 
4. za računanje $2-norme$ itd.

Ne zahteva da matrica $A$ koju faktorišemo bude kvadratna.
Za $A$ dimenzija $p \times q$ postoji ortogonalna matrica $U$ dimenzija $p \times p$, dijagonalna matrica $\Sigma$ dimenzija $p \times q$ i ortogonalna matrica $V$ dimenzija $q \times q$
$$A=U \Sigma V^T$$
Predstavlja formulu SVD, međutim moguće je predstaviti je i sledećom formulom:
$$X=U' \Sigma' V^T$$
gde su $U$ dimenzija $p \times q$, $\Sigma$ dimenzija $q \times q$ i $V$ dimenzija $q \times q$. Ovakva formula predstavlja tanku SVD.
<br />Sledeća slika ilistruje formule.
![svd.png](svd.png)
<br />
$\Sigma$ se u računarstvu najčešće posmatra kao vektor dužine $q$, a formula može biti predstavljena kao suma matrica ranka-1 $\sum_{i}u_{i}\sigma_{i}v_{i}^T$, gde $\sigma_{i}$ predstavljaju singularne vrednosti (sa diagonale $\Sigma$ ), $u_{i}$ i $v_{i}$ su singularni vektori odnosno kolone $U$ i $V$
![svd-suma.png](svd-suma.png)
<br />
Važi da su:
1. Kolone matrice $U$ su sopstveni vektori $AA^T$ - levi singularni vektori matrice $A$
2. Kolone matrice $V$ su sopstveni vektori $A^TA$ - desni singularni vektori matrice $A$
3. Dijagonalni elementi $\Sigma$ - singularne vrednosti matrice $A$
4. Rang matrice A je broj $\sigma _i<>0$

Na osnovu prethodnog lako se može doći do sledećih formula:
<br />
$A^TA=V\Sigma^TU^TU\Sigma V^T=V\Sigma^T\Sigma V^T$
<br />
$AV=U\Sigma$
<br />
$det(A^TA-\lambda I)=0$ odavde je moguće izračunati $V$ i $\Sigma$, a zatim uvrštavanjem u prethodnu formulu i $U$

# Unapređenja algoritma
#### Složenost izračunavanja
Izračunavanje potpune singularne dekompozicije je računarski izuzetno zahtevno i potrebno je $\Theta(pq^2)$ operacija. Cilj je komplseksnost smanjiti na $O(pqr)$. Jako brzo nakon pojavljivanja računara i praktičnog SVD algoritma počelo tragati za efikasnijim metodima. Tako je nastala tanka SVD modifikacija i slične metode koje su se odnosile na promenu podataka u matrici.
<br />
#### Predlaganje unapređenja
Ovim naučnim radom se predlažu sledeće modifikacije i unapređenja:
1. modifikacije sabiranja,
2. rank-1 modifikacije,
3. smanjenje kompleksnosti

### Moguća redukcija
Ukoliko pretpostavimo da je redosled vrednosti $\sigma_{i}$ u neopadajućem poretku možemo eliminisati male vrednosti tako da ogranicimo $i < r < q$.<br />
Tada je $U$ dimenzija $p \times r$, $\sigma$ vektor dimenzije $r$ i $V$ dimenzija $r \times r$ i ovim smo dobili tanku SVD ranka-r.

## Modifikacija sabiranja

Ako je $X=USV^T$ onda za sabiranje želimo da postavimo modifikaciju tako da: $X+AB^T=$$\begin{bmatrix}U & A\end{bmatrix}$$ $$\begin{bmatrix} S & 0 \\ 0 & I \end{bmatrix}$$ $$\begin{bmatrix} V && B \end{bmatrix}$$^T$. U slučaju kad je $rank(X+AB^T) \leqslant r+c<min(p,q)$, matrice $U, V, A, B$ su visoke tanke.

Dalje ako je $P$ ortogonalna baza $(I-UU^T)A$ i $R_A=P^T(I-UU^T)A$ onda

$ $$\begin{bmatrix}U & A\end{bmatrix}$$ = $$\begin{bmatrix} U & P\end{bmatrix}$$ $$\begin{bmatrix}I & U^TA \\ 0 & R_A\end{bmatrix}$$ $

Slično je za $QR_B=(I-VV^T)B$.

Kombinacijom ovih formula dobijamo $X+AB^T=$$\begin{bmatrix}U & P\end{bmatrix}$$ K $$\begin{bmatrix}V & Q\end{bmatrix}$$^T$
![k.png](k.png)
Kada postavimo $U'^TKV'=S'$ tada $K$ proširuje prodprostore a $U'$ i $V'$ rotiraju $ $$\begin{bmatrix}U & P\end{bmatrix}$$ $ i $ $$\begin{bmatrix}V & Q\end{bmatrix}$$ $

![finalna-formula.png](finalna-formula.png)

## Rank-1 modifikacije
Praktično se koristi tabela operacija sa SVD vrednostima koje znamo da izračunamo za tu operaciju, kao traženu koju možemo postići zamenom odgovarajućih $a$ i $b^T$ 

Za proširivanje:
$a=c, b^T=[0,0,...,1]$

Za smanjivanje:
$a=-c, b^T=[0,0,...,1]$

Za zamenu:
$a=d-c, b^T=[0,0,...,1]$

Za ponovno centriranje:
$a=X*(I-(1/q)ll^T), b^T=l^T=[1,1,...,1]$
![modifications](rank-1.png)

Ako uzmemo da važi
![m](m.png)
![n](n.png)
računanje $K$ se svodi u slučaju proširivanja na
![prosirivanje](k-prosirivanje.png)
što može biti izvršeno u $O(r^2)$, a u slučaju smanjivanja na
![smanjivanje](k-smanjivanje.png)
se može rešiti bez $P$ i $Q=(b-Vn)/\sqrt{1-n^Tn}$ korišćenjem samo $i$tog reda $V$

In [24]:
def svd_upd(V, c):
    #prosirujemo V
    #V = np.vstack([V, np.zeros(V.shape[1])])
    #kreiramo b i punimo 0
    b = np.zeros(V.shape[0])
    #dodajemo 1 na kraj
    b[-1] = 1
    #transponujemo
    b = np.reshape(b, (b.shape[0], 1))
    #punimo a
    a = np.reshape(c, (-1, 1))
    return a,b
def svd_down(V, X):
    #kreiramo b i punimo 0
    b = np.zeros(V.shape[0])
    b[-1] = 1
    #transponujemo
    b = np.reshape(b, (b.shape[0], 1))
    #punimo a
    a = np.reshape(np.multiply(X[:,-1], -1), (-1, 1))
    return a,b
def svd_rev(V,X, c):
    #prosirujemo V
    V = np.vstack([V, np.zeros(V.shape[1])])
    #kreiramo b i punimo 0
    b = np.zeros(V.shape[0])
    b[-1] = 1
    #transponujemo
    b = np.reshape(b, (b.shape[0], 1))
    #punimo a
    a = np.reshape(X[:,-1] - c, (-1, 1))
    return a,b
def svd_recenter(V, X):
    #kreiramo b i punimo 1
    ones = np.ones(V.shape[1])
    b = np.reshape(ones, (-1, 1))
    #parametri potrebni za a
    n = np.reshape(np.dot(np.transpose(V), b), (-1, 1))
    q = b - np.dot(V, n)
    #punimo a
    a = np.reshape(np.multiply((-1/q), np.dot(X, b)), (-1, 1))
    return a,b

Pored toga potrebno nam je i:

$m=U^T*a$

$p=a-U*m$

$Ra=||p||$

$P=\frac {p} {Ra}$

$n=V^T*b$

$q=b-V*n$

$Rb=||q||

$Q=\frac {q} {Rb}$

$K=
\begin{bmatrix}
    S   &    0 \\
    0   &   0 \\
\end{bmatrix}
+
\begin{bmatrix}
    m \\
    ||p|| \\
\end{bmatrix}
\begin{bmatrix}
    n \\
    ||q|| \\
\end{bmatrix}^T$

In [25]:
def rediagonalization(U,S,V,a,b):
    m = np.reshape(np.dot(np.transpose(U), a), (-1, 1))
    p = np.reshape(a - np.dot(U, m), (-1, 1))
    Ra = np.linalg.norm(p)
    P = np.reshape(np.multiply((1 / Ra), p), (-1, 1))
    n = np.reshape(np.dot(np.transpose(V), b), (-1, 1))
    q = b - np.dot(V, n)
    Rb = np.linalg.norm(q)
    Q = np.reshape(np.multiply((1 / Rb), q), (-1, 1))

    k = S
    K = np.zeros((k.shape[0] + 1, k.shape[0] + 1))
    K[:-1,:-1] = k
    stack = np.vstack(np.append(m, Ra))
    t = np.reshape(np.append(n, Rb), (1, -1))
    dot = np.dot(stack, t)
    K = np.add(K, dot)
    return K

In [26]:
#op predstavlja operaciju koja se izvrsava
#0-upd,1-dwn,2-rev,3-rec
def svd(U,S,V,X,c=None,op=0):
    if op==0:
        if type(c)==type(np.array([])):
            a, b = svd_upd(V, c)
        else:
            return None,None,None
    elif op==1:
        a, b = svd_down(V, X)
    elif op==2:
        if type(c)==type(np.array([])):
            a, b = svd_rev(V, X, c)
        else:
            return None,None,None
    elif op==3:
        a, b = svd_recenter(V, X)
    else:
        return None,None,None
    
    k=rediagonalization(U,S,V,a,b)
    
    Sn, Vn=np.linalg.eig(k)
    Sn=np.diag(Sn)
    Un=np.transpose(np.linalg.inv(Vn))
    
    return Un, Sn, Vn

In [27]:
Un, Sig, Vn = svd(U,S,V,X,c,op=0)
Un, Sig, Vn

NameError: name 'c' is not defined

In [12]:
import time
import pandas as pd

RANK = 1
N_COLS = 10

def evaluate_svd(svd_fn, reconstruct_fn, min_rows=10, max_rows=50, n_samples=10, n_cols=N_COLS, rank=RANK, random_seed=0):
    np.random.seed(random_seed)
    elapsed_times = []
    errors = []
    n_rows_array = np.random.randint(low=min_rows, high=max_rows + 1, size=n_samples)
    n_rows_array.sort()
    
    for n_rows in n_rows_array:
        # construct a low-rank matrix
        left = np.random.randn(n_rows, rank)
        right = np.random.randn(rank, n_cols)
        full = np.dot(left, right)

        # how long does it take to perform the SVD?
        start_t = time.time()
        svd_outputs = svd_fn(full)
        end_t = time.time()
        elapsed_t = end_t - start_t
        elapsed_times.append(elapsed_t)

        # compute mean absolte error of reconstruction 
        reconstructed = reconstruct_fn(svd_outputs)
        diff = full - reconstructed
        mae = np.mean(np.abs(diff))
        errors.append(mae)
        print("n_rows=%d ==> time = %0.4f, MAE = %0.8f" % (n_rows, elapsed_t, mae))
    max_error = np.max(errors)
    print("Max Error=%f" % max_error)
    assert max_error < 0.0000001
    return n_rows_array, elapsed_times, errors 

def np_svd(X):
    return np.linalg.svd(X, full_matrices=False, compute_uv=True)

def np_inv_svd(svd_outputs):
    U, s, V = svd_outputs
    return np.dot(U, np.dot(np.diag(s), V))

In [13]:
n_rows, np_times, np_errors = evaluate_svd(np_svd, np_inv_svd)

n_rows=10 ==> time = 0.0000, MAE = 0.00000000
n_rows=13 ==> time = 0.0010, MAE = 0.00000000
n_rows=13 ==> time = 0.0000, MAE = 0.00000000
n_rows=16 ==> time = 0.0000, MAE = 0.00000000
n_rows=19 ==> time = 0.0000, MAE = 0.00000000
n_rows=29 ==> time = 0.0000, MAE = 0.00000000
n_rows=31 ==> time = 0.0000, MAE = 0.00000000
n_rows=33 ==> time = 0.0000, MAE = 0.00000000
n_rows=46 ==> time = 0.0000, MAE = 0.00000000
n_rows=49 ==> time = 0.0000, MAE = 0.00000000
Max Error=0.000000


# Reference:
1. Mladen Nikolić, Anđelka Zečević, <i>Naučno izračunavanje</i>, 2017, http://ni.matf.bg.ac.rs/materijali/ni.pdf

2. Matthew Brand, <i>Fast low-rank modifications of the thin singular value decomposition</i>, 2006, http://www.sciencedirect.com/science/article/pii/S0024379505003812


