# Lineární regrese

Úloha zaměřená na implementaci lineární regrese pomocí metody GD.

Data reprezentují výsledky zkoušky, konkrétně bodový zisk v závislosti na době studia.

In [None]:
import numpy as np
import usu
import matplotlib.pyplot as plt


In [None]:
def show_loss(iterations, loss):
    plt.plot(iterations, loss)
    plt.xlabel("Iterace")
    plt.ylabel("Loss")
    plt.title("Průběh trénování")
    plt.show()

## Data


In [None]:
npzfile = np.load('data/data_03.npz')
npzfile.files


In [None]:
x = npzfile['x0']
y = npzfile['x1']
usu.draw(x, y, "Vysledky zkousky", "Doba studia [hod]", "Vysledek [body]")


In [None]:
x.shape, y.shape # 100 radku a 1 sloupec


## GD (Gradient descent)

### Výpočet $\theta$:

#### Pomocí sumy:

$$ \theta_{i+1} = \theta_{i} - \alpha \sum_{n=0}^{N} \tilde{X_n} (\theta_i^T \tilde{X_n} - y_n) $$

kde $\alpha$ je velikost kroku, $n$ odpovídá jednotlivým řádkům vstupních matic.


**Příklad výpočtu první iterace:**

$$ \tilde{X} = \begin{bmatrix}
        1 & 1 \\
        1 & 2 \\
        1 & 3 \\
        \end{bmatrix} ,
     y =  \begin{bmatrix}
     15 \\
     20 \\
     30 \\
    \end{bmatrix},
    \theta_0 = \begin{bmatrix}
        0 \\
        0 \\
        \end{bmatrix},
        \alpha = 0.1$$
        
$$ 
\theta_1 = \begin{bmatrix}
        0 \\
        0 \\
        \end{bmatrix} - 0.1 \left[  (\begin{bmatrix} 0 & 0 \\ \end{bmatrix} \begin{bmatrix} 1 \\ 1 \\ \end{bmatrix} - 15)\begin{bmatrix} 1 \\ 1 \\ \end{bmatrix}) + (\begin{bmatrix} 0 & 0 \\ \end{bmatrix} \begin{bmatrix} 1 \\ 2 \\ \end{bmatrix} - 20)\begin{bmatrix} 1 \\ 2 \\ \end{bmatrix}) + (\begin{bmatrix} 0 & 0 \\ \end{bmatrix} \begin{bmatrix} 1 \\ 3 \\ \end{bmatrix} - 30)\begin{bmatrix} 1 \\ 3 \\ \end{bmatrix}) \right] = \begin{bmatrix} 6.5 \\ 14.5 \\ \end{bmatrix}
$$

 
#### Pomocí  matice:
Maticová implementace je řádově výpočetně efektivnější.

$$ \theta_{i+1} = \theta_{i} - \alpha \tilde{X^T} (\tilde{X} \theta_i - y) $$


**Poznámka:** Rovnice jsou stejné pro ruzné řády polynomů.


### Výpočet $\theta$ se zahrnutím regularizace:

$$ \theta_{i+1} = \theta_{i}(1-\alpha \lambda) - \alpha  \tilde{X^T} (\tilde{X} \theta_i - y) $$


In [None]:
def computeThetaGD(x, y, alpha=0.1, nIter=100, order=1, lmbd=0, plot_loss=False):
    """
    x - vektor vstupnich hodnot, doba studia
    y - vektor vystupnich  hodnot, zisk bodu
    alpha - krok
    nIter - pocet iteraci
    order - rad polynomu
    lmbd - regularizacni parametr lambda
    plot_loss - zobraz graf zavislosti lossu na iteraci
    """

    # pro kazdou iteraci vypoctete loss a zapiste ho na odpovidajici index v promenne
    loss = np.zeros(nIter)

    #################################################################
    # ZDE DOPLNIT
    
    ...
    
    #################################################################

    if plot_loss:
        show_loss(np.arange(nIter), loss)

    return theta


Kontrola výpočtu na malém množství dat:

In [None]:
a = np.array([1, 2, 3], ndmin=2).T
b = np.array([15, 20, 30], ndmin=2).T
theta = computeThetaGD(a, b, nIter=1)
print(theta)
#usu.draw(a, b, "Výsledky zkousky", "Doba studia[hod]", "Výsledek [body]", theta)


Určete zisk bodů v případě přípravy v délce 6 hodin. Všimněte si, jak silně $\alpha$ ovlivňuje výsledky:

In [None]:
alpha = 0.0001
iterations = 1500
theta = computeThetaGD(x, y, alpha, iterations, plot_loss=True)

#################################################################
# ZDE DOPLNIT
#valueY a valueX musi byt typu float

valueX = ...
valueY = ...

# Nejvhodnejsi rad polynomu a proc: ...

#################################################################

usu.draw(x, y, "Výsledky zkousky", "Doba studia[hod]", "Výsledek [body]", theta, valueX, valueY)


Určete dobu studia v případě zisku 10 bodů:


In [None]:
alpha = 0.001
iterations = 100

theta = computeThetaGD(x, y, alpha, iterations)
#print(theta)

#################################################################
# ZDE DOPLNIT
#valueY a valueX musi byt cisla!

valueY = ...
valueX = ...

#################################################################

usu.draw(x, y, "Výsledky zkousky", "Doba studia[hod]", "Výsledek [body]", theta, valueX, valueY)


Určete zisk bodů v případě přípravy v délce 4 hodin, řádu polynomu 2, $\lambda$ = 1, $\alpha$ = 
0.00001 a počtu iterací 15000:

In [None]:
order = 2
lmbd = 1
alpha = 0.00001
iterations = 15000

theta = computeThetaGD(x, y, alpha, iterations, order, lmbd)
#print(theta)

#################################################################
# ZDE DOPLNIT
#valueY a valueX musi byt cisla!

valueX = ...
valueY = ...

#################################################################

usu.draw(x, y, "Výsledky zkousky", "Doba studia[hod]", "Výsledek [body]", theta, valueX, valueY)


### Závěr:
rozhodněte, kdy je vhodnější použít pro nalezení parametrů $\theta$ metodu LSE a kdy GD:


## ADAM (bonus)

Odkaz na  článek: https://arxiv.org/pdf/1412.6980

In [None]:
def computeThetaADAM(x, y, alpha=0.1, beta1=0.9, beta2=0.999, epsilon=1e-8, nIter=100, order=1, lmbd=0, plot_loss=False):
    """
    x - vektor vstupnich hodnot, doba studia
    y - vektor vystupnich  hodnot, zisk bodu
    alpha - krok
    beta1 - mira utlumu odhadu prvniho momentu
    beta2 - mira utlumu odhadu druheho momentu
    epsilon - mala konstanta pro numerickou stabilitu
    nIter - pocet iteraci
    order - rad polynomu
    lmbd - regularizacni parametr lambda
    plot_loss - zobraz graf zavislosti lossu na iteraci
    """

    # pro kazdou iteraci vypoctete loss a zapiste ho na odpovidajici index v promenne
    loss = np.zeros(nIter)

    #################################################################
    # ZDE DOPLNIT
    
    ...
    
    #################################################################

    if plot_loss:
        show_loss(np.arange(nIter), loss)

    return theta


In [None]:
a = np.array([1, 2, 3], ndmin=2).T
b = np.array([15, 20, 30], ndmin=2).T
theta = computeThetaADAM(a, b, nIter=100)
print(theta)
#usu.draw(a, b, "Výsledky zkousky", "Doba studia[hod]", "Výsledek [body]", theta)


Určete zisk bodů v případě přípravy v délce 6 hodin. Všimněte si, jak silně $\alpha$ ovlivňuje výsledky.

Výhody metody ADAM se typicky projevují až na složitějších datasetech.

In [None]:
alpha = 0.01
iterations = 1000
order = 2
lmbd = 1
theta = computeThetaADAM(x, y, alpha=alpha, nIter=iterations, order=order, lmbd=lmbd, plot_loss=True)

#################################################################
# ZDE DOPLNIT
#valueY a valueX musi byt typu float

valueX = ...
valueY = ...

#################################################################

usu.draw(x, y, "Výsledky zkousky", "Doba studia[hod]", "Výsledek [body]", theta, valueX, valueY)
