# Duboke neuronske mreže 

<center><img src="Images/V4_banner.png" width="700" height="700"/></center>

Dubokom neuronskom mrežom smatra se neuronska mreža koja ima više skrivenih slojeva povezanih u nizu. Drugim riječima ova neuronska mreža ima izrazito veliki broj parametara koji se nerijetko broji u milijunima. No za početak, potrebno je proučiti što se dešava kada neuronska mreža ima više ulaznih i više izlaznih podataka.

---

## Više ulaznih neurona

Neuronska mreža tipično nema samo jedan ulazni podataka već više njih. Ulazni podatak također može biti složen poput teksta ili slike te zahtjeva poseban pristup prilikom obrade -- ali o tome će biti više riječi u idućim vježbama.

U prethodnoj vježbi potrebno je bilo modificirati **dataloader** kako bi mogao učitati više podataka. Idući programski kod implementira učitavanja i vraćanje dvije ulazne i jedne izlazne varijable za skup podataka **bike_rental**.

---

<font color='green'>
    
## Primjer

<left><img src="Images/Zadatak.png" width="70" height="70"/></left>

</font>

Poručite navedeni programski kod i iznesite ključna zapažanja.

---


In [None]:
# Autoreload
%load_ext autoreload
%autoreload 2

# Pokretanje skripte 
from Skripte.Vjezba4.dataloader import inspect_dataset
inspect_dataset("Skripte/Vjezba3/day_bikes_rental.csv")

In [None]:
# Učitavanje knjižnice
from Skripte.Vjezba4.dataloader import bikeRentalDatasetTwoInputs, ordinary_dataloader

# Dataset
_dataset = bikeRentalDatasetTwoInputs(path_to_csv = "Skripte/Vjezba4/day_bikes_rental.csv",
                                      input_label1 = "season",
                                      input_label2 = "temp",
                                      target_label = "cnt")

# Dataloader
_dataloader = ordinary_dataloader(dataset = _dataset,
                                  batch_size = 1)

# Iterirajmo kroz nekliko podataka
for _i, _item in enumerate(_dataloader):
    print(_item)
    if _i == 10:
        break

---

## Izgradnja modela sa dvije ulazne varijable

<font color='green'>
    
## Zadatak

<left><img src="Images/Zadatak.png" width="70" height="70"/></left>

</font>


Model sa dvije ulazne varijable, dakle $x_1$ i $x_2$, sa tri skrivena neurona i jednim izlaznim neuronom ima puno više parametara od modela sa jednom ulaznom varijablom. 

Vaš je zadatak implementirati model **model_2_3_1**  koristeći prethodno dani opis modela sa dva ulazna neurona/podatka, tri skrivena neurona te jednim izlaznim neuronom. Predložak modela implementiran je u skripti *model_2d.py*. Nakon implementacije odgovorite na sljedeća pitanja:

* Koliko se povećava kompleksnost model - odnosno koliko parametara ima model?
* Nakon što ste implementirali model, proučite kako se generira 2D izlazni prostor. Koje zaključke možete donjeti?
* Vježbajte skiciranje izlaznog prostora za dani skup značajki.


In [None]:
# Učitavanje knjižnice
import numpy as np
from sklearn.metrics import mean_squared_error
from Skripte.Vjezba4.dataloader import bikeRentalDatasetTwoInputs, ordinary_dataloader
from Skripte.Vjezba4.model_2d import model_2_3_1, plot_graph, print_model_summary

In [None]:
# Dataset
_dataset = bikeRentalDatasetTwoInputs(path_to_csv = "Skripte/Vjezba4/day_bikes_rental.csv",
                                      input_label1 = "season",
                                      input_label2 = "temp",
                                      target_label = "cnt",
                                      normalizacija = True)

# Dataloader
_dataloader = ordinary_dataloader(dataset = _dataset,
                                  batch_size = 1)

# Model
## Postavljanje parametara
_theta_init = np.array([[0.0, 1.0, 2.5],
                       [0.5, 2.0, 1.5],
                       [-0.3, -1.0, 0.3]], dtype=float)  

_psi_init   = np.array([1.0, 0.8, -0.2, 0.5], dtype=float) 

## Inicijalizacija modela
_model = model_2_3_1(theta_init_matrix = _theta_init,
                     psi_init_matrix = _psi_init,
                     activation_function = "relu")

# Iterirajmo kroz nekliko podataka i snimimo rezultate
_ground_truth = []
_predictions = []
for _i, _item in enumerate(_dataloader):
    _x1, _x2, _y = _item
    # predikcija
    _y_hat = _model(_x1, _x2)

    # Snimanje
    _ground_truth.append(_y.detach().cpu().item())
    _predictions.append(_y_hat.detach().cpu().item())

    # Results
    print(f"x1:{_x1}, x2:{_x2}, y:{_y}, y_hat:{_y_hat}")
    
    # Early stop
    if _i == 10: break

# MSE, ukoliko je dobro implementirano mora biti 
_mse = mean_squared_error(_predictions, _ground_truth)
print("-----------------------------------------------")
print(f"Calculated MSE:{_mse}, expected MSE: 1.2073869")

In [None]:
# Ispis osnovnog opisa modela (inspekcija broja parametara)
print_model_summary(model = _model,
                   device = "cpu",
                   input_dim = [(1,), (1,)])

In [None]:
# Iscrtavanje grafa modela (inspekcija povezanosti slojeva)
plot_graph(model = _model,
           device = "cpu",
           input_dim = [(1,), (1,)])

---

In [None]:
# Učitavanje knjižnice
from Skripte.Vjezba4.plot import create_model_2_3_1_component_plots_widget
create_model_2_3_1_component_plots_widget(device = "cpu")

---
---

## Izgradnja modela sa dvije izlazne varijable

<font color='green'>
    
## Zadatak

<left><img src="Images/Zadatak.png" width="70" height="70"/></left>

</font>


Model sa jednom ulaznom varijablom, sa tri skrivena neurona i dvama izlaznim neuronima($y_1 i y_2$), ima više parametara od modela sa jednom ulaznom varijablom i jednom izlaznom varijablom. 

Vaš je zadatak implementirati model **model_1_3_2**  koristeći prethodno dani opis modela sa dva ulazna neurona/podatka, tri skrivena neurona te jednim izlaznim neuronom. Predložak modela implementiran je u skripti *model_2d.py*. Nakon implementacije odgovorite na sljedeća pitanja:

* Koliko se povećava kompleksnost model - odnosno koliko parametara ima model?
* Nakon što ste implementirali model, proučite [to je izlaz navedenog modela. Koje zaključke možete donjeti?
* Vježbajte skiciranje izlaznog prostora za dani skup značajki.
* Koji sve parametri utječu na izlaz neuronske mreže.

In [None]:
# Učitavanje knjižnice
import numpy as np
from sklearn.metrics import mean_squared_error
from Skripte.Vjezba4.dataloader import bikeRentalDatasetTwoOutputs, ordinary_dataloader
from Skripte.Vjezba4.model_2d import model_1_3_2, plot_graph, print_model_summary

In [None]:
# Dataset
_dataset = bikeRentalDatasetTwoOutputs(path_to_csv = "Skripte/Vjezba4/day_bikes_rental.csv",
                                       input_label = "temp",
                                       target_label1 = "casual",
                                       target_label2 = "registered",
                                       normalizacija = True)

# Dataloader
_dataloader = ordinary_dataloader(dataset = _dataset,
                                  batch_size = 1)

# Model
## Postavljanje parametara
_theta_init = np.array([[0.0, 1.0],
                       [0.5, 2.0],
                       [-0.3, -1.0]], dtype=float)

_psi_init   = np.array([[1.0, 0.8, -0.2, 0.5], 
                        [2.0, -0.8, 0.1, 1.2]], dtype=float)

## Inicijalizacija modela
_model = model_1_3_2(theta_init_matrix = _theta_init,
                     psi_init_matrix = _psi_init,
                     activation_function = "relu")

# Iterirajmo kroz nekliko podataka i snimimo rezultate
_ground_truth1 = []
_ground_truth2 = []
_predictions1 = []
_predictions2 = []
for _i, _item in enumerate(_dataloader):
    _x, _y1, _y2 = _item
    # predikcija
    _y_hat1,_y_hat2 = _model((_x,))

    # Snimanje
    _ground_truth1.append(_y1.detach().cpu().item())
    _ground_truth2.append(_y2.detach().cpu().item())
    _predictions1.append(_y_hat1.detach().cpu().item())
    _predictions2.append(_y_hat2.detach().cpu().item())

    # Results        print("TU", _y1, _y2)

    print(f"x:{_x}, y:{_y1}, y:{_y2}, y_hat_1:{_y_hat1}, y_hat_2:{_y_hat2}")
    
    # Early stop
    if _i == 10: break

# MSE, ukoliko je dobro implementirano mora biti prema zadanim brojevima
_mse1 = mean_squared_error(_predictions1, _ground_truth1)
_mse2 = mean_squared_error(_predictions2, _ground_truth2)

print("-----------------------------------------------")
print(f"Calculated MSE1:{_mse1}, expected MSE: 0.6694325,\nCalculated MSE1:{_mse2}, expected MSE: 3.14305520")

In [None]:
# Ispis osnovnog opisa modela (inspekcija broja parametara)
print_model_summary(model = _model,
                   device = "cpu",
                   input_dim = (1,))

In [None]:
# Iscrtavanje grafa modela (inspekcija povezanosti slojeva)
plot_graph(model = _model,
           device = "cpu",
           input_dim = (1,))

In [None]:
# Učitavanje knjižnice
from Skripte.Vjezba4.plot import create_model_1_3_2_component_plots_widget
create_model_1_3_2_component_plots_widget(device = "cpu")


---

## Broj regija i broj parametara neuronske mreže

Svaka neuronska mreža, kako je do sada prikazano, ima svojstvo da opisuje određni dio prostora. Koliko kompleksno neuoronska mreža može opisati prostor uvelike ovisi o broju parametara što je direktno povezano sa brojem neurona u neuronskoj mreži. Tako se za neuronsku mrežu sa $D_i$ ulaznih neurona i sa $D$ skrivenih neurona kao što je prikazano na sljedećo slici vrijedi sljedeći izračun (Zaslavskyeva formula) za broj regija:

\begin{equation}N = \sum_{j=0}^{D_{i}}\binom{D}{j}=\sum_{j=0}^{D_{i}} \frac{D!}{(D-j)!j!} \end{equation} 

Te izračun za broj parametara:

\begin{equation} N = (D_{i}+1) \cdot D + D + 1 \end{equation} 


<center><img src="Images/V4_NN.png" width="350" height="350"/></center>

---

<font color='red'>
    
## Zadatak

<left><img src="Images/Zadatak.png" width="70" height="70"/></left>

</font>

Implementirajte funkcije koja će za dani broj ulaznih neurona, skrivenih neurona i jednog izlaznog neurona računati broj regija i parametara.
Funkcije za crtanje će skicirati broj regija i parametara na grafu koristeći implementirane funkcije. Funkcije je potrebno implementirati u skripti **Skripte.Vjezba4.broj_regija_i_parametara.py** prema danim predlošcima.

Odgovorite na pitanja:

* Iznesite zaključke o relaciji parametara $D_i$ i $D$ u odnosu na broj regija.
* Kako su korelirani broj parametara i broj regija.
* Kako $D_i$ a kako $D$ utječe na broj parametara.
* Izračunajte na papiru broj regija i parametara za sljedeće vrijednosti (rezultate provjerite pomoću implementiranih funckija):

  * $D_i = 1$, $D = 3$,
  * $D_i = 2$, $D = 3$,
  * $D_i = 2$, $D = 5$,
  * $D_i = 10$, $D = 3$,
  * $D_i = 3$, $D = 10$
  


In [None]:
# Knjižnice
from Skripte.Vjezba4.broj_regija_i_parametara import broj_regija, broj_parametara, create_regions_widget_D, create_regions_widget_Di
create_regions_widget_D()

In [None]:
create_regions_widget_Di()

---

## Kompozicija neuronskih mreža

Do sada su svi primjeri imali jednostavne neuronske mreže koje su se sastojale od ulaznog sloja, skrivenog sloja te izlaznog sloja. Da bi neuronska mreža postala dubokom, potrebno je da se sastoji od više skrivenih slojeva. Kako bi dobili intuiciju, prikazati će se najjednostavnija kompozicija neuronskih mreža u kojoj prva neuronska mreža ima jedan izlaz koji je ujedno i ulaz u drugu neurosnku mrežu. Proučite sljedeću sliku:


<center><img src="Images/V4_NN2.png" width="500" height="500"/></center>

---

<font color='red'>
    
## Zadatak

<left><img src="Images/Zadatak.png" width="70" height="70"/></left>

</font>

Idući programski kod definira dvije neuronske mreže $net_1$ i $net_2$ te od njih radi kompoziciju, kao što je prikazano na slici. Vaš je zadatak proučiti kako se formira konačni izlaz te samostalno nacrtati izlaz kompozitne neuronske mreže. Implementirano je nekoliko verzija neuronskih mreža te slobodno eksperimentirajte sa različitima.

In [None]:
from Skripte.Vjezba4.plot import create_model_1_3_1_presets_widget
create_model_1_3_1_presets_widget()

---

## MLP - Multi-Layer Perceptron

Na poslijetku, kombinacijom kompozicije neuronskih mreža i prethodno viđenih neuronskih mreža dobivamo MLP - Multi Layer Perceptron oblika kao na slici:

<center><img src="Images/V4_NN3.png" width="500" height="500"/></center>

---


<font color='red'>
    
## Zadatak

<left><img src="Images/Zadatak.png" width="70" height="70"/></left>

</font>

U skripti **Skripte/Vjezba4/mlp.py** implementiran je MLP sa slike koristeći PyTorch *Linear* funkciju i *Sequntial* kao omotač. Proučite na internetu što rade navedene funkcije te implemntirajte identičnu neuronsku mrežu koristeći funkcije u prethodnim primjerima. Dobivene neuronske mreže usporedite pomoću *print_model_summary* i *plot_graph funkcija*.

In [None]:
# Učitavanje knjižica
from Skripte.Vjezba4.mlp import MLP_1_3_3_1
from Skripte.Vjezba4.model_2d import plot_graph, print_model_summary

In [None]:
_model = MLP_1_3_3_1()

In [None]:
# Ispis osnovnog opisa modela (inspekcija broja parametara)
print_model_summary(model = _model,
                   device = "cpu",
                   input_dim = (1,))

In [None]:
# Iscrtavanje grafa modela (inspekcija povezanosti slojeva)
plot_graph(model = _model,
           device = "cpu",
           input_dim = (1,))