# Dobro došli u Deep Learning! #

U skopu ovih vježbi ćete naučiti sve što vam je potrebno za početak izgradnje vlastitih dubokih neuronskih mreža. Koristeći Keras i Tensorflow naučit ćete kako:
- stvoriti **potpuno povezanu** arhitekturu neuronske mreže
- primijeniti neuronske mreže na dva klasična ML problema: **regresija** i **klasifikacija**
- trenirati neuronske mreže sa **stohastičkim gradijentnim spuštanjem (SGD)**, i
- poboljšajte izvedbu pomoću **dropout-a**, **batch normalization** i drugih tehnika

Bilježnice će vas uvesti u te teme uz potpuno obrađene primjere, a zatim ćete u vježbama dublje istražiti te teme i primijeniti ih na skupove podataka iz stvarnog svijeta.

Započnimo!

# Što je duboko učenje? #

Neki od najimpresivnijih napredaka u umjetnoj inteligenciji posljednjih godina bili su u području *dubokog učenja*. Prevođenje prirodnog jezika, prepoznavanje slika i igranje igrica zadaci su u kojima su se modeli dubokog učenja približili ili čak premašili performanse na ljudskoj razini.

Dakle, što je duboko učenje? **Duboko učenje** je pristup strojnom učenju kojeg karakteriziraju duboki skupovi izračunavanja. Ova dubina izračuna je ono što je omogućilo modelima dubokog učenja da razdvoje vrste složenih i hijerarhijskih obrazaca koji se nalaze u najizazovnijim skupovima podataka u stvarnom svijetu.

Svojom snagom i skalabilnošću **neuralne mreže** postale su ključni model dubokog učenja. Neuronske mreže sastoje se od neurona, gdje svaki neuron pojedinačno izvodi samo jednostavno računanje. Snaga neuronske mreže dolazi iz složenosti veza koje ti neuroni mogu stvoriti.

# Linearna jedinica #

Pa počnimo s temeljnom komponentom neuronske mreže: pojedinačnim neuronom. Kao dijagram, **neuron** (ili **jedinica**) s jednim ulazom izgleda ovako:

<figure style="padding: 1em;">
<img src="figs/mfOlDR6.png" width="250" alt="Diagram of a linear unit.">
<figcaption style="textalign: center; font-style: italic"><center>Linearna jedinica: $y = w x + b$
</center></figcaption>
</figure>

Unos je `x`. Njegova veza s neuronom ima **težinu** koja je `w`. Kad god vrijednost teče kroz vezu, množite vrijednost s težinom veze. Za unos "x", ono što doseže neuron je "w * x". Neuronska mreža "uči" mijenjajući svoje težine.

`B` je posebna vrsta težine koju nazivamo **pristranost (bias)**. Pristranost nema nikakve ulazne podatke povezane s njom; umjesto toga, u dijagram stavljamo `1` tako da je vrijednost koja doseže neuron samo `b` (budući da je `1 * b = b`). Pristranost omogućuje neuronu modificiranje izlaza neovisno o svojim ulazima.

"y" je vrijednost koju neuron u konačnici daje. Da bi dobio izlaz, neuron zbraja sve vrijednosti koje prima putem svojih veza. Aktivacija ovog neurona je `y = w * x + b`, ili kao formula $y = w x + b$.

<blockquote style="margin-right:auto; margin-left:auto; background-color: #ebf9ff; padding: 1em; margin:24px;">
<strong>Izgleda li vam formula $y=w x + b$ poznato?</strong><br>
To je jednadžba pravca! To je jednadžba nagiba i presjeka, gdje je $w$ nagib, a $b$ je y odmak.
</blockquote>

# Primjer - Linearna jedinica kao model #

Iako će pojedinačni neuroni obično funkcionirati samo kao dio veće mreže, često je korisno započeti s modelom jednog neurona kao osnovnom linijom. Modeli jednog neurona su *linearni* modeli.

Razmislimo o tome kako bi ovo moglo funkcionirati na skupu podataka kao što je [80 Cereals](https://www.kaggle.com/crawford/80-cereals). Trenirajući model sa "sugars" (grami šećera po porciji) kao ulazom i "calories" (kalorije po porciji) kao izlazom, mogli bismo otkriti da je pristranost "b=90", a težina je "w= 2.5`. Kalorijski sadržaj žitarica s 5 grama šećera po porciji mogli bismo procijeniti ovako:

<figure style="padding: 1em;">
<img src="figs/yjsfFvY.png" width="1000" alt="Computing with the linear unit.">
<figcaption style="textalign: center; font-style: italic"><center>Računanje s linearnom jedinicom.
</center></figcaption>
</figure>

I, uspoređujući se s našom formulom, imamo $calories = 2.5 \times 5 + 90 = 102.5$, baš kao što očekujemo.

# Višestruki ulazi #

Skup podataka *80 Cereals* ima mnogo više značajki nego samo `'sugars'`. Što ako želimo proširiti naš model kako bismo uključili stvari poput sadržaja vlakana ili proteina? To je dovoljno jednostavno. Možemo samo dodati više ulaznih veza neuronu, jednu za svaku dodatnu značajku. Da bismo pronašli izlaz, pomnožili bismo svaki ulaz s težinom veze i zatim ih sve zbrojili.

<figure style="padding: 1em;">
<img src="figs/vyXSnlZ.png" width="300" alt="Three input connections: x0, x1, and x2, along with the bias.">
<figcaption style="textalign: center; font-style: italic"><center>Linearna jedinica s tri ulaza.
</center></figcaption>
</figure>

Formula za ovaj neuron bila bi $y = w_0 x_0 + w_1 x_1 + w_2 x_2 + b$. Linearna jedinica s dva ulaza će odgovarati ravnini, a jedinica s više ulaza od toga će odgovarati hiperravnini.

# Linearne jedinice u Kerasu #

Najlakši način za stvaranje modela u Kerasu je putem `keras.Sequential`, koji stvara neuronsku mrežu kao hrpu *layers*. Možemo izraditi modele poput ovih iznad koristeći *dense* sloj (o čemu ćemo naučiti više u nastavku).

Mogli bismo definirati linearni model koji prihvaća tri ulazne značajke (`'sugars'`, `'fibers'` i `'proteins'`) i proizvodi jedan izlaz (`'calories'`) ovako:

In [1]:
from tensorflow import keras
from tensorflow.keras import layers

# Create a network with 1 linear unit
model = keras.Sequential([
    layers.Dense(units=1, input_shape=[3])
])

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


S prvim argumentom, `units`, definiramo koliko izlaza želimo. U ovom slučaju samo predviđamo `'calories'`, pa ćemo koristiti `units=1`.

S drugim argumentom, `input_shape`, govorimo Kerasu dimenzije ulaza. Postavljanje `input_shape=[3]` omogućava da model dopušta tri ulaza kao značajke (`'sugars'`, `'fiber'`, i `'protein'`).

Ovaj je model sada spreman za prilagodbu podacima o vježbanju!

<blockquote style="margin-right:auto; margin-left:auto; background-color: #ebf9ff; padding: 1em; margin:24px;">
<strong>Zašto je <code>input_shape</code> Python lista?</strong><br>
Podaci koje ćemo koristiti u ovom tečaju bit će tablični podaci, kao u Panda dataframeu. Imat ćemo jedan unos za svaku značajku u skupu podataka. Značajke su raspoređene po stupcima, tako da ćemo uvijek imati <code>input_shape=[num_columns]</code>.

Razlog zašto Keras ovdje koristi listu je da dopusti korištenje složenijih skupova podataka. Slikovni podaci, na primjer, mogu zahtijevati tri dimenzije: <code>[visina, širina, kanali]</code>.
</blockquote>

# Zadatak #

[**Definiraj linearan model**](A_Single_Neuron_exercise_hr.ipynb) za *Red Wine Quality* dataset.

In [7]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from tensorflow import keras
from tensorflow.keras import layers

# Učitavanje dataseta s prilagođenim zaglavljima
url = "../Lab3_online/input/red-wine.csv"
data = pd.read_csv(url, sep=',', header=0)

# Razdvajanje features i target
X = data.drop('quality', axis=1)
y = data['quality']

# Normalizacija features
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Razdvajanje dataseta na train i test set
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Definiranje linearan model
model = keras.Sequential([
    layers.Dense(units=1, input_shape=[X_train.shape[1]])
])

# Kompilacija modela
model.compile(optimizer='adam', loss='mse', metrics=['mae'])

# Ispis strukture modela
model.summary()


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)
