# Nadgledano učenje

Nadgledano učenje (Supervised Learning) je jedan od najčešće korišćenih pristupa u mašinskom učenju. U ovom pristupu, model se trenira na skupu podataka sa poznatim ulazima (X) i izlazima (y), pri čemu je cilj modela da nauči vezu između ulaznih i izlaznih podataka. Kada se model obuči, može se koristiti za predviđanje izlaznih vrednosti za nove, nepoznate podatke.

![img/supervised-lr.png](img/supervised-lr.png)


U nadgledanom učenju, model pokušava da nauči funkciju:

𝑓(𝑋)=𝑦

gde su:

X – Ulazni podaci (npr. karakteristike)

y – Izlazne vrednosti (cilj)

Podela nadgledanog učenja:
1. Regresija – Kada je izlazna vrednost kontinuirana (npr. temperatura, cena, visina).

2. Klasifikacija – Kada je izlazna vrednost diskretna (npr. bolest: da/ne, boja: crvena/plava/zuta).

## Klasifikacija

### 🌟 Anlogija
Klasifikacija je kao sortiranje knjiga u biblioteci – svaka knjiga (podatak) ide na određenu policu (kategoriju/klasu).

---

### 📚 Definicija
- Klasifikacija se koristi za podelu podataka u kategorije na osnovu istorijskih podataka. Na primer, možemo imati podatke o biljkama i želimo da ih klasifikujemo prema vrsti (npr. ruža, ljiljan, orhideja).  

- **Primeri**:  
  - Prepoznavanje slova (A, B, C...).  
  - Dijagnostika bolesti (zdrav/oboleo).  
  - Detekcija spama (spam/ne spam).  

---

⚙️ Kako radi klasifikacija?
1. Obučavanje modela: Model uči veze između obeležja (X) i labela (Y) iz trening podataka.    
Primer: Obeležja = dužina i širina latica;   
Labela = vrsta cveća (Iris setosa, versicolor).

2. Predviđanje: Za novi podatak, model koristi naučena pravila da odredi labelu.

### **KNN (K-Nearest Neighbors)**  

- Klasifikuje nove podatke na osnovu **K najbližih suseda** u trening skupu.  
- **🌟 Analogija**: Kao da pitate 5 najbližih komšija (K=5) da preporuče film – većina odlučuje.  

#### ⚙️ **Kako radi?**  
1. Izračunaj udaljenost novog podatka od svih u treningu (npr. Euklidska udaljenost).  
2. Odaberi **K najbližih**.  
3. Dodeli klasu koja je najčešća među njima.  

![img/knn.gif](img/knn.gif)

**Primer**:  
- **Podaci**: Cveće (dužina latica, širina latica) → vrsta (Iris setosa, virginica).  
- **Novi cvet**: (5cm, 1.5cm).  
- **K=3**: 2 suseda su setosa, 1 virginica → klasa = **setosa**.  

#### **Prednosti i mane**:  
| ✅ Prednosti          | ❌ Mane                  |  
|-----------------------|--------------------------|  
| Jednostavan za razumevanje. | Spor za velike skupove podataka. |  
| Nema pretreniranja (lazy learning). | Osetljiv na šum i autlajere. |  

---

###  **SVM (Support Vector Machine)**  

- Nalazi **granicu** (hiperravan) koja najbolje razdvaja klase, maksimizirajući marginu.  
- **🌟 Analogija**: Kao da crtate najširu moguću traku između dve grupe ljudi u parku.  

#### **⚙️ Kako radi?**  
1. Pronađe hiperravan koja maksimizuje marginu između klasa.  
2. **Support vektori** su podaci najbliži granici – oni određuju položaj hiperravni.  
3. Za nelinearne podatke koristi **kernel trik** (npr. RBF) da ih preslika u višu dimenziju.  

![img/svm.gif](img/svm.gif)

**Primer**:  
- **Podaci**: Pacijenti (nivo šećera, pritisak) → dijabetes (da/ne).  
- **Hiperravan**: Linija koja razdvaja pacijente sa i bez dijabetesa.  
- **Kernel (RBF)**: Transformiše podatke u prostor gde su linearne klase.  

#### **Prednosti i mane**:  
| ✅ Prednosti          | ❌ Mane                  |  
|-----------------------|--------------------------|  
| Efikasan u visokim dimenzijama. | Zahteva pažljivo podešavanje parametara. |  
| Dobro radi sa nelinearnim podacima (kernel). | Spor za veoma velike skupove. |  

---

### 🛠️ **Kada koristiti KNN vs SVM?**  
| **Kriterijum**       | **KNN**                  | **SVM**                  |  
|-----------------------|--------------------------|--------------------------|  
| **Veličina podataka** | Manji skupovi.           | Srednji/veliki skupovi.  |  
| **Kompleksnost**      | Brza implementacija.     | Složenija konfiguracija. |  
| **Nelinearnost**      | Lošije za kompleksne obrasce. | Izvrsno sa kernelima. |  

---

### 🌍 **Primeri**  
1. **KNN u preporukama**:  
   - Ako kupite 3 knjige, sistem preporučuje knjige koje su kupili korisnici sa sličnim izborom.  
2. **SVM u medicini**:  
   - Određivanje da li je tumor benigni ili maligni na osnovu veličine i oblika.  

---

### 🚫 **Česte greške**  
- **KNN**: Ne skaliranje obeležja (npr. visina u metrima i plata u evrima).  
- **SVM**: Pogrešan izbor kernela (npr. linearni kernel za spiralno razdvojive podatke).  

---

### 🎯 **Sumirano**  
- **KNN**: "Pamti sve i pita komšije." Idealno za brze prototipove.  
- **SVM**: "Crtaj granicu sa širinom." Idealno za kompleksne podatke.  
