# Vježbe 4 - dio 1
 - Analiza domaće zadaće

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.svm import SVC, LinearSVC

plt.rcParams["figure.figsize"] = (7, 7)

## Zadatak 1 (5 bodova)
**Hinge-loss** funkcija $\ell_{hinge} : \mathbb{R} \to \mathbb{R}$ je zadana s
$$
\ell_{hinge}(x) = \max{(0, 1 - x)}.
$$
Dokažite da je ta funkcija konveksna. Koristeći *matplotlib* nacrtajte graf te funkcije.

In [None]:
def l_hinge(x):
    return np.where(1 - x < 0, 0., 1 - x)  

xx = np.linspace(-10, 10, 1000)
yy = l_hinge(xx)
plt.plot(xx, yy)

---
Ovdje napišite svoj odgovor.

## Zadatak 2 (15 bodova)
Na predavanju i vježbama zadali smo optimizacijski problem 
$$
\textrm{argmin}_{\Theta, \theta_0, \xi}\frac{1}{2}||\Theta||^2 + C\sum\limits_{i=1}^m \xi_i
$$
 
$$
\text{  uz uvjet  } y^{(i)}(\Theta^T x^{(i)} + \theta_0) \geq 1 - \xi_i \textrm{ i } \xi_i \geq 0, \text{ }  i = 1, 2, \dots, m,
$$

Promotrite sljedeći optimizacijski problem:
$$
\textrm{argmin}_{\Theta, \theta_0}\frac{1}{2}||\Theta||^2 + C\sum\limits_{i=1}^m\ell_{hinge}(y^{(i)}(\Theta^T x^{(i)} + \theta_0)).
$$

Dokažite da su ovi optimizacijski problemi ekvivalentni. Drugim riječima:
 1. Ako je $(\Theta^*, \theta_0^*, \xi^*)$ rješenje prvog optimizacijskog problema, onda je $(\Theta^*, \theta_0^*)$ rješenje drugog optimizacijskog problema.
 2. Ako je $(\Theta^*, \theta_0^*)$ rješenje drugog optimizacijskog problema, onda postoji $\xi^*$ takav da je $(\Theta^*, \theta_0^*, \xi^*)$ rješenje prvog optimizacijskog problema.
 
 Parametar $\xi$ ovdje promatramo kao vektor $(\xi_1, \dots, \xi_m)^T$.

---
Ovdje napišite svoj odgovor.

---
## Zadatak 3 (5 bodova)
Logistička funkcija je zadana s 
$$
\sigma{(x)} = \frac{1}{1 + \exp{(-x)}}.
$$
1. Dokažite da vrijedi $\sigma{(-x)} = 1 - \sigma{(x)}$.

2. Izračunajte derivaciju funkcije $\sigma$.

---
Ovdje napišite svoj odgovor.

---
## Zadatak 4 (10 bodova)
Izračunajte gradijent *maximum likelihood* kriterijske funkcije $J : \mathbb{R}^n \to \mathbb{R}$ zadane s
$$
J(\Theta) = \sum_{i=1}^m\log{}(1 + \exp(-y^{(i)}\Theta^Tx^{(i)})).
$$

---
Ovdje napišite svoj odgovor.

---
## Zadatak 5 (15 bodova)
Učitajte podatke iz prošle zadaće (*A.csv*, *B.csv* i *C.csv*). Za svaki od njih učinite sljedeće:

1. Konstruirajte SVM model primjenom *LinearSVC* klase iz *sklearn.svm*.

2. Ispišite parametre $\theta_0$ i $\Theta$.

3. Izračunajte i ispišite potporne vektore.

4. Izračunajte geometrijsku marginu.

5. Grafički prikažite podatke, dobivenu hiperravninu koja razdvaja podatke, te potporne vektore.

6. Usporedite vrijednosti geometrijske margine dobivene perceptron algoritmom i SVM modelom. Za perceptron algoritam možete iskoristiti implementaciju iz prošle zadaće (odnosno vježbi).

In [None]:
a_df = pd.read_csv('./Podaci/A.csv')
X_a = a_df[['x1', 'x2']].to_numpy()
y_a = a_df['y'].to_numpy()

clf_a = LinearSVC()
clf_a.fit(X_a, y_a)

print(f'theta   = {clf_a.coef_.squeeze()}')
print(f'theta_0 = {clf_a.intercept_}')

dec_func = clf_a.decision_function(X_a)
support_vector_indices = np.where(np.abs(dec_func) <= 1 + 1e-15)
support_vectors = X_a[support_vector_indices]

print(f'Potporni vektori su\n{support_vectors}')

plt.scatter(X_a[:, 0], X_a[:, 1], c=y_a)
ax = plt.gca()
xlim = ax.get_xlim()
ylim = ax.get_ylim()

xx, yy = np.meshgrid(np.linspace(xlim[0], xlim[1], 1000),
                     np.linspace(ylim[0], ylim[1], 1000))
Z = clf_a.decision_function(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

plt.contour(xx, yy, Z, levels=[-1,0,1], alpha=0.5, linestyles=['--', '-', '--'])
plt.scatter(support_vectors[:, 0], support_vectors[:, 1], s=100, marker='*', color='red')

In [None]:
b_df = pd.read_csv('./Podaci/B.csv')
X_b = b_df[['x1', 'x2']].to_numpy()
y_b = b_df['y'].to_numpy()

clf_b = LinearSVC(max_iter=100000)
clf_b.fit(X_b, y_b)

print(f'theta   = {clf_b.coef_.squeeze()}')
print(f'theta_0 = {clf_b.intercept_}')

dec_func = clf_b.decision_function(X_b)
support_vector_indices = np.where(np.abs(dec_func) <= 1 + 1e-15)
support_vectors = X_b[support_vector_indices]

print(f'Potporni vektori su\n{support_vectors}')

plt.scatter(X_b[:, 0], X_b[:, 1], c=y_b)
ax = plt.gca()
xlim = ax.get_xlim()
ylim = ax.get_ylim()

xx, yy = np.meshgrid(np.linspace(xlim[0], xlim[1], 1000),
                     np.linspace(ylim[0], ylim[1], 1000))
Z = clf_b.decision_function(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

plt.contour(xx, yy, Z, levels=[-1,0,1], alpha=0.5, linestyles=['--', '-', '--'])
plt.scatter(support_vectors[:, 0], support_vectors[:, 1], s=100, marker='*', color='red')

In [None]:
c_df = pd.read_csv('./Podaci/C.csv')
X_c = c_df[['x1', 'x2']].to_numpy()
y_c = c_df['y'].to_numpy()

clf_c = LinearSVC()
clf_c.fit(X_c, y_c)

print(f'theta   = {clf_c.coef_.squeeze()}')
print(f'theta_0 = {clf_c.intercept_}')

dec_func = clf_c.decision_function(X_c)
support_vector_indices = np.where(np.abs(dec_func) <= 1 + 1e-15)
support_vectors = X_c[support_vector_indices]

print(f'Potporni vektori su\n{support_vectors}')

plt.scatter(X_c[:, 0], X_c[:, 1], c=y_c)
ax = plt.gca()
xlim = ax.get_xlim()
ylim = ax.get_ylim()

xx, yy = np.meshgrid(np.linspace(xlim[0], xlim[1], 1000),
                     np.linspace(ylim[0], ylim[1], 1000))
Z = clf_c.decision_function(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

plt.contour(xx, yy, Z, levels=[-1,0,1], alpha=0.5, linestyles=['--', '-', '--'])
plt.scatter(support_vectors[:, 0], support_vectors[:, 1], s=100, marker='*', color='red')

### Geometrijske margine

In [None]:
print(f'Geometrijska margina A: {1 / np.linalg.norm(clf_a.coef_.squeeze())}')
print(f'Geometrijska margina B: {1 / np.linalg.norm(clf_b.coef_.squeeze())}')
print(f'Geometrijska margina C: {1 / np.linalg.norm(clf_c.coef_.squeeze())}')

### Usporedba s perceptronom

In [None]:
class Perceptron:
    def __init__(self):
        self.theta = None
        self.k_total = None
        
    def fit(self, X, y, max_iter=100000):       
        m = X.shape[0]
        n = X.shape[1] + 1
        self.theta = np.zeros(n)
        
        X = np.concatenate((np.ones((m, 1)), X), axis=1)
        self.k_total = 0
        while self.k_total < max_iter:
            k = 0
            for i in range(m):
                if y[i] != np.sign(np.dot(self.theta, X[i])):
                    k += 1
                    self.theta += (y[i] * X[i])
            self.k_total += k
            if k == 0:
                break
                
def dist(x, theta):
    """Udaljenost tocke x od hiperravnine zadane parametrom theta
    x.shape = (n,)
    theta.shape = (n+1,)
    """
    return abs(np.dot(x, theta[1:]) + theta[0]) / np.linalg.norm(theta[1:])

In [None]:
p_a = Perceptron()
p_a.fit(X_a, y_a)

p_b = Perceptron()
p_b.fit(X_b, y_b)

p_c = Perceptron()
p_c.fit(X_c, y_c)

gama_a = min([dist(x, p_a.theta) for x in X_a])
gama_b = min([dist(x, p_b.theta) for x in X_b])
gama_c = min([dist(x, p_c.theta) for x in X_c])

print(f'Geometrijska margina A: {gama_a}')
print(f'Geometrijska margina B: {gama_b}')
print(f'Geometrijska margina C: {gama_c}')

---
## Zadatak 6 (10 bodova)
Učitajte podatke iz skupa *B.csv*. Promotrite što se događa s rezultatima SVM modela ako slučajnim odabirom uklonite dio podataka:

1. Slučajnim odabirom odaberite 1000 (od ukupno 2000) točaka i pripadnih klasa.

2. Konstruirajte SVM model primjenom *SVC* klase iz *sklearn.svm* sa `kernel='linear'`.

3. Grafički prikažite podatke, dobivenu hiperravninu koja razdvaja podatke, te potporne vektore.

**Ovaj proces ponovite 10 puta** i interpretirajte razlike ili sličnosti u dobivenim rezultatima. Što možete zaključiti o ulozi potpornih vektora?

In [None]:
df = pd.read_csv('./Podaci/B.csv')
X = df[['x1', 'x2']].to_numpy()
y = df['y'].to_numpy()
m, n = X.shape

for i in range(10):
    choice = np.random.choice(m, 1000, replace=False)
    X_sub = X[choice]
    y_sub = y[choice]
    clf = SVC(kernel='linear').fit(X_sub, y_sub)
    
    plt.scatter(X_sub[:, 0], X_sub[:, 1], c=y_sub, s=0.1)
    ax = plt.gca()
    xlim = ax.get_xlim()
    ylim = ax.get_ylim()

    xx, yy = np.meshgrid(np.linspace(xlim[0], xlim[1], 1000), np.linspace(ylim[0], ylim[1], 1000))
    Z = clf.decision_function(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)

    plt.contour(xx, yy, Z, levels=[-1,0,1], alpha=0.5, linestyles=['--', '-', '--'])
    plt.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], s=100, marker='*', color='red')
    plt.show()

Dobivena hiperravnina i margina ovise o malom podskupu podataka na kojima se model trenira.