# Exemplo Support Vector Machines (SVM)

### 1. Importar as bibliotecas e definição de funções

In [None]:
%pylab inline
import scipy.io as sio
import sklearn.svm as svm

In [None]:
def plotDataWithBoundary(X, y, model, svectors = False):
    
    # plot the line, the points, and the nearest vectors to the plane
    fignum = 1
    #plt.figure(fignum, figsize=(4, 3))
    plt.clf()

    if svectors:
        plt.scatter(model.support_vectors_[:, 0], model.support_vectors_[:, 1], s=80,
                facecolors='none', zorder=10)
    

    pos = find(y==1)
    neg = find(y==0)
    plot(X[pos,0], X[pos,1], 'k+', markersize=7)
    plot(X[neg,0], X[neg,1], 'ko', markerfacecolor="lightgreen", markersize=5)
    
    
    #plt.axis('equal')
    x_min = min(X[:,0])
    x_max = max(X[:,0])
    y_min = min(X[:,1])
    y_max = max(X[:,1])

    XX, YY = np.mgrid[x_min:x_max:200j, y_min:y_max:200j]
    Z = clf.decision_function(np.c_[XX.ravel(), YY.ravel()])

    Z = Z.reshape(XX.shape)
    plt.contour(XX, YY, Z, colors=['k', 'b', 'k'], linestyles=['--', '-', '--'],
                levels=[-.5, 0, .5])

    deltax = (x_max-x_min)*0.1
    deltay = (y_max-y_min)*0.1
    plt.xlim(x_min-deltax, x_max+deltax)
    plt.ylim(y_min-deltay, y_max+deltay)


### 2. Exemplo #1

In [None]:
# Importar dados de um ficheiro matlab
matdata = sio.loadmat('data1.mat')
X = matdata['X']
y = matdata['y']

Recorde que treinar uma SVM envolve a minimização de uma função:

$$\min_\theta\, C \left[ \sum_{i=1}^{m}
\max\{ 0, 1-y^{(i)} f(x^{(i)})\} \right] +\frac{1}{2} \sum_{j=0}^{n}\theta_j^2$$

em que

$$ f(x) = \theta^T x + b$$.

Note que o parâmetro $C$ multipla o termo de ajuste aos dados (_error term_), logo:

- um valor muito grande não permite classificação com erros;
- um valor baixo permite que hajam erros, e a SVM generaliza melhor.

**Execute o código da seguinte célula** com os seguintes valores: $C = 100$, $C = 10$, $C = 1$, $C = 0.1$. 

In [None]:
clf = svm.SVC(kernel='linear',C=100, tol=1e-3)
clf.fit(X, y.ravel())
plotDataWithBoundary(X, y, clf)

Fazendo `svectors = True` na função `plotDataWithBoundary` é possível visualizar os _support vectors_.

In [None]:
clf = svm.SVC(kernel='linear',C=1, tol=1e-3)
clf.fit(X, y.ravel())
plotDataWithBoundary(X, y, clf, svectors = True)

### 3. Exemplo #2

In [None]:
matdata = sio.loadmat('data2.mat')
X = matdata['X']
y = matdata['y']

*** Experimente a célula seguinte para diferentes valores de $C$***

In [None]:
gamma = 1.0/2/0.1**2
clf = svm.SVC(kernel='rbf',C=1, tol=1e-3, gamma=gamma)
clf.fit(X, y.ravel())
plotDataWithBoundary(X, y, clf)

### 4. Exemplo #3

In [None]:
matdata = sio.loadmat('data3.mat')
X = matdata['X']
y = matdata['y']

*** Experimente a célula seguinte para diferentes valores de $C$***

In [None]:
clf = svm.SVC(kernel='rbf',C=1, tol=1e-3, gamma=50)
clf.fit(X, y.ravel())
plotDataWithBoundary(X, y, clf)