# T2.2 Algorisme Perceptró

# Índex

1. Algorisme Perceptró

# 1 Algorisme Perceptró

**Origen:** $\;$ primer algorisme d'aprenentatge automàtic; proposat per Frank Rosenblatt en 1958

**Entrada:** $\;$ un conjunt d'entrenament, $\;\mathcal{D}=\{(\boldsymbol{x}_n,y_n)\},\,$ amb $\;\boldsymbol{x}_n\in\mathbb{R}^D\,$ i $\,y_n\in\{1,\dotsc,C\}\,$ per a tot $n$

**Eixida:** $\;$ els pesos d'un classificador lineal, $\;c(\boldsymbol{x}) = \operatorname{argmax}\limits_c\; g_c(\boldsymbol{x}),\;$ amb $\,g_c(\boldsymbol{x})=\boldsymbol{w}_c^t\,\boldsymbol{x} + w_{c0}\,$ per a tot $c$

**Notació homogènia o compacta:** $\;\boldsymbol{x}=(1,x_1,\dotsc,x_D)^t\,$ i $\,\boldsymbol{w}_c=(w_{c0},w_{c1},\dotsc,w_{cD})^t;\quad$ així, $\;g_c(\boldsymbol{x})=\boldsymbol{w}_c^t\,\boldsymbol{x}$

**Objectiu:** $\;$ minimitzar el nombre d'errors en entrenament
$$\mathcal{L}(\{\boldsymbol{w}_c\})%
=\sum\nolimits_n\mathbb{I}(y_n\neq c(\boldsymbol{x}_n))%
=\sum\nolimits_n\mathbb{I}(\max\nolimits_{c\neq y_n}g_c(\boldsymbol{x}_n)>g_{y_n}(\boldsymbol{x}_n))$$

**Objectiu amb marge $b\geq 0$:** $\;$ extensió de l'objectiu bàsic ($b=0$) per tal de generalitzar millor
$$\mathcal{L}(\{\boldsymbol{w}_c\})%
=\sum\nolimits_n\mathbb{I}(\max\nolimits_{c\neq y_n}g_c(\boldsymbol{x}_n)+b>g_{y_n}(\boldsymbol{x}_n))$$
*Interpretació:* $\;$ la pseudo-probabilitat de pertànyer a la classe correcta ha de superar la de qualsevol classe rival amb almenys un marge $b$

**Algorisme Perceptró:** $\;$ versió bàsica amb **factor d'aprenentatge** $\,\alpha>0\,$ per a controlar la velocitat de l'aprenentatge

In [1]:
import numpy as np
def perceptro(X, y, b=0.1, a=1.0, K=200):
    N, D = X.shape; Y = np.unique(y); C = Y.size; W = np.zeros((1+D, C))
    for k in range(1, K+1):
        E = 0
        for n in range(N):
            xn = np.array([1, *X[n, :]])
            cn = np.squeeze(np.where(Y==y[n]))
            gn = W[:,cn].T @ xn; err = False
            for c in np.arange(C):
                if c != cn and W[:,c].T @ xn + b > gn:
                    W[:, c] = W[:, c] - a*xn; err = True
                if err:
                    W[:, cn] = W[:, cn] + a*xn; E = E + 1
        if E == 0:
            break;
    return W, E, k

**Exemple:** $\;C=D=2,\,\boldsymbol{x}_1=(0,0)^t, y_1=0, \boldsymbol{x}_2=(1,1)^t, y_1=1$

In [2]:
X = np.array([[0, 0], [1, 1]]); y = np.array([0, 1], dtype=int);
W, E, k = perceptro(X, y); print("W = ", W, "\nE = ", E, "\nk = ", k)

W =  [[ 1.  0.]
 [-1.  2.]
 [-1.  2.]] 
E =  0 
k =  3
