Perceptrón Bipolar
===

**Juan David Velásquez Henao**  
jdvelasq@unal.edu.co   
Universidad Nacional de Colombia, Sede Medellín  
Facultad de Minas  
Medellín, Colombia

---

Haga click [aquí](https://github.com/jdvelasq/deep-neural-nets/tree/master/) para acceder al repositorio online.

Haga click [aquí](http://nbviewer.jupyter.org/github/jdvelasq/deep-neural-nets/tree/master/) para explorar el repositorio usando `nbviewer`. 

---

# Definición del problema

Se tiene una muestra de 15 ejemplos para los cuales se han medido sus características $x_1$ y $x_2$ y su respectiva clase.

    #     x1      x2   Clase
    ------------------------
     1  10.67   14.70    A
     2   9.74   13.79    A 
     3  10.23   14.30    A
     4  11.17   15.53    A
     5  10.41   15.08    A
     6  10.87    6.81    A
     7  11.95    6.05    B
     8  12.77    7.97    B
     9  14.42    9.25    B
    10  13.25    8.03    B
    11  13.27   13.92    C
    12  14.40   16.58    C
    13  14.50   17.39    C
    14  14.20   16.70    C
    15  14.62   17.22    C

Se desea determinar a que clase pertenece un nuevo punto con $x_1$ = 10.18 y $x_2$ = 6.38.

# Metodología de Solución

El problema de clasificación binaria (con clases $C_1$ y $C_2$ dicotómicas) se define de la siguiente manera:


* Cada patrón de entrada tiene la forma $\mathbf{x}=[+1,x_1,x_2,…,x_n ]$.


* Los parámetros del perceptrón binario son $\mathbf{w}=[w_0,w_1,…,w_n]$ tal que $y=\varphi(\mathbf{w}^T \mathbf{x})$.


* Se desea encontrar el vector $\mathbf{w}$ tal que el perceptrón clasifique correctamente todos los patrones de entrenamiento.


* El error del perceptrón con parámetros $\mathbf{w}$, $E(\mathbf{w})$, es la cantidad de patrones mal clasificados.


![alt](images/PerceptronBipClasificacion-01.png)


### Regla de aprendizaje del perceptrón

* $d(k)$ es la respuesta deseada para el patrón presentado en el instante $k$.


* $e(k)$ es el error definido como:

$$
e(k)= 
d(k)-y(k) = 
d(k) - \varphi \left( \sum_{i=0}^n w_i x_i (p) \right) =
\begin{cases}      
       0,  & \text{Si $d(k) = y(k)$}\\
      +2, & \text{Si $d(k) = +1$ y $y(k) = -1$}\\
      -2, & \text{Si $d(k) = -1$ y $y(k) = +1$}\\
\end{cases}
$$


* Se desea calcular unos pesos corregidos $\mathbf{w}(k+1)=\mathbf{w}(k)+\Delta \mathbf{w}(k)$ tal que el perceptrón no se equivoque; es decir:

$$
\varphi (\mathbf{w}^T (k+1)  \mathbf{x}(k)) = \varphi ([ \mathbf{w}(k)+ \Delta \mathbf{w}(k)]^T  \mathbf{x}(k))=d(k)
$$


El cálculo de los pesos se realiza de la siguiente forma. Se requiere que:


* 	Si $e(k)=+2$, entonces $d(k)=+1$,   $y(k)=-1$   y   $\Delta \mathbf{w}^T(k)  x(k)>0$ tal que:  $\varphi (\mathbf{w}^T (k+1)  \mathbf{x}(k))=+1$.


* Si $e(k)=-2$, entonces $d(k)=-1$,   $y(k)=+1$   y   $\Delta \mathbf{w}^T(k)  x(k)<0$ tal que:  $\varphi (\mathbf{w}^T (k+1)  \mathbf{x}(k))=-1$.


Entonces se podría escoger:

$$\Delta \mathbf{w}(k)= \eta e(k)  \mathbf{x}(k)$$

$$\mathbf{w}(k+1) = \mathbf{w}(k)+\eta e(k)  \mathbf{x}(k)$$

donde $\eta$ es la tasa de aprendizaje. Note que la ecuación presentada es similar a la usada para el ADALINE, pero en el caso del perceptrón, $e(k) \in \{-2, 0, 2\}$, tal que la convergencia genera fronteras de decisión que usualmente son muy diferentes a las del ADALINE.  

Se inicializa el vector de parámetros $\mathbf{w}=[w_0,w_1,…,w_n ]^T$ con ceros, o con un valor aleatorio pequeño.

Los patrones deberían presentarse en un orden aleatorio. 



El siguiente esquema permite diferenciar entre los algoritmos de aprendizaje del perceptrón y el ADALINE.

![alt](images/PerceptronBipClasificacion-04.png)

---
**Ejercicio.--** Complete el siguiente código que permite realizar el entrenamiento de un perceptrón bipolar.

In [1]:
%clear
import numpy as np
class PerceptronBipolar:
    def __init__(self, n):
        """
        n es el numero de entradas a la red 
        """
        pass
    
    def fit(self, x, y, eta=0.01, niter=100):
        """
        x son las entradas, y es la salida esperada
        """
        pass
        
    def predict(self, x):
        """
        Pronostica la salida para una lista de entradas.
        
        >>> x = np.array([[10.67, 14.70],
        ...               [ 9.74, 13.79],
        ...               [10.23, 14.30],
        ...               [11.17, 15.53],
        ...               [10.41, 15.08],
        ...               [10.87,  6.81],
        ...               [11.95,  6.05],
        ...               [12.77,  7.97],
        ...               [14.42,  9.25],
        ...               [13.25,  8.03],
        ...               [13.27, 13.92],
        ...               [14.40, 16.58],
        ...               [14.50, 17.39],
        ...               [14.20, 16.70],
        ...               [14.62, 17.22]])
        >>> d = np.array([0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2])
        >>> d = np.array([0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2])
        >>> y = np.array([+1 if x == 0 else -1 for x in d])
        >>> m = PerceptronBipolar(2)
        >>> m.fit(x, y)
        >>> m.predict(x)
        [ 1, 1, 1, 1, 1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1]
       
        """
        pass
    
if __name__ == "__main__":
    import doctest
    doctest.testmod()

[H[2J**********************************************************************
File "__main__", line 40, in __main__.PerceptronBipolar.predict
Failed example:
    m.predict(x)
Expected:
    [ 1, 1, 1, 1, 1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1]
Got nothing
**********************************************************************
1 items had failures:
   1 of   7 in __main__.PerceptronBipolar.predict
***Test Failed*** 1 failures.


Para el caso de dos clases dicotómicas, un perceptrón bipolar genera una frontera lineal de decisión, en donde un nuevo punto desconocido se clasifica dependiendo del lado de la frontera en que este.

![alt](images/PerceptronBipClasificacion-02.png)

Para solucionar un problema de dos clases (clases independientes) se usa un clasificador conformado por dos perceptrones bipolares independientes, donde cada uno representa la pertenencia (o no pertenencia) a una clase determinada. De esta forma, el clasificador tendrá dos fronteras de decisión.

![alt](images/PerceptronBipClasificacion-03.png)

---
**Ejercicio.--** Compare las fronteras de decisión generadas por un perceptron bipolar y un ADALINE.

---

### Variaciones al método del perceptrón

La primera variación al método del perceptrón consiste en calcular la corrección neta sobre todos los patrones e introducir un mecanismo de adaptación en la tasa de aprendizaje:

$$
\mathbf{w}(k+1) = \mathbf{w}(k) + \eta(k) \sum_{p=1}^P  e(p) \mathbf{x}(p)
$$


La segunda variación consiste en introducir un margen $b$ al realizarse el entrenamiento del perceptrón, tal que:

$$
y(k) = \varphi \left( \mathbf{w}^T \mathbf{x}(k)-b×d(k) \right)
$$

---
**Ejercicio.--** Modifique el código del ejercicio anterior para incorporar las dos variaciones indicadas simultaneamente. Para el caso de $\eta$ considere que si el error disminuye de una iteración a otra, $\eta$ aumenta; si el error aumenta, se retorna a los pesos anteriores y $\eta$ disminuye.

In [2]:
%clear
class PerceptronBiploar:
    def __init__(self, n):
        """
        n es el numero de entradas a la red 
        """
        pass
    
    def fit(self, x, y, eta=0.01, niter=100):
        """
        x son las entradas, y es la salida esperada
        """
        pass
        
    def predict(self, x):
        """
        Pronostica la salida para una lista de entradas.
        
        >>> x = np.array([[10.67, 14.70],
        ...               [ 9.74, 13.79],
        ...               [10.23, 14.30],
        ...               [11.17, 15.53],
        ...               [10.41, 15.08],
        ...               [10.87,  6.81],
        ...               [11.95,  6.05],
        ...               [12.77,  7.97],
        ...               [14.42,  9.25],
        ...               [13.25,  8.03],
        ...               [13.27, 13.92],
        ...               [14.40, 16.58],
        ...               [14.50, 17.39],
        ...               [14.20, 16.70],
        ...               [14.62, 17.22]])
        >>> d = np.array([0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2])
        >>> y = np.array([+1 if x == 0 else -1 for x in d])
        >>> m = PerceptronBipolar(2)
        >>> m.fit(x, y)
        >>> m.predict(x)
        [ 1, 1, 1, 1, 1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1]
       
       
        """
        pass
    
if __name__ == "__main__":
    import doctest
    doctest.testmod()

[H[2J**********************************************************************
File "__main__", line 38, in __main__.PerceptronBiploar.predict
Failed example:
    m.predict(x)
Expected:
    [ 1, 1, 1, 1, 1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1]
Got nothing
**********************************************************************
File "__main__", line 40, in __main__.PerceptronBipolar.predict
Failed example:
    m.predict(x)
Expected:
    [ 1, 1, 1, 1, 1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1]
Got nothing
**********************************************************************
2 items had failures:
   1 of   6 in __main__.PerceptronBiploar.predict
   1 of   7 in __main__.PerceptronBipolar.predict
***Test Failed*** 2 failures.


---

Perceptrón Bipolar
===

**Juan David Velásquez Henao**  
jdvelasq@unal.edu.co   
Universidad Nacional de Colombia, Sede Medellín  
Facultad de Minas  
Medellín, Colombia

---

Haga click [aquí](https://github.com/jdvelasq/deep-neural-nets/tree/master/) para acceder al repositorio online.

Haga click [aquí](http://nbviewer.jupyter.org/github/jdvelasq/deep-neural-nets/tree/master/) para explorar el repositorio usando `nbviewer`. 