# Perceptrón simple: modelo lineal

### Neurona biológica

* Corteza cerebral: 10^11 neuronas
* Neurona biológica: soma, dendritas, axón
* Fisiología de la neurona:
    * Sinapsis, neurotransmisores
    * Despolarización, comportamiento todo/nada
    * Propagación del impulso
    * Refuerzo de las sinapsis -> aprendizaje

<img src="images/neurona.png" alt="drawing" width="600"/>

* Las **dendritas**, que son la vía de entrada de las señales que se combinan en el cuerpo de la neurona. De alguna manera la neurona elabora una señal de salida a partir de ellas. 
* El **axón**, que es el camino de salida de la señal generada por la neurona. 
* Las **sinapsis**, que son las unidades funcionales y estructurales elementales que median entre las interacciones de las neuronas. En las terminaciones de las sinapsis se encuentran unas vesículas que contienen unas sustancias químicas llamadas **neurotransmisores**, que ayudan a la propagación de las señales electroquímicas de una neurona a otra.
* La neurona es estimulada o excitada a través de sus entradas y cuando se alcanza un cierto umbral, la neurona se activa, pasando una señal hacia el axón.

### Modelo simplificado

El perceptrón ocupa un lugar especial en el desarrollo histórico de las redes neuronales: fue la primera red neuronal descrita algorítmicamente. 
Propuesto por Rosenblatt (1962), un psicólogo, que inspiró a ingenieros, físicos y matemáticos por igual a dedicar su esfuerzo de investigación a diferentes aspectos de las redes neuronales en las décadas de 1960 y 1970.

* Modelo unidimensional.
* Este modelo neuronal básico consiste en una combinación lineal de entradas (**x**) con pesos sinápticos (**w**) seguido de una función de activación.
* La función de activación "verifica" si la ponderación de entradas supera un determinado umbral.
* Todas las entradas llegan de forma simultánea.

### Características de la neurona

* Alta NO linealidad.
* Alto paralelismo.
* Aprenden a partir de los datos.
* Generalización y adaptabilidad.
* Robustez.

**Función que mapea un vector de entrada a un valor de salida binario**

<img src="images/funcion_perceptron.png" alt="drawing" width="300"/>

- Donde *w* es un vector de pesos reales y *w . x* es el producto escalar. *u* es el umbral que representa el grado de inhibición de la neurona. Es un término constante que no depende del valor que tome la entrada.
- Espacialmente, el umbral (bias) altera la posición (aunque no la orientación) del límite de decisión. 

<img src="images/perceptron.jpeg" alt="drawing" width="600"/>

- El algoritmo de aprendizaje del perceptrón no termina si el conjunto de aprendizaje no es linealmente separable .
- Si los vectores no son linealmente separables, el aprendizaje nunca llegará a un punto en el que todos los vectores se clasifiquen correctamente. El ejemplo más famoso de la incapacidad del perceptrón para resolver problemas con vectores linealmente no separables es el problema o exclusivo booleano

<img src="images/problema.png" alt="drawing" width="600"/>

### Aprendizaje

El perceptrón hace uso del aprendizaje Hebbiano, es decir implica que los pesos sean ajustados de manera que cada uno de ellos represente la mejor relación entre ellos posibles (teniendo en cuenta las entradas y salida deseada).

∆w<sub>i</sub> , proporcional al producto de una entrada x<sub>i</sub> y de una salida y<sub>i</sub> de la neurona.

Es decir, ∆w<sub>i</sub> = εx<sub>i</sub>y<sub>i</sub> donde a 0 < ε < 1 se le llama tasa de aprendizaje

### Ejercicio

Implementar el algoritmo del Perceptron simple en una clase que mínimamente conste de un método para entrenamiento y un método para realizar predicciones a partir de entradas dadas


In [None]:
class Perceptron:
    
    def __init__(self):
        pass
    
    def train(self):
        pass
    
    def predict(self):
        pass

**Ejercicio 1:**

Entrenar un perceptron simple para intentar resolver los problemas AND, OR y XOR. ¿Qué conclusiones puede sacar? ¿De qué depende el resultado? ¿Funciona para todos los casos? ¿Por qué?

**Ejercicio 2:**

Agregue métodos a la clase Perceptron que permita visualizar la tasa de error por época de entrenamiento y otro que permita visualizar la recta de separación entre clases que se va ajustando durante el entrenamiento.

Si denotamos por x<sub>1</sub> y x<sub>2</sub> a las dos neuronas de entrada, la operación efectuada por el perceptrón simple consiste en:

<img src="images/ecuacion1.png" alt="drawing" width="300"/>

Si consideramos x<sub>1</sub> y x<sub>2</sub> situadas sobre los ejes de abcisas y ordenadas respectivamente, la condición

<img src="images/ecuacion2.png" alt="drawing" width="200"/>

Esto representa una recta que define la región de decisión determinada por el perceptrón
simple. Es por ello que dicho perceptrón simple representa un discriminador lineal,
al implementar una condición lineal que separa dos regiones en el espacio que representan dos clases diferentes de patrones.

Por tanto, el perceptrón simple presenta grandes limitaciones, ya que tan solo es capaz
de representar funciones linealmente separables.

<img src="images/region_decision.png" alt="drawing" width="400"/>

### Función de activación

In [None]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

from IPython import display

In [None]:
def binary_step(z):
    return 1 if z>= 0 else 0

In [None]:
x = np.arange(-1, 1, 0.01)
y = np.vectorize(binary_step)(x)
plt.plot(x, y)
plt.title('Step binary')
plt.xlabel('Input')
plt.ylabel('Output');

### Inicializar pesos

In [None]:
def inicializar_pesos(in_features):
    weights = np.random.rand(in_features)
    bias = np.random.rand(1).item()
    return weights, bias

In [None]:
in_features = 2
w, b = inicializar_pesos(2)
assert w.shape[0] == in_features, 'Error'

In [None]:
w

In [None]:
b

### Optimización

In [None]:
def propagate(x, y, w, b):
    
    z = binary_step(np.dot(w.T, x) + b)
    
    error = y - z
    
    w = w+ 0.1 * error * x.T
    b = b + 0.1 * error
    
    return w, b, z

In [None]:
X_train = np.array([[0,0],[0,1],[1,0],[1,1]])
y_train = np.array([[0, 0, 0, 1]]).T

In [None]:
for i in range(2):
    for x, y in zip(X_train, y_train):
        w, b, z = propagate(w, b, x, y)
        print("weights: ", w)
        print("bias: ", b)
        print("salida: ", z)

### Predict

In [None]:
class Perceptron:
    
    tasa_error = []
    
    def __init__(self, in_features:int, n_epochs, learning_rate):
        self.in_features = in_features
        self.n_epochs = n_epochs
        self.learning_rate = learning_rate
        
    def __inicializar_pesos(self):
        self.weights = np.random.rand(self.in_features)
        self.bias = np.random.rand(1).item()
    
    def __propagate(self, x, y):

        z = binary_step(np.dot(self.weights.T, x) + self.bias)

        error = y - z

        self.weights = self.weights + self.learning_rate * error * x.T
        self.bias = self.bias + self.learning_rate * error
        
        return z
    
    def train(self, X_train, y_train):
        self.__inicializar_pesos()
        for idx in range(self.n_epochs):
            print(f"Epoca {idx+1}/{self.n_epochs}")
            c_error = 0
            for x, y in zip(X_train, y_train):
                z = self.__propagate(x, y)
                if z != y:
                    c_error += 1
                display.clear_output(wait=True)
                display.display(eq_plot(self.weights[0].item(), self.weights[1].item(), self.bias.item()))
                # print("weights: ", self.weights)
                # print("bias: ", self.bias)
                # print("salida: ", z)
            error_epoca = c_error / len(X_train)
            self.tasa_error.append(error_epoca)
            print(f"Error: {error_epoca}")
            print("----------------------\n")
        
    
    def predict(self, x):
        return binary_step(np.dot(self.weights.T, x) + self.bias)

In [None]:
P = Perceptron(in_features=2, n_epochs=5, learning_rate=0.1)

In [None]:
#P.train(X_train, y_train)

In [None]:
X_train = np.array([[0,0],[0,1],[1,0],[1,1]])
y_train = np.array([[0, 1, 1, 0]]).T
P.train(X_train, y_train)

In [None]:
P.predict([1,0])

In [None]:
P.predict([1,0])

In [None]:
P.predict([1,0])

In [None]:
P.predict([1,0])

In [None]:
P.weights[0].item()

In [None]:
plt.plot(P.tasa_error)

In [None]:
def eq_plot(w1, w2, b):
    plt.scatter(X_train[:,0], X_train[:,1], c = y_train)
    x = np.arange(-0.5, 1.75, 0.25)
    y = (-(b / w2) / (b / w1))*x + (-b / w2)
    plt.plot(x, y)
    plt.xlim([-0.5,1.50])
    plt.ylim([-0.5,1.50])
    plt.fill_between(x=x,y1=y-200,y2=y+0.01,alpha=.2,color='red')
    plt.fill_between(x=x,y1=y+200,y2=y+0.01,alpha=.2,color='yellow')
    plt.pause(0.05)
    #plt.clf()
    plt.show()