# Redes Neuronales Artificiales
## Perceptrón Simple


Un Perceptrón simple (PS) es la red neuronal más sencilla que se puede considerar, está conformado por una sola neurona que posee N entradas y una función de transferencia de tipo umbral, tal como se ve en la siguiente figura:


<pre>
<center><img src="https://drive.google.com/uc?export=view&id=1d6bm40h-hVkjVNaMuoEtJGa0praa2wUs" width=700></center>
</pre>

Haciendo un pequeño cambio y llevando el umbral $\theta$ hacia la izquierda en las ecuaciones anteriores, podemos definir un nuevo peso
$w_0 = -\theta$ y la entrada $x_0 = 1$ para poder escribir la salida de forma más compacta:

<pre>
<center><img src="https://drive.google.com/uc?export=view&id=1d25bKx-ne-tgg9aW3RbZiH_a3CrdsrKT" width=700></center>
</pre>

Podemos representar la salida con la siguiente expresión: $$y = sign(\sum\limits_{i=0}^N {x_i w_i})$$

_**sign**_ corresponde a la función signo y es la _función de activación_ del perceptrón simple (también podría ser la función heaviside). Más adelante veremos que existen otras funciones de activación para otras aplicaciones.

El PS permite resolver problemas linealmente separables mediante una recta o un hiperplano de separación con ordenada al origen distinta de cero gracias al término de _Bias_

<pre>
<center><img src="https://drive.google.com/uc?export=view&id=1d7FF-V_6ysD3yEYKnNIi_YBXFPuWkSJG" width=500></center>
</pre>

A continuación tenemos el algoritmo de entrenamiento o _Regla del Perceptrón Simple_ 🙂

Esta regla puede implementarse siguiendo estos pasos:
1. Inicializar el vector de pesos w con valores aleatorios entre 0 y 1.
2. Presentar un patrón de entrada x y calcular la salida $$y = sign(x_0 w_0 + \sum\limits_{i=1}^N {x_i w_i})$$  Recordemos que $w_0$ es el término de bias y $x_0=1$, podemos representar la suma de productos usando un producto punto entre vectores: $$y = sign( w_0 + \vec{w}^T \cdot \vec{x})$$

3. Calcular el error entre la salida obtenida y la salida deseada $y_d$ $$e = y - y_d$$
4. Ajustar los pesos de la red con la siguiente ecuación: $$ \vec{w} = \vec{w} + \mu \vec{e} \cdot \vec{x}$$ $\mu$ es el coeficiente de aprendizaje o factor de entrenamiento (eta)
5. Volver al paso 2 y repetir el proceso

In [None]:
# Librerías a importar
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Perceptron
from sklearn.metrics import accuracy_score
from utiles import plot_decision_regions
from sklearn.preprocessing import StandardScaler

## Dataset Iris
El conjunto de datos flor Iris contiene 50 muestras de cada una de tres especies de Iris (Iris setosa, Iris versicolor e Iris virginica), en total 150 muestras. Se midió cuatro rasgos de cada muestra: el largo y ancho del sépalo y pétalo, en centímetros.

>Nosotros vamos a utilizar nuestro perceptrón para separar dos clases de flores (Iris setosa e Iris versicolor) según dos de sus características: Largo de sépalo (primer columna en el dataset) y largo de pétalo (tercer columna).  

In [None]:
df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data', header=None)
df.head()

# Graficamos el Dataset

# Entrenamiento del Perceptrón

Separar los datos en conjunto de entrenamiento y prueba (20%)

In [None]:
#Escalamos los datos

Entrenamos el perceptrón con un `eta=0.1`, una semilla `random_state=1` y `shuffle=True`. Ver [documentación](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Perceptron.html)

**coeficientes o pesos de la recta de separación**

**constante u ordenada al origen de la recta**

Recordemos la ecuación: $$y = sign(w_0 + \sum\limits_{i=1}^N {x_i w_i})$$

Para este problema con dos características (x1 = longitudes del sépalo y x2= longitudes de pétalo ), la ecuación resulta:

$$y = sign(x_1 w_1 + x_2 w_2 + w_0)$$

Donde se separan las dos clases de flores, tendremos la frontera de decisión, dada por la ecuación:

$$x_1 w_1 + x_2 w_2 + w_0 = 0$$

De esta ecuación podemos despejar la recta $x_2$ en función de $x_1$ que separa las clases en el espacio de soluciones

$$x_2 + x_1 \frac{w_1}{w_2} + \frac{w_0}{w_2} = 0$$

$$x_2 =  -\frac{w_1}{w_2}x_1 - \frac{w_0}{w_2} $$

La pendiente de la recta  $ m = -\frac{w_1}{w_2}$ y la ordenada al origen $ b = - \frac{w_0}{w_2}$

### _Ahora vamos a graficar esta recta!!_

Graficar la recta de separación del perceptrón simple. Graficar los datos de entrenamiento junto con los datos de prueba, muestre estos últimos con un borde negro para diferenciarlos de los datos de entrenamiento.

In [None]:
#------------------ Representación de la recta ------------------------------------


# ----------------------------------------------------------------------------------



Ahora grafique los datos usando la función `plot_decision_regions` del módulo `utiles.py`, grafique datos de entrenamiento y prueba (se le deben pasar los índices de los datos de prueba a la función).

Utilice la función `accuracy_score` para obtener el desempeño con los datos de prueba. [Documentación](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.accuracy_score.html)

Ahora repita el procedimiento pero con las 3 clases e iguales características y grafique la región de decisión usando la función `plot_decision_regions`

In [None]:
from sklearn import datasets

iris_df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data', header=None)