## **El perceptrón**

El percetrón fue publicado por primera vez por [Frank Rosenblatt](https://es.wikipedia.org/wiki/Frank_Rosenblatt) en 1957. Rosenblatt propuso una regla que podía determinar automáticamente los pesos para cada una de las características de entrada de la neurona artificial; utilizando **aprendizaje supervisado** para determinar un límite o frontera de decisión entre dos clases binarias.

El percetrón clasifica las entradas, encontrando el producto punto de un vector de características de entrada y un vector de pesos y pasando este resultado a una función de activación escalón o *step*, la cual regresará 1 si el valor es mayor que cero y regresará 0 en caso contrario.

Para determinar los pesos, la regla de aprendizaje del percetrón realiza lo siguiente:

1. Predice una salida basándose en los pesos y entradas actuales.
2. Compara la salida contra la salida esperada o etiqueta (*label*).
3. Si la predicción es diferente de la salida esperada, actualiza los pesos.
4. Continua iterando hasta que se alcanza el número de épocas establecidas.

Para actualizar los pesos en cada iteración:

1. Encuentra el error restando la predicción de la salida esperada.
2. Multiplica el error por la tasa de aprendizaje (*learning rate*).
3. Multiplica el resultado con las entradas.
4. Agrega el vector resultante al vector de pesos.

Veremos a continuación la implementación del algoritmo del Perceptrón para resolver la compuerta lógica AND.

A continuación se ilustra la configuración básica del perceptrón:
<img src="https://www.thomascountz.com/assets/images/neural-network.png" style="width:400px;height:182px;">


De acuerdo con la teoría que hemos ya revisado, tenemos dos fórmulas muy relevantes para implementar y describir al perceptrón:
```
**Función de activación**
f(x) = 1 if w · x + b > 0
       0 otherwise
**Regla de actualización de los pesos**
w <- w + α * (y - f(x)) * x
```

Utilizaremos para este ejercicio la clase Perceptron obtenida de: https://www.thomascountz.com/2018/04/05/19-line-line-by-line-python-perceptron, se le han agregado comentarios y algunos cambios para hacerla más entendible.

In [None]:
#Celda de código solo para mostrar el uso de np.zeros y np.random.uniform
import numpy as np
num_de_elementos = 4
vector_ceros = np.zeros(num_de_elementos)
vector_aleatorios = np.array(np.random.uniform(-0.5, 0.5, num_de_elementos))
print(vector_ceros)
print(vector_aleatorios)
print(np.random.uniform(1, 20, num_de_elementos))

In [None]:
"""
MIT License

Copyright (c) 2018 Thomas Countz

Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:

The above copyright notice and this permission notice shall be included in all
copies or substantial portions of the Software.

THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
SOFTWARE.
"""

#Importamos la biblioteca numpy para el manejo de vectores y matrices
import numpy as np

#Clase que nos servirá para emular el funcionamiento del Perceptrón
#Recibe como párametros:

#no_of_inputs = número de elementos de entrada
#epochs = número de épocas máximo que se ejecutarán
#learning_rate = factor de la tasa de aprendizaje que utilizaremos
#                para actualizar los pesos
class Perceptron(object):
    #Constructor de la clase
    def __init__(self, no_of_inputs, epochs=100, learning_rate=0.01):
        self.epochs = epochs
        self.learning_rate = learning_rate
        #Se inicializan los pesos (experimente inicializándolos en 0 o de manera
        # aleatoria), en la primera posición estará el peso del
        #Sesgo o Bias, a partir de la posición 1 estarán los pesos de
        #las entradas:
        self.weights = np.zeros(no_of_inputs + 1)
        #self.weights = np.array(np.random.uniform(-0.5, 0.5, no_of_inputs + 1))

    #Función de activación, utiliza numpy para multiplicar las entradas
    #por los pesos y sumar la variable de sesgo (bias)
    def predict(self, inputs):
        summation = np.dot(inputs, self.weights[1:]) + self.weights[0]
        if summation > 0:
          activation = 1
        else:
          activation = 0
        return activation
    #Función que realizará el proceso de entrenamiento por el número de épocas
    #que se haya definido.
    #Actualiza los pesos tras cada iteración
    def train(self, training_inputs, labels):
        for e in range(self.epochs):
            print('---------- Época: {} ---------- '.format(e+1))
            for inputs, label in zip(training_inputs, labels):
                prediction = self.predict(inputs)
                print('Entradas: ', inputs, 'Pesos:', self.weights, 'Salida esperada: ', label, 'Salida obtenida: ',
                      prediction)
                #Actualizamos los pesos de las entradas
                self.weights[1:] += self.learning_rate * (label - prediction) * inputs
                #Actualizamos el peso del sesgo (bias)
                self.weights[0] += self.learning_rate * (label - prediction)


##**Ejemplo**

Uso de la clase Perceptrón para resolver la compuerta lógica **AND**
```
# Tabla de verdad
 A   B  | AND
--- --- |-----
 1   1  |  1
 1   0  |  0
 0   1  |  0
 0   0  |  0
```



In [None]:
import numpy as np
#La siguiente línea la usaríamos si la clase Perceptron estuviera en un archivo
#separado
#from perceptron import Perceptron

Generamos nuestros datos de entrenamiento. Las entradas son las columnas A y B de la tabla de verdad de la compuerta lógica AND, las almacenaremos en un arreglo de arreglos `numpy`, al que llamaremos `training_inputs`.

In [None]:
training_inputs = []
training_inputs.append(np.array([1, 1]))
training_inputs.append(np.array([1, 0]))
training_inputs.append(np.array([0, 1]))
training_inputs.append(np.array([0, 0]))
print(training_inputs)

Almacenaremos las salidas esperadas o etiquetas para cada par de entradas en una variable que llamaremos `labels`. **Es importante asegurarse que las etiquetas correspondan adecuadamente con las entradas**.

In [None]:
labels = np.array([1, 0, 0, 0])
print(labels)

Creamos una instancia de la clase `Perceptron` y le indicamos el número de entradas y las épocas, dejando la tasa de aprendizaje por defecto.

In [None]:
perceptron = Perceptron(2)

A continuación iniciamos el entrenamiento del perceptrón ejecutando el método `train` indicándole como parámetros nuestras variables que contienen las entradas y las etiquetas de las miemas..

In [None]:
perceptron.train(training_inputs, labels)

El entrenamiento debe terminar muy rápido, ya que nuestros datos de entrenamiento son muy pocos y `numpy` es muy eficiente. Una vez terminado el entrenamiento, estamos listos para usar nuestro perceptrón como una compuerta lógica AND.

In [None]:
inputs = np.array([1, 1])
perceptron.predict(inputs)
#=> 1

In [None]:
inputs = np.array([0, 1])
perceptron.predict(inputs)
#=> 0

In [None]:
inputs = np.array([0, 0])
perceptron.predict(inputs)
#=> 0

In [None]:
inputs = np.array([1, 0])
perceptron.predict(inputs)
#=> 0

**Nota:**
Con pesos aleatorios de arranque llegamos a la solución en la época 35 en nuestro ejemplo:

Los pesos finales fueron:
[-0.11462999  0.10490984  0.0154394]

Con pesos inicializados en cero llegamos a la solución en la época 6 en nuestro ejemplo.

Los pesos finales fueron: [-0.02  0.01  0.02]


## **Ejercicio extra**

Realizar el entrenamiento de la red neuronal para que pueda resolver la compuerta lógica **OR**.

```
# Tabla de verdad
 A   B  | OR
--- --- |-----
 1   1  |  1
 1   0  |  1
 0   1  |  1
 0   0  |  0
```




1.-Definir el *dataset* de entrada y las etiquetas del mismo.

In [None]:
#Dataset de entrenamiento
valores_entrenamiento = []
valores_entrenamiento.append(np.array([1, 1]))
valores_entrenamiento.append(np.array([1, 0]))
valores_entrenamiento.append(np.array([0, 1]))
valores_entrenamiento.append(np.array([0, 0]))
print(valores_entrenamiento)

In [None]:
#Etiquetas
etiquetas = np.array([1, 1, 1, 0])
print(etiquetas)

In [None]:
perceptron_or = Perceptron(2)

In [None]:
perceptron_or.train(valores_entrenamiento, etiquetas)

In [None]:
#Predecir
inputs = np.array([1, 0])
perceptron_or.predict(inputs)