# Laboratorio 2 Ingeniería Neuronal
## MultiLayer Perceptron
### Datos del Alumno
- Alumno: Joaquín Ignacio Villagra Pacheco
- Run: 18.847.934-0
---
## <center> MARCO TEÓRICO </center>

### 1 MultiLayer Perceptron <br>
<I>"El perceptrón multicapa es una red neuronal artificial (RNA) formada por múltiples capas, de tal manera que tiene capacidad para resolver problemas que no son linealmente separables, lo cual es la principal limitación del perceptrón (también llamado perceptrón simple). El perceptrón multicapa puede estar totalmente o localmente conectado. En el primer caso cada salida de una neurona de la capa <b> i </b> es entrada de todas las neuronas de la capa <b> i + 1 </b>, mientras que en el segundo cada neurona de la capa <b> i </b> es entrada de una serie de neuronas (región) de la capa <b> i + 1 </b>" (Wikipedia, 2018).</I>

![image.png](attachment:image.png)

   #### Limitaciones
   - El Perceptrón Multicapa no extrapola bien, es decir, si la red se entrena mal o de manera insuficiente, las salidas pueden ser imprecisas.
   - La existencia de mínimos locales en la función de error dificulta considerablemente el entrenamiento, pues una vez alcanzado un mínimo el entrenamiento se detiene aunque no se haya alcanzado la tasa de convergencia fijada.
   - Cuando caemos en un mínimo local sin satisfacer el porcentaje de error permitido se puede considerar: cambiar la topología de la red (número de capas y número de neuronas), comenzar el entrenamiento con unos pesos iniciales diferentes, modificar los parámetros de aprendizaje, modificar el conjunto de entrenamiento o presentar los patrones en otro orden.


### 2 Función de activación
En redes computacionales, la Función de Activación de un nodo define la salida de un nodo dada una entrada o un conjunto de entradas (Tanembaun, 2012). Para redes neuronales la idea es similar, dado un conjunto de entradas que convergen a una neurona, la función de activación es aquella encargada de procesar una combinación de las entradas (generalmente lineal), dando una imagen de salida a cada combinación de entradas (Salida de una función). 

#### Función Lineal
En las matematicas, se le denomina función lineal a cualquier función de la forma y = mx + b. En particular, para las Redes Neuronales, la función de activación lineal hace referencia al caso particular en donde la pendiente m es igual a 1 y el intecerpto b es igual a 0, dando lugar a la función lineal o función identidad y = x. 

![image.png](attachment:image.png)


#### Función Sigmoide
La función sigmoide describe una evolución que caracteriza a muchos sistemas naturales que muestran una progresión temporal desde unos niveles bajos al inicio, hasta acercarse a un clímax transcurrido un cierto tiempo; la transición se produce en una región caracterizada por una fuerte aceleración intermedia. A menudo la función sigmoide se refiere al caso particular de la función logística.

![image.png](attachment:image.png)

![image.png](attachment:image.png)

In [7]:
# Se importan librerías numpy, matplotlib
import numpy as np
import matplotlib.pyplot as plt

In [13]:
### Se definen funciones de Activación para la neurona

# Función lineal
def activacion_lineal(x):
    return  x

def activacion_lineal_prima(x):
    return 1

# Función Sigmoide
def activacion_sigmoide(x):
    return 1.0/(1 + np.exp(-x))

# Derivada de la función Sigmoide
def activacion_sigmoide_prima(x):
    return np.exp(-x)/((1+np.exp(-x))**2)

#Función tangente hiperbolica
def activacion_tangentehip(x):
    return np.tanh(x)

#Derivada de la función tangente hiperbolica
def activacion_tangentehip_prima(x):
    return 1.0/(np.cosh(x)**2)

In [None]:
# FeedFoward : Propagacion hacia adelante
def prediction(x, w1, w2, bias = 1):
    c1 = sigmoid_activation(x.dot(w1) + bias)
    return sigmoid_activation(c1.dot(w2) + bias)

In [None]:
#Entrenamiento de la red neuronal
def entrenamiento(entradas, salidas, neuronas, iteraciones, tasa_aprendizaje):
    #Asignación de pesos
    w1 = np.random.rand(entradas.shape[1], neuronas)
    w2 = np.random.rand(neuronas, salidas.shape[1])
    errores = []
    for iteracion in range(iteraciones):
        for entrada, salida in zip(entradas, salidas):
            #forward
            l0 = entrada
            l1 = activacion_sigmoide(np.dot(l0, w1) + bias)
            l2 = activacion_sigmoide(np.dot(l1, w2) + bias)
            
            #Aqui comienza el proceso de aprendizaje - BackPropagation
            l2_error = -2*(l2-salida)
            
            #calculo de deltas
            l2_delta = np.multiply(l2_error, activacion_sigmoide_prima(l2.A1))
            l1_error = np.dot(l2_delta, w2.T)
            l1_delta = np.multiply(l1_error, activacion_sigmoide_prima(l1.A1))
            
            #Actualización de Pesos
            w2 = w2 + tasa_aprendizaje*np.dot(l1.T, l2_delta)
            w1 = w1 + tasa_aprendizaje*np.dot(l0.T, l1_delta)
            
        #Probando - Calculando error
        errores.append(np.square(np.subtract(prediction(entradas, w1, w2), salidas)).mean(axis=0).A1)
        if(np.square(np.subtract(prediction(entradas, w1, w2), salidas)).mean(axis=0).A1[0] < 0.01):
            break

    return w1, w2, errores

In [None]:
# Funcion para mostrar tablas de resultados
def predecirFinal(titulo, entradas, salidas, w1, w2):
    print("\nPrediciendo compuerta "+titulo)
    print("\nEntrada\t\tSalida\t\tSalida Esperada")
    print("-"*50)
    for entrada, salida in zip(entradas, salidas):
        try:
            print("{} \t\t  {}\t\t\t{}".format(entrada.A1, int(np.rint(prediccion(entrada, w1, w2))), salida.A1 ))
        except:
            print("\tImposible converger a solucion")

In [29]:
#Configuracion de parametros y arrays de entrada

#Se define semilla para random
np.random.seed(123456)

#Termino constante de ingreso a las neuronas (BIAS = 1)
bias = 1

#Dos entradas
dos_entradas   = np.matrix([[1, 1], [0, 0], [0, 1], [1, 0]])
salidas_AND_2  = np.matrix([[1, 0, 0, 0]]).T
salidas_OR_2   = np.matrix([[1, 0, 1, 1]]).T
salidas_XOR_2  = np.matrix([[1, 1, 0, 0]]).T

#Cuatro entradas
cuatro_entradas = np.matrix([[0, 0, 0, 0], [0, 0, 0, 1], [0, 0, 1, 0], [0, 0, 1, 1], [0, 1, 0, 0], [0, 1, 0, 1], [0, 1, 1, 0], [0, 1, 1, 1], [1, 0, 0, 0], [1, 0, 0, 1], [1, 0, 1, 0], [1, 0, 1, 1], [1, 1, 0, 0], [1, 1, 0, 1], [1, 1, 1, 0], [1, 1, 1, 1]])
salidas_AND_4   = np.matrix([[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1]]).T
salidas_OR_4    = np.matrix([[0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]]).T
salidas_XOR_4   = np.matrix([[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1]]).T 

In [30]:
# Entrenando
w1_AND, w2_AND, error_AND = entrenamiento(dos_entradas, salidas_AND_2, 10, 300, 0.1)

ValueError: shapes (4,10) and (2,10) not aligned: 10 (dim 1) != 2 (dim 0)

In [None]:
predecirFinal("AND", entradas, salidasAND, w1_AND, w2_AND)