# Predicción X-OR

<p style='text-align: justify;'>Antes de definir con lujo de detalle cada uno de los componentes de la red neuronal y la matemática relacionada, te presentaremos una red pequeña con la finalidad de que te familiarices con el tema.  El objetivo de esta red será predecir si un número binario tiene una cantidad par o impar de bits con el valor de uno.</p> 

| A 	| B 	| C 	| Y 	|
|:--:	|:--:	|:--:	|:-:	|
|  0 	|  0 	|  0 	| 0 	|
|  0 	|  0 	|  1 	| 1 	|
| 0  	| 1  	| 0  	| 1 	|
| 0  	| 1  	| 1  	| 0 	|
| 1  	| 0  	| 0  	| 1 	|
| 1  	| 0  	| 1  	| 0 	|
|  1 	|  1 	|  0 	| 0 	|
| 1  	| 1  	| 1  	| 1 	|

<p style='text-align: justify;'>En la tabla anterior se muestra que en la primera entrada donde todos los bits son cero, la salida es cero pero en la última entrada donde todos los bits son uno, la salida es uno. Cuando tenemos una cantidad par de unos se asignará una salida de cero y en caso contrario se asigna una salida de uno. La red neuronal que verás a continuación funcionará de manera similar.</p> 

In [None]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
# Arreglos de entrenamiento.
X = np.array(([0,0,0],
              [0,0,1],
              [0,1,0],
              [0,1,1],
              [1,0,0],
              [1,0,1],
              [1,1,0],
              [1,1,1]), dtype = float)

y = np.array(([0],
              [1],
              [1],
              [0],
              [1],
              [0],
              [0],
              [1]), dtype = float)

In [None]:
print(X)

In [None]:
print(y)

<center><img src="img/NN_XOR.png" width = "90%"></center>

In [None]:
lr = 0.5
w0 = np.random.randn(X.shape[1],4)
w1 = np.random.randn(4, 1)
output = np.zeros(y.shape)
Z0,z1,a0,a1,a2,errors = [],[],[],[],[],[]

In [None]:
# Pesos de la capa cero.
w0

In [None]:
# Pesos de la capa uno.
w1

In [None]:
# Conozcamos la salida.
output

In [None]:
def sigmoid(t):
    return 1/(1+np.exp(-t))

def sigmoid_derivative(p):
    return sigmoid(p) * sigmoid(1 - p)

In [None]:
def feedforward(X_input):
    
    #np.dot regresa el producto punto de dos arreglos.
    global a0,z0,a1,z1,a2
    
    # La activación de la capa cero, es la entrada.
    a0 = X_input
    z0 = np.dot(a0,w0) # NOTA: En esta sección se sumarían los baias si existieran.
    
    # La activación de la capa uno, es la información de las neuronas anteriores (Entradas)  
    # a través de la función de activación "sigmoide".
    a1 = sigmoid(z0)
    z1 = np.dot(a1,w1)
    
    # La activación de la capa dos, es la información de las neuronas anteriores (Capa 1)  
    # a través de la función de activación "sigmoide".
    a2 = sigmoid(z1)
    
    # En esta red, aquí terminamos, porque no hay más capas.
    output = a2
    
    return output

In [None]:
def backprop():
    # Aplicando la regla de la cadena para la función de perdida respecto a los pesos 2 y 1.
    # .T devuelve la matriz traspuesta
    global w0,w1,w2,b0,b1,b2
    
    # Calcular el error MSE --> Mean Square Error.
    mse = np.sum( (1 / 2) * (y - output) * (y - output))
    errors.append(mse)

    delta1 = -(y - output) * sigmoid_derivative(z1)
    d_w1 = np.dot(a1.T,delta1)
    d_b1 = delta1
    
    delta0 = np.dot(delta1,w1.T) * sigmoid_derivative(z0)
    d_w0 = np.dot(a0.T,delta0)
    d_b0 = delta0

    # lr --> Learning Rate, es un parametro propuesto por el investigador
    # que indica que tanta importancia le asignamos a los errores del pasado.
    w1 = w1 - lr * d_w1
    w0 = w0 - lr * d_w0

In [None]:
# Sesión de entrenamiento
repeticiones = 1000

for i in range(repeticiones):
    # Primero se realiza el feedforward y despues el back propagation
    output = feedforward(X)
    backprop()
    # Las siguientes líneas muestran el error cada 10 sesiones.
    if i % 10 == 0:
        print("Epoch: {}, mse: {}".format(i,errors[-1]))

In [None]:
w0

In [None]:
w1

# Usemos la red para predecir una entrada

Entrada propuesta $x = [1,0,1]$
<br>Salida esperada $y=0$ (Debido a que tiene un número Par de unos).

In [None]:
# La salida es igual a la predicción de la red ante una entrada.
output = feedforward([1,0,1])
output

# Grafiquemos los errores. 

In [None]:
plt.plot(errors);

# ¿Cómo podemos mejorar el desempeño?
No existe una alternativa única pero se pueden intentar las siguientes alternativas:
<br>1) Incrementar la sesiones de entrenamiento.
<br>2) Experimentar modificando el valor de la taza de aprendizaje ($lr$).
<br>3) Proponer otra configuración de red neuronal.
<br>4) Incluir Baias. 

# Ejercicio

Vuelve a reiniciar la libreta pero antes de ejecutar las celdas donde se define el número de sesiones de entrenamiento, aumenta la variable de $200$ a $500$. Compara con el valor obtenido anterior de la predicción y del último error.