<a href="https://colab.research.google.com/github/stunnedbud/CursoRedesProfundas/blob/main/Tarea1_Ejercicio1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Tarea 1 Ejercicio 1. Red de unidades de umbral lineal

En este ejercicio debemos programar y evaluar una red neuronal que aproxime la operación XNOR con funciones de activación escalón unitario. Ésta red se implementó usando NumPy y se entrenará usando gradiente descedente con el algoritmo de retropropagación. 

Recordemos que la operación XNOR ($\odot$) se define de la siguiente manera:

| $x_1$ | $x_2$ | $y$
| ------------- |:-------------:| -----:|
|0 |0 |1|
|0 |1 |0|
|1 |0 |0|
|1 |1 |1|


Podemos observar que:

$XNOR(x_1, x_2) = OR(NOT(OR(x_1,x_2)AND(x_1,x_2)))
$

In [None]:
import numpy as np

Recordemos que la función de activación escalón unitario se define como:

$$
\phi(z) = \begin{array}{ll}
      0 & si & z < 0 \\
      1 & si & z \geq 0 \\
\end{array} 
$$

In [None]:
def escalon_unitario(z):
    return 0 if z < 0 else 1

Definimos en la siguiente función nuestro modelo de neurona o perceptrón, el cual calcula la suma pesada de sus entradas $x$ y vector de pesos $w$, considerando el sesgo $b$, y evalúa este valor usando la función de activación escalón unitario:

In [None]:
def perceptron(x, w, b):
    v = np.dot(w, x) + b
    y = escalon_unitario(v)
    return y


### Arquitectura de la red

Para computar la función XNOR la red neuronal implementará el siguiente flujo operaciones:
<br><br>
<img src="https://media.geeksforgeeks.org/wp-content/uploads/20200518230148/XN_p.png">

Como podemos observar en la imagen, la red está compuesta por 4 perceptrones de activación lineal:

<ul>
<li>El primer nodo OR recibe las dos entradas ($x_1$ y $x_2$) y computa la salida $\hat{y}_1$ usando sus pesos internos ($w_1$ y $w_2$) y sesgo ($b_{OR}$):
$$
\hat{y}_1 = \phi(w_1x_1+w_2x_2+b_{OR})
$$
<br>
</li>
<li>Asimismo el nodo AND recibe las dos entradas ($x_1$ y $x_2$) y computa la salida $\hat{y}_2$ usando sus pesos internos ($w_1$ y $w_2$) y sesgo ($b_{AND}$):
$$
\hat{y}_2 = \phi(w_1x_1+w_2x_2+b_{AND})
$$<br></li>
<li>La salida $\hat{y}_1$ es la entrada del nodo NOT, el cual computa la salida $\hat{y}_3$ usando su peso interno $w_{NOT}$ y sesgo ($b_{NOT}$):
$$
\hat{y}_3 = \phi(w_{NOT}\hat{y}_1+b_{NOT})
$$<br></li>
<li>
Las salidas $\hat{y}_2$, $\hat{y}_3$ son la entrada del segundo nodo OR, el cual computa la salida final $\hat{y}$ usando sus pesos internos ($w_{OR1}$ y $w_{OR2}$) y sesgo ($b_{OR}$):
$$
\hat{y} = \phi(w_{OR1}\hat{y}_3+w_{OR2}\hat{y}_2+b_{OR})
$$<br>
</li>
</ul>

Para que funcione la implementación, los valores de los parámetros deben ser los siguientes:
$$
w_1 = 1, w_2 = 1, w_{NOT} = -1, w_{OR1} = 1, w_{OR2} = 1, b_{AND} = -1.5, b_{OR} = -0.5, b_{NOT} = 0.5
$$

### Implementación 

Esta arquitectura y valores de los parámetros fueron codificados usando nuestro modelo de perceptrón previamente definido:

In [None]:
# Perceptrón para calcular la función lógica NOT 
# wNOT = -1, bNOT = 0.5
def NOT_logicFunction(x):
    wNOT = -1
    bNOT = 0.5
    return perceptron(x, wNOT, bNOT)
  
# Perceptrón para calcular la función lógica AND
# w1 = 1, w2 = 1, bAND = -1.5
def AND_logicFunction(x):
    w = np.array([1, 1])
    bAND = -1.5
    return perceptron(x, w, bAND)
  
# Perceptrón para calcular la función lógica OR
# w1 = wOR1 = 1, 
# w2 = wOR2 = 1, bOR = -0.5
def OR_logicFunction(x):
    w = np.array([1, 1])
    bOR = -0.5
    return perceptron(x, w, bOR)

# Perceptrón para calcular la función lógica XNOR
# usando las anteriores AND, OR, NOT  
def XNOR_logicFunction(x):
    y1 = OR_logicFunction(x)
    y2 = AND_logicFunction(x)
    y3 = NOT_logicFunction(y1)
    final_x = np.array([y2, y3])
    finalOutput = OR_logicFunction(final_x)
    return finalOutput


# Pruebas de funcionamiento

Para probar que nuestra red funciona correctamente simplemente debemos probarla en los 4 casos posibles de entradas $x_1$ y $x_2$.


In [None]:
test1 = np.array([0, 1])
test2 = np.array([1, 1])
test3 = np.array([0, 0])
test4 = np.array([1, 0])
  
print("XNOR({}, {}) = {}".format(0, 1, XNOR_logicFunction(test1)))
print("XNOR({}, {}) = {}".format(1, 1, XNOR_logicFunction(test2)))
print("XNOR({}, {}) = {}".format(0, 0, XNOR_logicFunction(test3)))
print("XNOR({}, {}) = {}".format(1, 0, XNOR_logicFunction(test4)))

XNOR(0, 1) = 0
XNOR(1, 1) = 1
XNOR(0, 0) = 1
XNOR(1, 0) = 0
