# Tarea 1 - Redes densas
## Eduardo García Alarcón

### 1. Red de unidades de umbral

Programa y evalúa una red de neuronas con funciones de activación escalón unitario que aproxime la operación **XNOR** ($\odot$) dada por:

| $x_1$ | $x_2$ | $y$ 
|:-----:|:-----:|:---:|
|   0   |   0   |  1  |
|   0   |   1   |  0  |
|   1   |   0   |  0  |
|   1   |   1   |  1  |

Para ello debes asignarle los pesos y sesgos adecuados a cada neurona manualmente. Explica la elección de la red y los valores de los pesos y sesgos

In [1]:
#Bibliotecas
import numpy as np
import scipy as sp
from matplotlib import pyplot as plt
from sklearn import datasets

## Unidad de Umbral Lineal
La operación que lleva a cabo una neurona articial está dada por la suma pesada evaluada con una función de activación $\phi$. Una de las primeras funciones de activación utilizadas fue la escalón unitario, definida como

$
\phi(x) = \begin{cases} 1, & \text{si } x \geq 0\\0, & \text{en caso contrario}\end{cases}
$

Esta se puede llevar a cabo con la siguiente función de Python:

In [2]:
def escalon(z):
  if z >= 0.0:
    return 1.0
  else:
    return 0.0

## Neurona
Definimos la neurona

In [3]:
def neurona(x, w, b):
  z = w.T @ x + b
  return escalon(z)

Probamos nuestra neurona con $ w = [-10, -10] $ y $b=5$ para obtener la tabla de la compuerta $NOR$

In [4]:
X = np.array([[0., 0.], [0., 1.], [1., 0.], [1., 1.]])
w = np.array([-10, -10])
b = 5

print('-----------------------------')
print('x_1 \tx_2 \ty_hat')
print('-----------------------------')
for i in range(X.shape[0]):
  y_hat = neurona(X[i, :].T, w, b)
  print('{0} \t{1}\t{2}'.format(X[i, 0], X[i, 1], y_hat))

-----------------------------
x_1 	x_2 	y_hat
-----------------------------
0.0 	0.0	1.0
0.0 	1.0	0.0
1.0 	0.0	0.0
1.0 	1.0	0.0


---
Sabemos que XNOR está en un espacio no linealmente separable, por lo que necesitamos al menos dos capas para poder realizar el cálculo

Desarrollamos la definición de XNOR para entender cómo armar nuetra red con las compuertas más básicas desde la definición de $XOR= ((x_1 \lor x_2) \land \neg(x_1 \land x_2))$

$x_1 \mathbin{\odot} x_2 = \neg((x_1 \lor x_2) \land \neg(x_1 \land x_2)) = \neg(x_1 \lor x_2) \lor (x_1 \land x_2) $  
Lo cual podemos observar está compuesto con solo 3 compuertas lógicas las cuales ya hemos revisado en clase: NOR, OR y AND


In [5]:
# Definimos una red multicapa
def multicapa(x, w1, b1, w2, b2):
  escv = np.vectorize(escalon)
  a = escv(np.dot( w1.T, x ) + b1)
  return escv( np.dot( w2.T, a ) + b2 )

Ahora buscamos los valores de pesos y offsets adecuados para aproximar la función

Encontrando los valores de pesos y sesgos adecuados, podemos usar esta función para aproximar la computerta XNOR. En clase ya hemos encontrado los pesos y sesgos para las compuertas OR, AND y NOR, por lo que podemos usar estas neuronas con sus correspondientes pesos y sesgos. La red tendría 2 neuronas conectadas a las entradas que realizan las operaciones NOR ($w_{11}^{\{1\}} = -10$, $w_{12}^{\{1\}} = -10$ y $b_1^{\{1\}} = 5$)  y AND ($w_{21}^{\{1\}} = 10$, $w_{22}^{\{1\}} = 10$ y $b_2^{\{1\}} = -15$) respectivamente. La salida de estas 2 neuronas estarían conectadas a una tercera neurona que realiza la operacioón OR ($w_{11}^{\{2\}} = 10$, $w_{12}^{\{2\}} = 10$ y $b_1^{\{2\}} = -5$). En su forma matricial:

$$
\mathbf{W}^{\{1\}} = \left[\begin{matrix}
-10 & 10\\
-10 & 10
\end{matrix}\right]
$$

$$
\mathbf{b}^{\{1\}} = \left[\begin{matrix}
5 \\
-15
\end{matrix}\right]
$$

$$
\mathbf{W}^{\{2\}} = \left[\begin{matrix}
10\\
10
\end{matrix}\right]
$$

$$
\mathbf{b}^{\{2\}} = \left[\begin{matrix}
-5\\
\end{matrix}\right]
$$

In [9]:
# Datos de entrada y salida esperada para XNOR
X = np.array([[0., 0.], [0., 1.], [1., 0.], [1., 1.]])
y_xnor = np.array([1., 0., 0., 1.])

# Pesos y sesgos
W1 = np.array([[-10, -10], [10, 10]]).T
b1 = np.array([5, -15]).T

W2 = np.array([[10], [10]])
b2 = np.array([-5])

# Imprimir los resultados
print(f'W_1 = [{W1[0, :]}{W1[1, :]}], b_1 = {b1}')
print(f'W_2 = [{W2[0]}{W2[1]}], b_2 = {b2}')
print(f'-----------------------------')
print(f'x_1 \tx_2 \ty\ty_hat')
print(f'-----------------------------')
for i in range(X.shape[0]):
    y_hat = multicapa(X[i].T, W1, b1, W2, b2)
    print(f'{X[i, 0]}\t{X[i, 1]}\t{y_xnor[i]}\t{y_hat[0]}')


W_1 = [[-10  10][-10  10]], b_1 = [  5 -15]
W_2 = [[10][10]], b_2 = [-5]
-----------------------------
x_1 	x_2 	y	y_hat
-----------------------------
0.0	0.0	1.0	1.0
0.0	1.0	0.0	0.0
1.0	0.0	0.0	0.0
1.0	1.0	1.0	1.0
