<a href="https://colab.research.google.com/" target="_blank"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 1. Red de unidades de umbral lineal
Programa y evalúa una red de neuronas con funciones de activación escalón unitario que aproxime
la operación XNOR (⊙) dada por la siguiente tabla:

| $x_1$ | $x_2$ | $y$
| ------------- |:-------------:| -----:|
|0 |0 |1|
|0 |1 |0|
|1 |0 |0|
|1 |1 |1|

In [None]:
import numpy as np

Se declara la función de activación escalón unitario:

$$
\begin{equation}
  \sigma(z) =
    \begin{cases}
      0, & \text{$z < 0$}\\
      1, & \text{$z \geq 0$}
    \end{cases}  
\end{equation}
$$

In [None]:
def escalonUnitario(x):
    return np.where(x >= 0, 1, 0)

Se sabe que el XOR (⊕) es equivalente a $\neg ((x_1 \land x_2) \lor \neg(x_1 \lor x_2))$. Entonces como el XNOR es la negación del XOR, negando la fórmula anterior se obtiene: $(x_1 \land x_2) \lor \neg(x_1 \lor x_2)$.  
  
Asi, para modelar el XNOR se requiere de un AND, un NOR y un OR. A continuación se muestran los valores de pesos y sesgos para aproximar cada una.

### AND
$W_1^{\{1\}} = 1,\ W_2^{\{1\}} = 1$ y $\ b_1^{\{1\}} = -1.5$

| $x_1$ | $x_2$ | AND | z = $W_1x_1$ + $W_2x_2$ + $b_1^{\{1\}}$ | $\sigma$(z)
| ------------- |:-------------:| -----:|:------------------:|:-----:|
|0 |0 |0| -1.5| 0
|0 |1 |0| -0.5| 0
|1 |0 |0| -0.5| 0
|1 |1 |1| 0.5|  1

### NOR
$W_3^{\{1\}} = -1,\ W_4^{\{1\}} = -1$ y $\ b_2^{\{1\}} = 0.5$

| $x_1$ | $x_2$ | NOR | z = $W_3^{\{1\}}$$x_1$ + $W_4^{\{1\}}$$x_2$ + $b_2^{\{1\}}$ | $\sigma$(z)
| ------------- |:-------------:| -----:|:------------------:|:-----:|
|0 |0 |1| 0.5| 1
|0 |1 |0| -0.5| 0
|1 |0 |0| -0.5| 0
|1 |1 |0| -1.5| 0

### OR
$W_1^{\{2\}} = 1,\ W_2^{\{2\}} = 1$ y $\ b_1^{\{2\}} = -0.5$

| $x_1$ | $x_2$ | OR | z = $W_1^{\{2\}}$$x_1$ + $W_2^{\{2\}}$$x_2$ + $b_1^{\{2\}}$ | $\sigma$(z)
| ------------- |:-------------:| -----:|:------------------:|:-----:|
|0 |0 |0| -0.5| 0
|0 |1 |1| 0.5| 1
|1 |0 |1| 0.5| 1
|1 |1 |1| 1.5| 1

### Diagrama de la red neuronal
A continuación se muestra la conexión neuronal que debe realizarse para modelar el XNOR de acuerdo a la fórmula proposicional obtenida $(x_1 \land x_2) \lor \neg(x_1 \lor x_2)$, así como los pesos y sesgos descritos.

![image.png](https://raw.githubusercontent.com/diego200052/Aprendizaje-Profundo-Tarea01-MMDR/master/images/T01-redneuronal.png)

A continuación se muestran los pesos y sesgos que aproximan AND, NOR (para la primera capa) y OR (para la segunda capa).

$$
W_{AND} = \left[\begin{matrix}
        1\\
        1\\
        \end{matrix}\right]
b_{AND} = \left[\begin{matrix}
        -1.5\\
        \end{matrix}\right]\\
W_{NOR} = \left[\begin{matrix}
        -1\\
        -1\\
        \end{matrix}\right]
b_{NOR} = \left[\begin{matrix}
        0.5\\
        \end{matrix}\right]\\
W^{\{1\}} = \left[\begin{matrix}
        1 & -1\\
        1 & -1\\
        \end{matrix}\right]
b^{\{1\}} = \left[\begin{matrix}
        -1.5\\
        0.5\\
        \end{matrix}\right]\\
$$
  
  
$$
W_{OR} = \left[\begin{matrix}
        1\\
        1\\
        \end{matrix}\right]
b_{NOR} = \left[\begin{matrix}
        -0.5\\
        \end{matrix}\right]\\
W^{\{2\}} = \left[\begin{matrix}
        1\\
        1\\
        \end{matrix}\right]\\
b^{\{2\}} = \left[\begin{matrix}
        -0.5
        \end{matrix}\right]\\
$$

In [None]:
# Perceptrón AND
WAND = np.array([1, 1])
bAND = np.array([-1.5])
# Perceptrón NOR
WNOR = np.array([-1, -1])
bNOR = np.array([0.5])

# Construir la matriz de pesos W1
W1 = np.concatenate((WAND, WNOR)).reshape(2,2).T
b1 = np.concatenate((bAND, bNOR))
print(f"W1 = {W1}")
print(f"b1 = {b1}\n")

# Perceptrón OR
WOR = np.array([1, 1])
bOR = np.array([-0.5])

# Construir la matriz de pesos W2
W2 = WOR
b2 = bOR
print(f"W2 = {W2}")
print(f"b2 = {b2}")

W1 = [[ 1 -1]
 [ 1 -1]]
b1 = [-1.5  0.5]

W2 = [1 1]
b2 = [-0.5]


La suma pesada se puede escribir como la suma de la multiplicación de pesos y entradas, más el sesgo: $z = W_1 \cdot x_1 + W_2 \cdot x_2 + W_3 \cdot x_3 + \ldots + W_m \cdot x_m + b$. De manera matricial/vectorial se escribe como : $z = W^{T} x + b$.

In [None]:
def sumaPesada(W, x, b):
    return W.T @ x + b

Finalmente, se realiza Feed-forward de manera que la primer capa multiplica las entradas $x$ con $W1$, más el sesgo, y luego pasa por la función de activación escalon unitario para obtener la salida de esa capa. Después para la segunda capa se multiplica $a1$ (la salida de la primer capa) con $W2$, más el sesgo, y se pasa por la función de activación, lo cual es la salida de la red.

In [None]:
def XNOR(x):
    z1 = sumaPesada(W1, x, b1)
    a1 = escalonUnitario(z1)
    z2 = sumaPesada(W2, a1, b2) 
    y_hat = escalonUnitario(z2)
    return y_hat

## Resultados

A continuación se muestran los resultados ante las 4 posibles combinaciones de entradas para la XNOR y sus respectivas salidas.

In [None]:
x = np.array([0, 0])
print(f"XNOR: {x} = {XNOR(x)}")

x = np.array([0, 1])
print(f"XNOR: {x} = {XNOR(x)}")

x = np.array([1, 0])
print(f"XNOR: {x} = {XNOR(x)}")

x = np.array([1, 1])
print(f"XNOR: {x} = {XNOR(x)}")

XNOR: [0 0] = [1]
XNOR: [0 1] = [0]
XNOR: [1 0] = [0]
XNOR: [1 1] = [1]


**Conclusión:** Un solo perceptrón no es capaz de modelar funciones como la XNOR, debido a que no es linealmente separable. En este caso para solucionarlo, se emplearon tres perceptrones, dos en la primer capa y uno en la segunda capa, que combinan funciones linealmente separables como el AND y el OR para modelar funciones más complejas.
  
La función de activación de escalón unitario fue útil para tratar con valores discretos binarios. Sin embargo, en retropropagación no sería útil ya que su derivada puede resultar en 0.