# Mi primera red neuronal 🚀

En esta notebook, vamos a explorar la implementación de una red neuronal simple conocida como perceptrón. Un perceptrón es una unidad básica de una red neuronal que puede utilizarse para resolver problemas de clasificación binaria, como las funciones lógicas.

## Objetivos de Aprendizaje

Al final de esta notebook, serás capaz de:

1. Implementar un perceptrón simple en con las funciones lógicas (AND, OR, XOR) vistas en clase de dos formas diferentes:
    - Utilizando multiplicación de matrices ($sgn\left( X \, W \right)$).
    - Utilizando el sesgo ($sgn\left( X \, W + b \right)$).
2. [Opcional] Implementar el resto de las funciones lógicas (NAND, NOR, XNOR) utilizando perceptrones.
3. Implementar una Perceptrón Multicapa (MLP) para resolver el problema XOR.
4. [Opcional] Implementar un MLP para resolver las todas las funciones lógicas al mismo tiempo (AND, OR, XOR).


## Implementación de un Perceptrón

Un perceptrón es una unidad básica de una red neuronal que puede utilizarse para resolver problemas de clasificación binaria.

$$
\mathcal{P}(x; w) = sgn(x\, w) = sgn\left( \sum_i x_i w_i \right)
\quad x, w \in \mathbb{R}^m
$$
con
$$
 sgn(u) =
  \begin{cases}
   +1 & \text{if } u \geq 0 \\
   -1 & \text{if } u < 0
  \end{cases}
$$

En forma vectorial

$$\mathcal{P}(X; W) = sgn\left( X \, W \right) \quad X \in \mathbb{R}^{(n,m)}, \, W \in \mathbb{R}^{(m,1)}$$


### AND

La función lógica AND es una función que toma dos entradas binarias y devuelve 1 si ambas entradas son 1, y 0 en cualquier otro caso.

| $x_1$ | $x_2$ | $y$ |
|-------|-------|-----|
| 0     | 0     | 0   |
| 0     | 1     | 0   |
| 1     | 0     | 0   |
| 1     | 1     | 1   |


#### Implementación con multiplicación de matrices

$$
X = \begin{pmatrix}
  0 & 0 & 1 \\
  0 & 1 & 1 \\
  1 & 0 & 1 \\
  1 & 1 & 1 \\
 \end{pmatrix}
\qquad
\textbf{AND}\left( X \right) =
 \begin{pmatrix}
  -1 \\
  -1 \\
  -1 \\
  1  \\
 \end{pmatrix}
\qquad
n = 4
$$

> Notar que los valores esperados son -1 y 1 en lugar de 0 y 1.

$$
\textbf{AND}\left(X \right) = sgn\left( X \,   
    \begin{pmatrix}
      .5 \\
      .5 \\
      -1 \\
    \end{pmatrix} \right)
    \quad
    m = 3
$$

In [None]:
# Vamos a trabajar con PyTorch (tensores) para las operaciones matriciales
import torch

Definimos la función `sgn` que aplica la función signo a un número.

> Nota: pytorch tiene una función `torch.sign` pero difiere cuando la entrada es 0. En este caso, `torch.sign` devuelve 0 y `sgn` devuelve 1.
Más información en: https://pytorch.org/docs/stable/generated/torch.sign.html


In [None]:
def sgn(x):
    return torch.where(x >= 0, 1.0, -1.0)

Definimos `X` y `W` como tensores de pytorch, es importante definir el tipo de dato como `torch.float32` para que las operaciones matriciales se realicen correctamente.

In [None]:
X = torch.tensor([[0, 0, 1], [0, 1, 1], [1, 0, 1], [1, 1, 1]], dtype=torch.float32)

# TODO
# W_and =

Por último, calculamos el resultado de la función AND.

In [None]:
def AND(Input):
    # TODO
    # return 

print(f"{AND(X) = }")

Vemos que el resultado es el esperado.

$$
\textbf{AND}\left( X \right) =
 \begin{pmatrix}
  -1 \\
  -1 \\
  -1 \\
  1  \\
 \end{pmatrix}
\qquad
$$

In [None]:
res = AND(torch.tensor([1, 0, 1], dtype=torch.float32))
print(f"{res = }")

#### Implementación con sesgo (X W + b)

Ahora vamos a implementar la función AND utilizando un sesgo, es decir agregando un término adicional a la multiplicación de matrices.

Por lo cual nuestro X ahora es de la forma:

$$
X = \begin{pmatrix}
  0 & 0 \\
  0 & 1 \\
  1 & 0 \\
  1 & 1 \\
 \end{pmatrix}
$$

Y nuestro W y b son:

$$
W = \begin{pmatrix}
  .5 \\
  .5 \\
  \end{pmatrix}
\qquad
b = -1
$$

In [None]:
X = torch.tensor([[0, 0], [0, 1], [1, 0], [1, 1]], dtype=torch.float32)

# TODO
# W_and =
# b =

In [None]:
def AND(Input):
    # TODO
    # return

Notar `b` hace brodcasting, ya que es un escalar y `X` es una matriz.

Más información en:
- https://numpy.org/doc/stable/user/basics.broadcasting.html
- https://pytorch.org/docs/stable/notes/broadcasting.html 

In [None]:
AND(X)

### OR

La función lógica OR es una función que toma dos entradas binarias y devuelve 1 si al menos una de las entradas es 1, y 0 en cualquier otro caso.

| $x_1$ | $x_2$ | $y$ |
|-------|-------|-----|
| 0     | 0     | 0   |
| 0     | 1     | 1   |
| 1     | 0     | 1   |
| 1     | 1     | 1   |


#### Implementación con multiplicación de matrices

$$
X = \begin{pmatrix}
  0 & 0 & 1 \\
  0 & 1 & 1 \\
  1 & 0 & 1 \\
  1 & 1 & 1 \\
 \end{pmatrix}
\qquad
\textbf{OR}\left( X \right) =
 \begin{pmatrix}
  -1 \\
  1 \\
  1 \\
  1  \\
 \end{pmatrix}
\qquad
n = 4
$$


$$
\textbf{OR}\left(X \right) = sgn\left( X \,   
    \begin{pmatrix}
      ? \\
      ? \\
      ? \\
    \end{pmatrix} \right)
    \quad
    m = 3
$$

In [None]:
X = torch.tensor([[0, 0, 1], [0, 1, 1], [1, 0, 1], [1, 1, 1]], dtype=torch.float32)

# TODO
# W_nor =

In [None]:
def OR(Input):
    # TODO
    # return


print(f"{OR(X) = }")

#### Implementación con sesgo (X W + b)

$$
X = \begin{pmatrix}
  0 & 0 \\
  0 & 1 \\
  1 & 0 \\
  1 & 1 \\
 \end{pmatrix}
$$

Y nuestro W y b son:

$$
W = \begin{pmatrix}
  ? \\
  ? \\
  \end{pmatrix}
\qquad
b = ?
$$

In [None]:
# TODO...

### XOR

La función lógica XOR es una función que toma dos entradas binarias y devuelve 1 si las entradas son diferentes, y 0 si son iguales.

| $x_1$ | $x_2$ | $y$ |
|-------|-------|-----|
| 0     | 0     | 0   |
| 0     | 1     | 1   |
| 1     | 0     | 1   |
| 1     | 1     | 0   |

#### Implementación con multiplicación de matrices

$$
X = \begin{pmatrix}
  0 & 0 & 1 \\
  0 & 1 & 1 \\
  1 & 0 & 1 \\
  1 & 1 & 1 \\
 \end{pmatrix}
\qquad
\textbf{XOR}\left( X \right) =
 \begin{pmatrix}
  -1 \\
  1 \\
  1 \\
  -1  \\
 \end{pmatrix}
\qquad
n = 4
$$

$$
\textbf{XOR}\left(X \right) = sgn\left( X \,   
    \begin{pmatrix}
      ? \\
      ? \\
      ? \\
    \end{pmatrix} \right)
    \quad
    m = 3
$$

In [None]:
# TODO...

### [Opcional] Implementar el resto de las funciones lógicas (NAND, NOR, XNOR) utilizando perceptrones.

#### NAND

| $x_1$ | $x_2$ | $y$ |
|-------|-------|-----|
| 0     | 0     | 1   |
| 0     | 1     | 1   |
| 1     | 0     | 1   |
| 1     | 1     | 0   |


In [None]:
# TODO...

#### NOR

| $x_1$ | $x_2$ | $y$ |
|-------|-------|-----|
| 0     | 0     | 1   |
| 0     | 1     | 0   |
| 1     | 0     | 0   |
| 1     | 1     | 0   |

In [None]:
# TODO...

#### NXOR

| $x_1$ | $x_2$ | $y$ |
|-------|-------|-----|
| 0     | 0     | 1   |
| 0     | 1     | 0   |
| 1     | 0     | 0   |
| 1     | 1     | 1   |


In [None]:
# TODO...

## XOR con Perceptrón Multicapa (MLP)

Para resolver el problema XOR, necesitamos una red neuronal más compleja, como una Perceptrón Multicapa (MLP).

In [None]:
import torch.nn as nn
import torch.optim as optim


# Entradas
X = torch.tensor([[0, 0], [0, 1], [1, 0], [1, 1]], dtype=torch.float32)
# Salidas esperadas
y = torch.tensor([[0], [1], [1], [0]], dtype=torch.float32)

In [None]:
# Definimos el modelo

class XORNet(nn.Module):
    def __init__(self):
        super(XORNet, self).__init__()
        # TODO

    def forward(self, x):
        # TODO
        
# Aternativa
# xor_seq = torch.nn.Sequential(
#     pass
# )

In [None]:
# Instanciamos
model = XORNet()
criterion = nn.BCELoss()
optimizer = optim.SGD(model.parameters(), lr=0.1)

In [None]:
# training loop
epochs = 10_000

for epoch in range(epochs):
    model.train()  # traing mode

    output = model(X)
    loss = criterion(output, y)

    optimizer.zero_grad()  # reseteamos los gradientes
    loss.backward()
    optimizer.step()

    if (epoch + 1) % 1_000 == 0:
        print(f"Epoch [{(epoch + 1)}/epochs], Loss: {loss.item():.4f}")

In [None]:
# evaluando el modelo
model.eval()

with torch.no_grad():
    # TODO

## [Opcional] Implementar una MLP para resolver las todas las funciones lógicas al mismo tiempo (AND, OR y XOR).


| $x_1$ | $x_2$ | $y_{AND}$ | $y_{OR}$ | $y_{XOR}$ |
|-------|-------|-----------|----------|-----------|
| 0     | 0     | 0         | 0        | 0         |
| 0     | 1     | 0         | 1        | 1         |
| 1     | 0     | 0         | 1        | 1         |
| 1     | 1     | 1         | 1        | 0         |


In [None]:
# Entradas
X = torch.tensor([[0, 0], [0, 1], [1, 0], [1, 1]], dtype=torch.float32)
# Salidas esperadas
y = torch.tensor([[0, 0, 0], [0, 1, 1], [0, 1, 1], [1, 1, 0]], dtype=torch.float32)

# TODO...