# El perceptrón

> Profesor Jorge Anais

Como vimos en clase, el perceptrón es un modelo muy sencillo. En este notebook implementaremos un perceptrón y revisaremos algunos casos notables.

## Un perceptrón sencillo en Python

Primero definimos la función de activación

In [1]:
def fn_activacion(u: float) -> float:
    """
    Función de activación simple.
    Retorna 1 si el valor de `u` es mayor o igual a 1.
    En caso contrario retorna 0.
    """

    return 1.0 if u >=1.0 else 0.0

Luego definimos el perceptrón

![Perceptron](https://github.com/jorgeanais/dly0100_deeplearning/blob/main/notebooks/imagenes/01_2/perceptron.png?raw=true)

In [2]:
def perceptron(x1: float, x2: float) -> float:
    """
    Calcula la salida del perceptrón donde
    x1, x2 son las entradas
    W1, W2 son los pesos
    B es el sesgo (bias)
    """
    W1 = 0.4
    W2 = 0.4
    B = 0.4

    return fn_activacion(x1*W1 + x2*W2 + B)

Notar que el perceptrón fue definido con pesos arbitrarios (W1, W2 y B iguales a 0.4). Dependiendo de los pesos, el perceptrón puede ser capaz de resolver distintos problemas linealmente separables.

## Caso compuerta AND

![Compuerta AND](https://raw.githubusercontent.com/jorgeanais/dly0100_deeplearning/main/notebooks/imagenes/01_2/compuerta_AND.png?raw=true)

In [3]:
# Escribe tu código aquí para evaluar el perceptrón con las entradas requeridas en la tabla



Completa la siguiente tabla con los valores de las entradas y la salida esperada

| x1 | x2 | Valor Esperado | Valor obtenido |
|----|----|----------------|----------------|
| 0  | 0  | 0              |       x       |
| 1  | 0  | 0              |       x       |
| 0  | 1  | 0              |       x       |
| 1  | 1  | 1              |       x       |

## Caso compuerta OR
![Compuerta OR](https://github.com/jorgeanais/dly0100_deeplearning/blob/main/notebooks/imagenes/01_2/compuerta_OR.png?raw=true)

Cambia los pesos del perceptrón para que resuelva la compuerta OR. Completa la siguiente tabla con los valores de las entradas y la salida esperada

| x1 | x2 | Valor Esperado | Valor obtenido |
|----|----|----------------|----------------|
| 0  | 0  | 0              |                |
| 1  | 0  | 1              |                |
| 0  | 1  | 1              |                |
| 1  | 1  | 1              |                |

In [4]:
# Modifica los pesos de esta función

def perceptron_OR(x1: float, x2: float) -> float:
    """
    Calcula la salida del perceptrón donde
    x1, x2 son las entradas
    W1, W2 son los pesos
    B es el sesgo (bias)
    """
    W1 = ...
    W2 = ...
    B = ...

    return fn_activacion(x1*W1 + x2*W2 + B)

In [5]:
# Corre esta celda para comprobar tu código
for x1 in [0, 1]:
    for x2 in [0, 1]:
        print(f"Entradas: {x1}, {x2} -> Salida: {perceptron_OR(x1, x2)}")

TypeError: unsupported operand type(s) for *: 'int' and 'ellipsis'

Nota: Como podrán darse cuenta es muy difícil adivinar cuales son los pesos correctos. Más adelante veremos como podemos resolver este problema.


## Caso compuerta XOR

Como vimos en clases, el caso de la compuerta XOR no es linealmente separable. Para resolverlo, necesitamos una red neuronal con más de una capa.

![Compuerta OR](https://github.com/jorgeanais/dly0100_deeplearning/blob/main/notebooks/imagenes/01_2/compuerta_XOR.png?raw=true)

In [None]:
def perceptron_1(x1: float, x2: float) -> float:
    """
    Calcula la salida del perceptrón donde
    x1, x2 son las entradas
    W1, W2 son los pesos
    B es el sesgo (bias)
    """
    W1 = ...
    W2 = ...
    B = ...

    return fn_activacion(x1*W1 + x2*W2 + B)


def perceptron_2(x1: float, x2: float) -> float:
    """
    Calcula la salida del perceptrón donde
    x1, x2 son las entradas
    W1, W2 son los pesos
    B es el sesgo (bias)
    """
    W1 = ...
    W2 = ...
    B = ...

    return fn_activacion(x1*W1 + x2*W2 + B)


In [None]:
def combinacion(x1: float, x2: float) -> float:
    """Esta funcion es la suma de los dos perceptrones anteriores"""
    return fn_activacion(perceptron_1(x1, x2) + perceptron_2(x1, x2))

In [None]:
# Corre esta celda para comprobar tu código
for x1 in [0, 1]:
    for x2 in [0, 1]:
        print(f"Entradas: {x1}, {x2} -> Salida: {combinacion(x1, x2)}")

Como puedes comprobar, obtenemos el resultado deseado.

# Contenido Extra

El script `01_perceptron_Rosenblatt.py` contiene una implementación del perceptrón de Rosenblatt.

Dentro de la función main() esta implementado un algoritmo para determinar automaticamente los pesos. Prueba a cambiar la `salida deseada` en la variable `CONJUNTO_ENTRENAMIENTO` (linea 23).



In [None]:
"""
El perceptron de Rosenblatt
Autor: Jorge Anais
Fecha: 18 de marzo de 2023

Ejercicios:
1. Estudia que sucede al disminuir o aumentar la tasa de aprendizaje.
2. Modifica el código para que variar los valores iniciales de los pesos y sesgo [w1, w2, b]
3. Modifica el código para que el perceptrón de Rosenblatt aprenda la función OR.
4. Modifica el código para que el perceptrón de Rosenblatt aprenda la función XOR ¿Es posible?
5. Agrega más ejemplos al conjunto de entrenamiento.
"""


import numpy as np
import matplotlib.pyplot as plt

# PARAMETROS
MAX_EPOCAS = 3000  # Número máximo de épocas
UMBRAL = 1.0  # Umbral de activación
TASA_APRENDIZAJE = 0.1  # Hiperpárametro
PESOS = [0.0, 0.0, 0.0]  # valores iniciales de [w1, w2, b]
CONJUNTO_ENTRENAMIENTO = [
    # ((x1, x2, 1.), salida_deseada)
    ((0.0, 0.0, 1.0), 0.0),
    ((0.0, 1.0, 1.0), 1.0),
    ((1.0, 0.0, 1.0), 1.0),
    ((1.0, 1.0, 1.0), 1.0),
]


def producto(entradas, pesos):
    """
    Realiza la operación de producto punto:
      w1*x1 + w2*x2 + b*1.0
    """
    return sum(entrada * peso for entrada, peso in zip(entradas, pesos))


def grafica(conjunto_de_entrenamiento, pesos, epoca):
    """
    Grafica el conjunto de entrenamiento y la linea de separacion
    """

    # Creamos la linea de separacion
    x1 = np.linspace(-0.2, 1.2, 100)
    x2 = UMBRAL / pesos[1] - pesos[0] / pesos[1] * x1 - pesos[2] / pesos[1]

    # Graficamos la linea de separacion
    plt.plot(
        x1,
        x2,
        label=f"w1={pesos[0]:.2f} w2={pesos[1]:.2f} b={pesos[2]:.2f} iteración={epoca}",
    )

    # Graficamos los casos
    for muestra in conjunto_de_entrenamiento:
        plt.scatter(
            muestra[0][0],
            muestra[0][1],
            c="g" if muestra[1] == 1 else "r",
            marker="o" if muestra[1] == 1 else "x",
        )

    # Ajustamos el rango a mostrar
    plt.xlim(-0.2, 1.2)
    plt.ylim(-0.2, 1.2)
    plt.legend(loc="upper left")
    plt.show()


def main():
    for epoca in range(MAX_EPOCAS):
        print("-" * 26 + f"Época {epoca}" + "-" * 26)
        contador_de_errores = 0

        for vector_de_entrada, salida_deseada in CONJUNTO_ENTRENAMIENTO:
            resultado = producto(vector_de_entrada, PESOS) >= UMBRAL
            error = salida_deseada - resultado
            if error != 0:
                contador_de_errores += 1
                for indice, valor in enumerate(vector_de_entrada):
                    PESOS[indice] += TASA_APRENDIZAJE * error * valor

        print(PESOS)
        print(contador_de_errores)
        grafica(CONJUNTO_ENTRENAMIENTO, PESOS, epoca)

        if contador_de_errores == 0:
            break




if __name__ == "__main__":
    main()


In [None]:
# Ejemplo
def perceptron_3(x1: float, x2: float) -> float:
    """
    Calcula la salida del perceptrón donde
    x1, x2 son las entradas
    W1, W2 son los pesos
    B es el sesgo (bias)
    """
    W1 = 0.4
    W2 = 0.4
    B = 0.7

    return fn_activacion(x1*W1 + x2*W2 + B)

In [None]:
perceptron_3(0.8, 0.8)