<h2>Hands-on 1: Percepton Notebook (Tutorial)</h2>

<h3>1. Fundamentos de la técnica.</h3>

El Perceptron es una de las arquitecturas de redes neuronales artificiales más simples, introducida por Frank Rosenblatt en 1957. Se utiliza principalmente para la clasificación binaria y se basa en una neurona artificial única que imita el comportamiento básico de una neurona biológica.

Sus elementos básicos son: Características de Entrada ($X$), Pesos ($W$), una Función de Suma (para calcular la suma ponderada), una Función de Activación (generalmente la función escalón de Heaviside), un Sesgo (Bias, $b$) y un Algoritmo de Aprendizaje.

Mecanismo: El Perceptrón toma múltiples entradas, realiza una suma ponderada de estas, y aplica una función de activación (función escalón) para producir una salida binaria (clase 0 o 1). La clave del Perceptrón es su regla de aprendizaje, que ajusta los pesos del modelo iterativamente con el objetivo de clasificar correctamente los datos de entrenamiento.

<h3>2. Modelo matemático del perceptrón.</h3>

    2.1 Función de Suma Ponderada:

El Perceptrón primero calcula la suma ponderada de las entradas, donde cada entrada ($x_i$) se multiplica por su peso correspondiente ($w_i$).

$$z = w_1x_1 + w_2x_2 + \ldots + w_nx_n = \mathbf{X}^\mathbf{T}\mathbf{W}$$

$\mathbf{X}$: Vector de entradas.

$\mathbf{W}$: Vector de pesos.

    2.2 Función de Activación y Salida:

El resultado de la suma ponderada se pasa a través de una función de activación para determinar la salida binaria. La inclusión del sesgo ($b$) se representa en la ecuación final de la salida:

$$\text{Salida} = f_{W,b}(\mathbf{X})=h(\mathbf{X}\mathbf{W} + b)$$

Donde $h(z)$ es la función escalón, definida como:

$$h(z) = \begin{cases} 0 & \text{si } z <br \text{Umbral} \\ 1 & \text{si } z \geq \text{Umbral} \end{cases}$$

    2.3 Regla de Aprendizaje (Actualización de Pesos):

Durante el entrenamiento, los pesos se ajustan para minimizar el error entre la salida predicha ($\hat{y}_j$) y el valor real ($y_j$). La fórmula de actualización de pesos es:

$$\mathbf{w}_{i,j} = \mathbf{w}_{i,j} + \eta (y_j - \hat{y}_j)x_i$$

Donde:$\mathbf{w}_{i,j}$: Peso entre la $i$-ésima entrada y la $j$-ésima neurona de salida.

$(y_j - \hat{y}_j)$: Error de predicción.

$\eta$: Tasa de aprendizaje (controla la magnitud del ajuste).

$x_i$: Valor de la $i$-ésima entrada.

<h3>3. Descripción de las librerías.</h3>

Para la implementación del Perceptrón en Python se realizará con la ayuda de la librería Scikit-learn:

    Clase Perceptron: (del módulo sklearn.linear_model) 

Contiene la implementación del algoritmo Perceptrón.

    Función accuracy_score: (del módulo sklearn.metrics) 

Es la métrica empleada para calcular la Precisión (Accuracy) del modelo.

<h3>4. Pipeline.</h3>



    4.1 Feature Engineering

Después de revisar la teoría, implementaremos una compuerta lógica AND con ayuda del Perceptrón.

Entradas ($\mathbf{X}$):

En este caso, hay dos entradas ($x_1, x_2$)  con dos posibles valores (0 o 1). Estas serán nuestras características.

Salida ($\mathbf{y}$):

Tenemos una única salida ($y$), que es el resultado de la operación AND ($x_1 \text{ AND } x_2$). Esta será la clase objetivo.





In [9]:
import numpy as np
from sklearn.linear_model import Perceptron
from sklearn.metrics import accuracy_score

X_train = np.array([
    [0, 0],
    [0, 1],
    [1, 0],
    [1, 1]
])

y_train = np.array([0, 0, 0, 1])

print(f"Entradas X (patrones): \n{X_train}")
print(f"\nSalidas Y (etiquetas):\n {y_train}")

Entradas X (patrones): 
[[0 0]
 [0 1]
 [1 0]
 [1 1]]

Salidas Y (etiquetas):
 [0 0 0 1]


    4.2 Model Selection

Se emplea un Percetrón porque la compuerta lógica AND es un problema de clasificación linealmente separable. Es decir, es posible dibujar una linea recta que separe perfectamente las entradas que resultan en la clase 0 de la que da resultado 1.

    4.3 Model Training


In [6]:
# Inicializar el Perceptrón
model = Perceptron(max_iter=100, tol=None, random_state=42, eta0=0.1)

# Entrenar el Perceptrón
model.fit(X_train, y_train)

print("--- Modelo ---")
print(f"Pesos finales (w): {model.coef_[0]}")
print(f"Bias final (b): {model.intercept_[0]}")

--- Modelo ---
Pesos finales (w): [0.2 0.2]
Bias final (b): -0.20000000000000004


    4.4 Prediction

In [10]:
def test_and_gate(model, X_data, y_true):
    print("\n--- Predicciones ---")
    
    for x, y_expected in zip(X_data, y_true):
        x_input = x.reshape(1, -1)
        y_pred = model.predict(x_input)[0]
        
        print(f"Entrada: {x} | Salida esperada: {y_expected} | Salida Predicha: {y_pred}")


test_and_gate(model, X_train, y_train)


--- Predicciones ---
Entrada: [0 0] | Salida esperada: 0 | Salida Predicha: 0
Entrada: [0 1] | Salida esperada: 0 | Salida Predicha: 0
Entrada: [1 0] | Salida esperada: 0 | Salida Predicha: 0
Entrada: [1 1] | Salida esperada: 1 | Salida Predicha: 1


    4.5 Model Evaluation.


In [13]:
y_pred = model.predict(X_train)

accuracy = accuracy_score(y_train, y_pred)

print("\n--- Evaluación del Modelo ---")
print(f"Precisión (Accuracy): {accuracy:.2f}")


--- Evaluación del Modelo ---
Precisión (Accuracy): 1.00


Despues de calcular los resultados, podemos decir que el Perceptrón logró clasificar corectamente el 100% de los casos de la compuerta AND, lo cual confirma que el algoritmo funciona y es capaz de aplicarse a este problema.

<h3>5. Referecias bibliográficas</h3>

GeeksforGeeks. (s.f.). Perceptron class in Sklearn. https://www.geeksforgeeks.org/machine-learning/sklearn-perceptron/

GeeksforGeeks. What is Perceptron | The Simplest Artificial neural network. https://www.geeksforgeeks.org/machine-learning/what-is-perceptron-the-simplest-artificial-neural-network/

Scikit-learn. (s.f.). Perceptron — scikit-learn 1.7.2 documentation. https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Perceptron.html