*Isabella Alessandra Zavala Y Petriciolli Romo 219556875*

**Clasificación Inteligente de Datos**

# Hands-on 1 Perceptron
Este Notebook presenta un tutorial completo sobre el algoritmo Perceptrón, uno de los clasificadores lineales más fundamentales en el campo del Machine Learning. El objetivo es comprender sus bases teóricas e implementar su funcionamiento práctico utilizando la librería scikit-learn de Python.

**1.1  Fundamentos de la técnica**

El Perceptrón, ideado por Frank Rosenblatt en 1957, es el primer algoritmo de red neuronal artificial y un tipo de clasificador lineal. Su principal función es aprender a clasificar patrones de entrada en dos clases distintas (problema de clasificación binaria) a través de un límite de decisión lineal.

El principio fundamental es simple: si los datos de entrenamiento son linealmente separables (es decir, se puede trazar una línea, plano o hiperplano para separar perfectamente las dos clases), el algoritmo del Perceptrón está garantizado para converger y encontrar esa separación en un número finito de pasos.

El Perceptrón simula la operación de una sola neurona biológica, recibiendo múltiples entradas, ponderándolas, sumándolas, y pasando el resultado a través de una función de activación (generalmente la función escalón, o step function) para producir una salida binaria ($\{+1, -1\}$ o $\{0, 1\}$).

**1.2 Modelo Matemático del Perceptrón**


El Perceptrón opera en dos fases principales: la combinación lineal y la función de activación.

Combinación Lineal (Cálculo del Potencial de Entrada)

Para un vector de entrada $\mathbf{x}$ con $n$ características, el potencial de entrada ($z$) se calcula como la suma ponderada de las entradas más un término de polarización o sesgo ($b$):

$$z = w_1 x_1 + w_2 x_2 + \dots + w_n x_n + b
$$Esto se expresa de manera compacta usando producto punto:

$$z = \mathbf{w} \cdot \mathbf{x} + b
$$Donde:

  * $\mathbf{w}$ es el vector de pesos (weights).
  * $\mathbf{x}$ es el vector de entradas (features).
  * $b$ es el sesgo (bias).

#### Función de Activación (Predicción)

El resultado $z$ se pasa a través de una función de activación (la función escalón) para obtener la predicción binaria $\hat{y}$:$$

\hat{y} = \text{sign}(z) = \begin{cases} +1 & \text{si } z \geq 0 \ -1 & \text{si } z < 0 \end{cases}
$$#### Regla de Aprendizaje (Actualización de Pesos)

El algoritmo aprende iterativamente. Si la predicción $\hat{y}$ es incorrecta para un patrón $x^{(i)}$ con etiqueta real $y^{(i)}$, los pesos se ajustan mediante la siguiente regla (conocida como la Regla del Perceptrón):

$$\mathbf{w}{\text{nuevo}} = \mathbf{w}{\text{anterior}} + \eta \cdot (y^{(i)} - \hat{y}^{(i)}) \cdot \mathbf{x}^{(i)}
$$$$
b_{\text{nuevo}} = b_{\text{anterior}} + \eta \cdot (y^{(i)} - \hat{y}^{(i)})
$$Donde:

$\eta$ (eta) es la tasa de aprendizaje (learning rate), un valor pequeño que controla la magnitud del ajuste (generalmente $\eta \in (0, 1]$).

$(y^{(i)} - \hat{y}^{(i)})$ es el error. Dado que las salidas son $+1$ o $-1$, el error solo puede ser $2$, $-2$, o $0$.

In [None]:
# 0. Importación de librerías necesarias
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Perceptron
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score
import numpy as np



In [None]:
# 1. Carga del dataset Iris
iris = load_iris()
X = iris.data[:, [0, 2]]  # Usamos largo del sépalo y largo del pétalo
y = iris.target

# Para simplificar, seleccionamos solo dos clases: Setosa (0) y Versicolor (1)
X = X[y != 2]
y = y[y != 2]



In [None]:
# 2. División de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=1, stratify=y
)

print(f"Tamaño del conjunto de entrenamiento: {len(X_train)}")
print(f"Tamaño del conjunto de prueba: {len(X_test)}")



Tamaño del conjunto de entrenamiento: 70
Tamaño del conjunto de prueba: 30


In [None]:
# 3. Estandarización de las características
scaler = StandardScaler()
scaler.fit(X_train)
X_train_std = scaler.transform(X_train)
X_test_std = scaler.transform(X_test)


In [None]:
# 4. Creación y entrenamiento del modelo Perceptrón
ppn = Perceptron(eta0=0.1, random_state=1)
ppn.fit(X_train_std, y_train)

print("\n--- Entrenamiento Completado ---")
print(f"Pesos aprendidos (w): {ppn.coef_}")
print(f"Sesgo aprendido (b): {ppn.intercept_}")




--- Entrenamiento Completado ---
Pesos aprendidos (w): [[-0.00803205  0.19536002]]
Sesgo aprendido (b): [0.1]


In [None]:
# 5. Función para clasificar nuevos patrones
def clasificar_patron(modelo, estandarizador, caracteristicas):
    patron_escalado = estandarizador.transform([caracteristicas])
    prediccion = modelo.predict(patron_escalado)
    clase_predicha = "Iris Setosa (Clase 0)" if prediccion[0] == 0 else "Iris Versicolor (Clase 1)"

    print(f"\nCaracterísticas de entrada: {caracteristicas}")
    print(f"Patrón estandarizado: {patron_escalado[0]}")
    print(f"Predicción del modelo: {clase_predicha}")
    return prediccion[0]



In [None]:
# 6. Prueba de patrones
patron_setosa = [5.0, 1.5]
print("\n--- Clasificando Patrón Típico Setosa ---")
clasificar_patron(ppn, scaler, patron_setosa)

patron_versicolor = [6.0, 4.5]
print("\n--- Clasificando Patrón Típico Versicolor ---")
clasificar_patron(ppn, scaler, patron_versicolor)


--- Clasificando Patrón Típico Setosa ---

Características de entrada: [5.0, 1.5]
Patrón estandarizado: [-0.76182782 -0.94135169]
Predicción del modelo: Iris Setosa (Clase 0)

--- Clasificando Patrón Típico Versicolor ---

Características de entrada: [6.0, 4.5]
Patrón estandarizado: [0.94194047 1.12647106]
Predicción del modelo: Iris Versicolor (Clase 1)


np.int64(1)

In [None]:
# 7. Evaluación del modelo
y_pred = ppn.predict(X_test_std)
print(f"\nEtiquetas Reales (primeros 10):   {y_test[:10]}")
print(f"Etiquetas Predichas (primeros 10): {y_pred[:10]}")

accuracy = accuracy_score(y_test, y_pred)
accuracy_porcentaje = accuracy * 100

print(f"\n--- Resultados de la Evaluación ---")
print(f"Muestras clasificadas incorrectamente: {(y_test != y_pred).sum()} de {len(y_test)}")
print(f"Accuracy del modelo en el conjunto de prueba: {accuracy:.4f} ({accuracy_porcentaje:.2f}%)")


Etiquetas Reales (primeros 10):   [1 1 0 0 0 1 1 1 0 0]
Etiquetas Predichas (primeros 10): [1 1 0 0 0 1 1 1 0 0]

--- Resultados de la Evaluación ---
Muestras clasificadas incorrectamente: 0 de 30
Accuracy del modelo en el conjunto de prueba: 1.0000 (100.00%)


**Bibliografía**
* Rosenblatt, F. (1958). The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain. *Psychological Review*, 65(6), 386–408.
* Géron, A. (2022). *Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow* (3rd ed.). O'Reilly Media. (Capítulo 4: Training Models).
* Scikit-learn documentation: `sklearn.linear_model.Perceptron`. https://ask.un.org/faq?gid=605&qid=19478