# Perceptron

### Fundamentos de la tecnica.

El Perceptrón es uno de los modelos más antiguos y fundamentales del aprendizaje automático supervisado.  
Fue propuesto por Frank Rosenblatt en 1958 como un modelo inspirado en el funcionamiento de las neuronas biológicas.

Su propósito principal es clasificar patrones linealmente separables, es decir, separar ejemplos de dos clases mediante una frontera de decisión lineal.  
Matemáticamente, busca un vector de pesos **w** y un sesgo **b** que definan un hiperplano que divida los datos en dos regiones:


$$
w \cdot x + b = 0
$$


El modelo aprende ajustando sus pesos de manera iterativa en función de los errores de clasificación.  
Cada vez que clasifica incorrectamente un patrón, el Perceptrón actualiza los pesos para acercarse a una solución que clasifique correctamente los ejemplos de entrenamiento.

Aunque hoy en día existen modelos más sofisticados (como las redes neuronales multicapa), el Perceptrón sigue siendo importante porque:
- Representa el origen histórico de las redes neuronales.
- Es una herramienta ideal para comprender el aprendizaje lineal.
- Permite entrenar clasificadores simples de forma rápida y eficiente cuando los datos son separables linealmente.

### Modelo Matemático del Perceptrón

El modelo matemático del Perceptrón se basa en los siguientes elementos:

- **x** → vector de entrada (características o atributos):  

$$
x = [x_1, x_2, ..., x_n]
$$

- **w** → vector de pesos asociado a cada característica:

$$
w = [w_1, w_2, ..., w_n]
$$

- **b** → sesgo o bias (constante que permite desplazar la frontera de decisión).
- **f(x)** → función de activación (en el Perceptrón clásico, es una función escalón).

El modelo realiza una combinación lineal de las entradas:
$$
z = w \cdot x + b = \sum_{i=1}^{n} w_i x_i + b
$$

Y luego aplica la función de activación:

$$
f(z) =
\left\{
\begin{array}{ll}
1, & \text{si } z \ge 0,\\[6pt]
0, & \text{si } z < 0.
\end{array}
\right.
$$

### Descripción de la librería, clases y funciones empleados.

En Python, la implementación más común y práctica del Perceptrón se encuentra en la librería scikit-learn.

#### Librería principal:
- `sklearn.linear_model` → contiene modelos lineales, incluyendo el `Perceptron`.

#### Clase principal:
- **`sklearn.linear_model.Perceptron`**
  - Implementa el algoritmo clásico del Perceptrón con opciones adicionales, como regularización y número máximo de iteraciones.

#### Parámetros importantes del constructor:
- `penalty` → tipo de regularización ("l2", "l1", "elasticnet", o `None`).
- `alpha` → coeficiente de regularización.
- `fit_intercept` → indica si se calcula el término de sesgo.
- `max_iter` → número máximo de iteraciones (épocas) sobre los datos.
- `eta0` → tasa de aprendizaje inicial.
- `random_state` → semilla para reproducibilidad.

#### Métodos principales:
- `.fit(X, y)` → entrena el modelo con los datos de entrada `X` y etiquetas `y`.
- `.predict(X)` → genera predicciones para nuevos ejemplos.
- `.score(X, y)` → devuelve la precision del modelo.
- `.get_params()` → muestra los parámetros actuales del modelo.
- `.set_params(**params)` → modifica los parámetros del modelo.

El `Perceptron` de `scikit-learn` utiliza internamente una implementación optimizada basada en stochastic gradient descent (SGD), lo que lo hace eficiente incluso con datasets medianos.

### Pipeline

#### Importacion de librerias

In [3]:
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import Perceptron
from sklearn.metrics import accuracy_score, classification_report

import pandas as pd
import numpy as np

#### Feature Engineering

In [7]:
# Cargar dataset
data = load_breast_cancer()

# Inspeccionar los datos
print(data.DESCR[:500])
print("\nClases:", data.target_names)

# Conversion a Dataframe
df = pd.DataFrame(data.data, columns=data.feature_names)
df["target"] = data.target

# Mostrar primeras filas
df.head()

.. _breast_cancer_dataset:

Breast cancer Wisconsin (diagnostic) dataset
--------------------------------------------

**Data Set Characteristics:**

:Number of Instances: 569

:Number of Attributes: 30 numeric, predictive attributes and the class

:Attribute Information:
    - radius (mean of distances from center to points on the perimeter)
    - texture (standard deviation of gray-scale values)
    - perimeter
    - area
    - smoothness (local variation in radius lengths)
    - compactness (

Clases: ['malignant' 'benign']


Unnamed: 0,mean radius,mean texture,mean perimeter,mean area,mean smoothness,mean compactness,mean concavity,mean concave points,mean symmetry,mean fractal dimension,...,worst texture,worst perimeter,worst area,worst smoothness,worst compactness,worst concavity,worst concave points,worst symmetry,worst fractal dimension,target
0,17.99,10.38,122.8,1001.0,0.1184,0.2776,0.3001,0.1471,0.2419,0.07871,...,17.33,184.6,2019.0,0.1622,0.6656,0.7119,0.2654,0.4601,0.1189,0
1,20.57,17.77,132.9,1326.0,0.08474,0.07864,0.0869,0.07017,0.1812,0.05667,...,23.41,158.8,1956.0,0.1238,0.1866,0.2416,0.186,0.275,0.08902,0
2,19.69,21.25,130.0,1203.0,0.1096,0.1599,0.1974,0.1279,0.2069,0.05999,...,25.53,152.5,1709.0,0.1444,0.4245,0.4504,0.243,0.3613,0.08758,0
3,11.42,20.38,77.58,386.1,0.1425,0.2839,0.2414,0.1052,0.2597,0.09744,...,26.5,98.87,567.7,0.2098,0.8663,0.6869,0.2575,0.6638,0.173,0
4,20.29,14.34,135.1,1297.0,0.1003,0.1328,0.198,0.1043,0.1809,0.05883,...,16.67,152.2,1575.0,0.1374,0.205,0.4,0.1625,0.2364,0.07678,0


En este conjunto de datos, cada observación representa una muestra de tejido de tumor de mama.
Las variables numéricas (features) describen propiedades físicas del tejido, como:

- Radio medio
- Textura
- Perímetro
- Suavidad
- Compactación

La variable objetivo (target) tiene dos valores:

- 0: maligno
- 1: benigno

In [8]:
# Separar variables predictoras (X) y variable objetivo (y)
X = data.data
y = data.target

# Dividir en conjunto de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42, stratify=y
)

# Escalar los datos (el perceptrón converge mejor con datos normalizados)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

Escalar los datos garantiza que todas las variables tengan igual peso en el entrenamiento, ya que el Perceptrón es sensible a las diferencias de escala entre las características.

#### Model Training

In [10]:
# Crear el modelo del Perceptrón
perceptron = Perceptron(max_iter=1000, eta0=0.1, random_state=42)

# Entrenar el modelo
perceptron.fit(X_train, y_train)

0,1,2
,penalty,
,alpha,0.0001
,l1_ratio,0.15
,fit_intercept,True
,max_iter,1000
,tol,0.001
,shuffle,True
,verbose,0
,eta0,0.1
,n_jobs,


Se utiliza la clase Perceptron de sklearn.linear_model, la cual implementa el algoritmo clásico.
Los hiperparámetros más relevantes son:

- max_iter: número máximo de iteraciones.
- eta0: tasa de aprendizaje (step size).
- random_state: semilla para reproducibilidad.

#### Prediction

In [11]:
# Realizar predicciones sobre el conjunto de prueba
y_pred = perceptron.predict(X_test)

# Mostrar las primeras 10 predicciones comparadas con los valores reales
for i in range(10):
    print(f"Real: {y_test[i]} - Predicho: {y_pred[i]}")

Real: 0 - Predicho: 0
Real: 1 - Predicho: 1
Real: 0 - Predicho: 0
Real: 1 - Predicho: 0
Real: 0 - Predicho: 0
Real: 1 - Predicho: 1
Real: 1 - Predicho: 1
Real: 0 - Predicho: 0
Real: 0 - Predicho: 0
Real: 0 - Predicho: 0


#### Model Evaluation

In [12]:
# Calcular la precisión (accuracy)
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy del modelo: {accuracy:.4f}")

# Reporte detallado
print("\nReporte de clasificación:\n")
print(classification_report(y_test, y_pred, target_names=data.target_names))

Accuracy del modelo: 0.9561

Reporte de clasificación:

              precision    recall  f1-score   support

   malignant       0.91      0.98      0.94        42
      benign       0.99      0.94      0.96        72

    accuracy                           0.96       114
   macro avg       0.95      0.96      0.95       114
weighted avg       0.96      0.96      0.96       114



La accuracy (precision) representa el porcentaje de predicciones correctas.

El reporte de clasificación incluye métricas de precisión, recall y F1-score para cada clase.

Si la precisión no es perfecta, puede explicarse por la naturaleza no totalmente lineal del conjunto de datos, ya que el Perceptrón solo puede aprender fronteras lineales.

### Referencias Bibliograficas

https://docs.google.com/presentation/d/1ALbozIgWrNw6M1ocM15avJtosnMOnxaGw1L_QIkVEV4/edit?slide=id.g24dea427483_0_936#slide=id.g24dea427483_0_936
https://arafique906.medium.com/perceptron-learning-algorithm-feedforward-and-weight-update-e2ba1a9bca12
https://alexanderhay2020.github.io/blog/2019/perceptrons/