# Perceptrón – Dataset Digits

En este notebook se aplica el algoritmo **Perceptrón** al dataset **Digits** de `sklearn`.
El objetivo es entrenar un clasificador lineal y evaluar su rendimiento sobre un conjunto de test.

Pasos:
- Carga y normalización del dataset
- Partición train/test
- Entrenamiento del perceptrón
- Evaluación del error en test



In [1]:
import numpy as np
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split



## 1. Carga del dataset Digits


In [2]:
digits = load_digits()

X = digits.data
y = digits.target

# Normalización: los píxeles están en [0,16]
X = X / 16.0

print("Shape X:", X.shape)
print("Shape y:", y.shape)
print("Clases:", np.unique(y))


Shape X: (1797, 64)
Shape y: (1797,)
Clases: [0 1 2 3 4 5 6 7 8 9]


## 2. Partición Train / Test


In [3]:
X_train, X_test, y_train, y_test = train_test_split(
    X,
    y,
    test_size=0.3,
    random_state=42,
    stratify=y
)

print("Train:", X_train.shape, y_train.shape)
print("Test :", X_test.shape, y_test.shape)


Train: (1257, 64) (1257,)
Test : (540, 64) (540,)


## 3. Implementación del Perceptrón Multiclase


In [4]:
class Perceptron:
    def __init__(self, n_features, n_classes, eta=0.01):
        self.eta = eta
        self.W = np.zeros((n_classes, n_features))
        self.b = np.zeros(n_classes)

    def predict(self, X):
        scores = np.dot(X, self.W.T) + self.b
        return np.argmax(scores, axis=1)

    def fit(self, X, y, epochs=1000):
        n_samples = X.shape[0]

        for epoch in range(epochs):
            for i in range(n_samples):
                xi = X[i]
                yi = y[i]

                scores = np.dot(self.W, xi) + self.b
                y_pred = np.argmax(scores)

                if y_pred != yi:
                    self.W[yi] += self.eta * xi
                    self.W[y_pred] -= self.eta * xi
                    self.b[yi] += self.eta
                    self.b[y_pred] -= self.eta


## 4. Entrenamiento del modelo


In [5]:
n_features = X_train.shape[1]
n_classes = len(np.unique(y))

clf = Perceptron(
    n_features=n_features,
    n_classes=n_classes,
    eta=0.01
)

clf.fit(X_train, y_train, epochs=1000)


## 5. Evaluación en el conjunto de test


In [6]:
y_pred = clf.predict(X_test)

error = np.mean(y_pred != y_test)
accuracy = 1 - error

print("Error en test:", error)
print("Accuracy en test:", accuracy)


Error en test: 0.04259259259259259
Accuracy en test: 0.9574074074074074


## 6. Conclusión

El perceptrón obtiene un rendimiento razonable sobre el dataset Digits.
Dado que se trata de un clasificador lineal y el problema no es linealmente separable,
el error obtenido es coherente con las limitaciones del modelo.
