# Perceptrón – Dataset Olivetti Faces

En este notebook se aplica el algoritmo **Perceptrón** al dataset **Olivetti Faces**.
Se trata de un problema de clasificación multiclase de caras humanas,
especialmente complejo para clasificadores lineales.

In [1]:
import numpy as np
from sklearn.datasets import fetch_olivetti_faces
from sklearn.model_selection import train_test_split


## 1. Carga del dataset Olivetti


In [2]:
faces = fetch_olivetti_faces()

X = faces.data
y = faces.target

print("Shape X:", X.shape)
print("Shape y:", y.shape)
print("Número de clases:", len(np.unique(y)))


downloading Olivetti faces from https://ndownloader.figshare.com/files/5976027 to /home/tommy/scikit_learn_data
Shape X: (400, 4096)
Shape y: (400,)
Número de clases: 40


## 2. Partición Train / Test


In [3]:
X_train, X_test, y_train, y_test = train_test_split(
    X,
    y,
    test_size=0.3,
    random_state=42,
    stratify=y
)

print("Train:", X_train.shape, y_train.shape)
print("Test :", X_test.shape, y_test.shape)


Train: (280, 4096) (280,)
Test : (120, 4096) (120,)


## 3. Implementación del Perceptrón Multiclase


In [4]:
class Perceptron:
    def __init__(self, n_features, n_classes, eta=0.001):
        self.eta = eta
        self.W = np.zeros((n_classes, n_features))
        self.b = np.zeros(n_classes)

    def predict(self, X):
        scores = np.dot(X, self.W.T) + self.b
        return np.argmax(scores, axis=1)

    def fit(self, X, y, epochs=500):
        n_samples = X.shape[0]

        for _ in range(epochs):
            for i in range(n_samples):
                xi = X[i]
                yi = y[i]

                scores = np.dot(self.W, xi) + self.b
                y_pred = np.argmax(scores)

                if y_pred != yi:
                    self.W[yi] += self.eta * xi
                    self.W[y_pred] -= self.eta * xi
                    self.b[yi] += self.eta
                    self.b[y_pred] -= self.eta


## 4. Entrenamiento del modelo


In [5]:
n_features = X_train.shape[1]
n_classes = len(np.unique(y))

clf = Perceptron(
    n_features=n_features,
    n_classes=n_classes,
    eta=0.001
)

clf.fit(X_train, y_train, epochs=500)


## 5. Evaluación en el conjunto de test


In [6]:
y_pred = clf.predict(X_test)

error = np.mean(y_pred != y_test)
accuracy = 1 - error

print("Error en test:", error)
print("Accuracy en test:", accuracy)


Error en test: 0.10833333333333334
Accuracy en test: 0.8916666666666666


## 6. Conclusión

Aunque el dataset Olivetti presenta una elevada complejidad,
el perceptrón obtiene un rendimiento notable. Este resultado
puede explicarse por el reducido número de muestras por clase
y por el uso de una representación vectorial directa de las imágenes,
lo que permite cierta separabilidad lineal en el espacio de características.
