# Perceptrón Unicapa (TLU) — Clasificación binaria de género en Twitter

**Taller 1 — Deep Learning (2026-10)**

**Modelo:** Perceptrón Unicapa con función escalón (Threshold Logic Unit)

**Objetivo:** Clasificar usuarios de Twitter como `male (0)` o `female (1)`.

Los datos ya fueron preprocesados en `Taller1DL.ipynb` (secciones 1-5) y se cargan desde archivos `.npy`.

## 1. Carga de datos preprocesados

Los archivos `.npy` contienen las matrices ya:
- Imputadas (nulos tratados)
- Escaladas (StandardScaler para numéricas)
- Codificadas (OneHotEncoder para categóricas)
- Particionadas (60% train, 20% val, 20% test)

In [3]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Cargar matrices preprocesadas generadas en Taller1DL.ipynb
X_train = np.load("X_train.npy")
X_val   = np.load("X_val.npy")
X_test  = np.load("X_test.npy")
y_train = np.load("y_train.npy")
y_val   = np.load("y_val.npy")
y_test  = np.load("y_test.npy")

# Verificar dimensiones
print("="*50)
print("  DIMENSIONES DE LOS DATOS")
print("="*50)
print(f"  Train: X={X_train.shape}, y={y_train.shape}")
print(f"  Val:   X={X_val.shape},   y={y_val.shape}")
print(f"  Test:  X={X_test.shape},  y={y_test.shape}")
print(f"\n  Número de features: {X_train.shape[1]}")
print(f"  Clases únicas: {np.unique(y_train)}  (0=male, 1=female)")

# Verificar distribución en cada conjunto
print(f"\n  Train → male: {np.sum(y_train==0)}, female: {np.sum(y_train==1)}")
print(f"  Val   → male: {np.sum(y_val==0)},   female: {np.sum(y_val==1)}")
print(f"  Test  → male: {np.sum(y_test==0)},  female: {np.sum(y_test==1)}")

  DIMENSIONES DE LOS DATOS
  Train: X=(7736, 9), y=(7736,)
  Val:   X=(2579, 9),   y=(2579,)
  Test:  X=(2579, 9),  y=(2579,)

  Número de features: 9
  Clases únicas: [0 1]  (0=male, 1=female)

  Train → male: 3716, female: 4020
  Val   → male: 1239,   female: 1340
  Test  → male: 1239,  female: 1340


## 2. ¿Qué es el Perceptrón Unicapa?

El **perceptrón** es el modelo de red neuronal más simple que existe. Fue propuesto por Frank Rosenblatt en 1958.

### Arquitectura:
```
x₁ ──→ w₁ ──┐
x₂ ──→ w₂ ──┤
x₃ ──→ w₃ ──┼──→ Σ(wᵢxᵢ) + b ──→ f(z) ──→ ŷ ∈ {0, 1}
 ⋮           │
xₙ ──→ wₙ ──┘
```

### Componentes:
- **Entradas (x):** Las features preprocesadas (N variables)
- **Pesos (w):** Un peso por cada feature, aprendido durante el entrenamiento
- **Bias (b):** Un sesgo que desplaza la frontera de decisión
- **Función de activación:** Escalón (step / TLU)

### Función escalón (Threshold Logic Unit):

$$\hat{y} = \begin{cases} 1 & \text{si } \sum_{i=1}^{n} w_i x_i + b \geq 0 \\ 0 & \text{si } \sum_{i=1}^{n} w_i x_i + b < 0 \end{cases}$$

### Regla de actualización del perceptrón:
Para cada muestra mal clasificada:
$$w_i \leftarrow w_i + \eta \cdot (y - \hat{y}) \cdot x_i$$

Donde $\eta$ es la **tasa de aprendizaje**.

### Limitación clave:
Solo puede resolver problemas **linealmente separables**. No puede aprender fronteras de decisión curvas o complejas.

## 3. Entrenamiento del Perceptrón

Usamos `sklearn.linear_model.Perceptron` que implementa exactamente el algoritmo del perceptrón clásico:
- **Sin capas ocultas** (unicapa)
- **Función escalón** como activación
- **Regla del perceptrón** para actualizar pesos

### Hiperparámetros:
| Parámetro | Valor | Descripción |
|---|---|---|
| `max_iter` | 1000 | Máximo de pasadas completas por los datos (épocas) |
| `eta0` | 0.01 | Tasa de aprendizaje (qué tanto ajusta los pesos) |
| `tol` | 1e-3 | Si la pérdida no mejora más que esto, para |
| `early_stopping` | True | Detiene si no mejora en validación interna |
| `n_iter_no_change` | 10 | Épocas consecutivas sin mejora para detenerse |
 

In [4]:
from sklearn.linear_model import Perceptron

# ============================================
# 3) Crear y entrenar el Perceptrón
# ============================================

perceptron = Perceptron(
    max_iter=1000,           # Máximo de épocas
    eta0=0.01,               # Tasa de aprendizaje
    tol=1e-3,                # Tolerancia para convergencia
    random_state=42,         # Reproducibilidad
    early_stopping=True,     # Parar si no mejora
    validation_fraction=0.2, # 20% del train para validación interna
    n_iter_no_change=10      # Épocas sin mejora para parar
)

# Entrenar SOLO con datos de entrenamiento
perceptron.fit(X_train, y_train)

# Información del modelo entrenado
print("="*50)
print("  MODELO ENTRENADO")
print("="*50)
print(f"  Épocas ejecutadas:    {perceptron.n_iter_}")
print(f"  Número de features:   {X_train.shape[1]}")
print(f"  Shape de pesos (w):   {perceptron.coef_.shape}")
print(f"  Bias (b):             {perceptron.intercept_[0]:.6f}")
print(f"  Pesos ≠ 0:            {np.sum(perceptron.coef_ != 0)} de {perceptron.coef_.shape[1]}")

  MODELO ENTRENADO
  Épocas ejecutadas:    13
  Número de features:   9
  Shape de pesos (w):   (1, 9)
  Bias (b):             0.010000
  Pesos ≠ 0:            8 de 9
