# DistilBERT - Transformers para Reducci√≥n de Overfitting

## Objetivo
Implementar DistilBERT (modelo Transformer) como soluci√≥n de nivel experto para reducir overfitting manteniendo F1-score > 0.55.

## Ventajas de DistilBERT
- ‚úÖ‚úÖ‚úÖ Entiende contexto y sem√°ntica (no solo frecuencias)
- ‚úÖ‚úÖ‚úÖ Pre-entrenado en millones de textos
- ‚úÖ‚úÖ‚úÖ Fine-tuning con tu dataset (aprende patrones espec√≠ficos)
- ‚úÖ‚úÖ‚úÖ Mejor control de overfitting que modelos cl√°sicos
- ‚úÖ‚úÖ‚úÖ 60% m√°s r√°pido que BERT
- ‚úÖ‚úÖ‚úÖ Dropout incorporado (regularizaci√≥n autom√°tica)
- ‚úÖ Captura sutilezas del hate speech que TF-IDF no puede


## 1. Instalaci√≥n de librer√≠as necesarias


In [19]:
# Instalar si no est√°n instaladas (descomentar si es necesario)
# !pip install transformers torch accelerate

# Suprimir warnings de TensorFlow (no lo necesitamos para DistilBERT)
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3'  # Suprimir warnings de TensorFlow
import warnings
warnings.filterwarnings('ignore')

# Suprimir errores de protobuf/TensorFlow
try:
    import tensorflow as tf
    tf.get_logger().setLevel('ERROR')
except:
    pass

import pandas as pd
import numpy as np
import pickle
import random
from pathlib import Path
from tqdm import tqdm

import torch
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader
from torch.optim import AdamW
from transformers import (
    DistilBertTokenizer, DistilBertForSequenceClassification,
    get_linear_schedule_with_warmup
)
from sklearn.metrics import (
    accuracy_score, precision_score, recall_score, f1_score,
    confusion_matrix
)

# Configurar dispositivo
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(f"‚úÖ Dispositivo: {device}")

np.random.seed(42)
random.seed(42)
torch.manual_seed(42)
if torch.cuda.is_available():
    torch.cuda.manual_seed_all(42)

print("‚úÖ Librer√≠as importadas (enfoque directo con PyTorch, sin datasets)")


‚úÖ Dispositivo: cpu
‚úÖ Librer√≠as importadas (enfoque directo con PyTorch, sin datasets)


## 2. Carga de datos


In [20]:
# Cargar datos
df = pd.read_csv('../data/processed/youtoxic_english_1000_processed.csv')

# Convertir IsToxic a num√©rico
if df['IsToxic'].dtype == object:
    df['Label'] = df['IsToxic'].map({'TRUE': 1, 'FALSE': 0, True: 1, False: 0, 'True': 1, 'False': 0})
else:
    df['Label'] = df['IsToxic'].astype(int)

# Dividir en train/test usando el mismo m√©todo que otros notebooks
from sklearn.model_selection import train_test_split

X = df['Text_processed']
y = df['Label']

X_train_text, X_test_text, y_train, y_test = train_test_split(
    X, y,
    test_size=0.2,
    random_state=42,
    stratify=y
)

# Convertir a arrays numpy para evitar problemas con √≠ndices
X_train_text = X_train_text.values
X_test_text = X_test_text.values
y_train = y_train.values
y_test = y_test.values

print(f"‚úÖ Datos cargados: {len(X_train_text)} train, {len(X_test_text)} test")
print(f"Distribuci√≥n train: {np.bincount(y_train)}")
print(f"Distribuci√≥n test: {np.bincount(y_test)}")


‚úÖ Datos cargados: 800 train, 200 test
Distribuci√≥n train: [430 370]
Distribuci√≥n test: [108  92]


## 3. Cargar tokenizador y modelo


In [21]:
# Cargar tokenizador y modelo pre-entrenado
model_name = 'distilbert-base-uncased'

print(f"Cargando {model_name}...")
tokenizer = DistilBertTokenizer.from_pretrained(model_name)
model = DistilBertForSequenceClassification.from_pretrained(
    model_name,
    num_labels=2,  # Clasificaci√≥n binaria
    problem_type="single_label_classification"
)

print(f"‚úÖ Modelo cargado: {model_name}")
print(f"   Par√°metros: {model.num_parameters():,}")


Cargando distilbert-base-uncased...


Some weights of DistilBertForSequenceClassification were not initialized from the model checkpoint at distilbert-base-uncased and are newly initialized: ['classifier.bias', 'classifier.weight', 'pre_classifier.bias', 'pre_classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


‚úÖ Modelo cargado: distilbert-base-uncased
   Par√°metros: 66,955,010


## 4. Dataset personalizado para PyTorch


In [22]:
class HateSpeechDataset(Dataset):
    """Dataset personalizado para clasificaci√≥n de hate speech."""
    
    def __init__(self, texts, labels, tokenizer, max_length=128):
        # Convertir a listas para evitar problemas con √≠ndices de pandas
        self.texts = [str(text) for text in texts]
        self.labels = [int(label) for label in labels]
        self.tokenizer = tokenizer
        self.max_length = max_length
    
    def __len__(self):
        return len(self.texts)
    
    def __getitem__(self, idx):
        text = self.texts[idx]
        label = self.labels[idx]
        
        # Tokenizar texto
        encoding = self.tokenizer(
            text,
            truncation=True,
            padding='max_length',
            max_length=self.max_length,
            return_tensors='pt'
        )
        
        return {
            'input_ids': encoding['input_ids'].flatten(),
            'attention_mask': encoding['attention_mask'].flatten(),
            'labels': torch.tensor(label, dtype=torch.long)
        }

print("‚úÖ Clase Dataset definida")


‚úÖ Clase Dataset definida


## 5. Funci√≥n de evaluaci√≥n


In [23]:
def evaluate_model(model, dataloader, device):
    """Eval√∫a el modelo y retorna m√©tricas."""
    model.eval()
    predictions = []
    true_labels = []
    
    with torch.no_grad():
        for batch in dataloader:
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            labels = batch['labels'].to(device)
            
            outputs = model(input_ids=input_ids, attention_mask=attention_mask)
            logits = outputs.logits
            preds = torch.argmax(logits, dim=1)
            
            predictions.extend(preds.cpu().numpy())
            true_labels.extend(labels.cpu().numpy())
    
    predictions = np.array(predictions)
    true_labels = np.array(true_labels)
    
    accuracy = accuracy_score(true_labels, predictions)
    precision = precision_score(true_labels, predictions, zero_division=0)
    recall = recall_score(true_labels, predictions, zero_division=0)
    f1 = f1_score(true_labels, predictions, zero_division=0)
    cm = confusion_matrix(true_labels, predictions)
    
    return {
        'accuracy': accuracy,
        'precision': precision,
        'recall': recall,
        'f1': f1,
        'confusion_matrix': cm,
        'predictions': predictions
    }

print("‚úÖ Funci√≥n de evaluaci√≥n definida")


‚úÖ Funci√≥n de evaluaci√≥n definida


## 6. Preparar datasets


In [24]:
# Crear datasets
train_dataset = HateSpeechDataset(X_train_text, y_train, tokenizer)
test_dataset = HateSpeechDataset(X_test_text, y_test, tokenizer)

print(f"‚úÖ Datasets creados")
print(f"   Train: {len(train_dataset)} ejemplos")
print(f"   Test: {len(test_dataset)} ejemplos")


‚úÖ Datasets creados
   Train: 800 ejemplos
   Test: 200 ejemplos


## 7. Configurar entrenamiento con anti-overfitting


In [25]:
# Configurar hiperpar√°metros de entrenamiento
BATCH_SIZE = 16
LEARNING_RATE = 2e-5
NUM_EPOCHS = 5
WEIGHT_DECAY = 0.01
WARMUP_STEPS = 100

print("="*80)
print("CONFIGURACI√ìN DE ENTRENAMIENTO - DISTILBERT")
print("="*80)
print(f"‚úÖ √âpocas: {NUM_EPOCHS}")
print(f"‚úÖ Learning rate: {LEARNING_RATE}")
print(f"‚úÖ Weight decay: {WEIGHT_DECAY} (regularizaci√≥n L2)")
print(f"‚úÖ Batch size: {BATCH_SIZE}")
print(f"‚úÖ Warmup steps: {WARMUP_STEPS}")
print(f"‚úÖ Early stopping: S√≠ (patience=2)")
print("-"*80)


CONFIGURACI√ìN DE ENTRENAMIENTO - DISTILBERT
‚úÖ √âpocas: 5
‚úÖ Learning rate: 2e-05
‚úÖ Weight decay: 0.01 (regularizaci√≥n L2)
‚úÖ Batch size: 16
‚úÖ Warmup steps: 100
‚úÖ Early stopping: S√≠ (patience=2)
--------------------------------------------------------------------------------


## 8. Entrenar modelo (enfoque directo con PyTorch)


In [26]:
# Crear DataLoaders
train_loader = DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=BATCH_SIZE, shuffle=False)

# Mover modelo a dispositivo
model = model.to(device)

# Configurar optimizador y scheduler
optimizer = AdamW(model.parameters(), lr=LEARNING_RATE, weight_decay=WEIGHT_DECAY)
total_steps = len(train_loader) * NUM_EPOCHS
scheduler = get_linear_schedule_with_warmup(
    optimizer,
    num_warmup_steps=WARMUP_STEPS,
    num_training_steps=total_steps
)

# Funci√≥n de p√©rdida
criterion = nn.CrossEntropyLoss()

print("="*80)
print("ENTRENAMIENTO DISTILBERT - CONTROL DE OVERFITTING")
print("="*80)
print("‚úÖ Early stopping (patience=2)")
print("‚úÖ Weight decay (regularizaci√≥n L2)")
print("‚úÖ Learning rate bajo (2e-5)")
print("‚úÖ Pocas √©pocas (5)")
print("‚úÖ Evaluaci√≥n cada √©poca")
print("-"*80)

# Entrenar modelo
best_f1 = 0
patience_counter = 0
patience = 2

for epoch in range(NUM_EPOCHS):
    # Entrenamiento
    model.train()
    total_loss = 0
    
    progress_bar = tqdm(train_loader, desc=f'√âpoca {epoch+1}/{NUM_EPOCHS}')
    for batch in progress_bar:
        input_ids = batch['input_ids'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        labels = batch['labels'].to(device)
        
        optimizer.zero_grad()
        outputs = model(input_ids=input_ids, attention_mask=attention_mask, labels=labels)
        loss = outputs.loss
        loss.backward()
        torch.nn.utils.clip_grad_norm_(model.parameters(), 1.0)  # Gradient clipping
        optimizer.step()
        scheduler.step()
        
        total_loss += loss.item()
        progress_bar.set_postfix({'loss': loss.item()})
    
    avg_loss = total_loss / len(train_loader)
    
    # Evaluaci√≥n
    eval_results = evaluate_model(model, test_loader, device)
    test_f1 = eval_results['f1']
    
    print(f"\n√âpoca {epoch+1}/{NUM_EPOCHS}")
    print(f"  Loss: {avg_loss:.4f}")
    print(f"  F1 (test): {test_f1:.4f}")
    print(f"  Accuracy (test): {eval_results['accuracy']:.4f}")
    
    # Early stopping
    if test_f1 > best_f1:
        best_f1 = test_f1
        patience_counter = 0
        # Guardar mejor modelo
        os.makedirs('../models', exist_ok=True)
        torch.save(model.state_dict(), '../models/distilbert_best_model.pt')
        print(f"  ‚úÖ Mejor modelo guardado (F1: {best_f1:.4f})")
    else:
        patience_counter += 1
        if patience_counter >= patience:
            print(f"  ‚èπÔ∏è  Early stopping (patience={patience})")
            break

# Cargar mejor modelo
model.load_state_dict(torch.load('../models/distilbert_best_model.pt'))
print("\n‚úÖ Entrenamiento completado")


ENTRENAMIENTO DISTILBERT - CONTROL DE OVERFITTING
‚úÖ Early stopping (patience=2)
‚úÖ Weight decay (regularizaci√≥n L2)
‚úÖ Learning rate bajo (2e-5)
‚úÖ Pocas √©pocas (5)
‚úÖ Evaluaci√≥n cada √©poca
--------------------------------------------------------------------------------


√âpoca 1/5: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 50/50 [02:00<00:00,  2.41s/it, loss=0.694]



√âpoca 1/5
  Loss: 0.6886
  F1 (test): 0.1414
  Accuracy (test): 0.5750
  ‚úÖ Mejor modelo guardado (F1: 0.1414)


√âpoca 2/5: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 50/50 [02:00<00:00,  2.40s/it, loss=0.764]



√âpoca 2/5
  Loss: 0.6428
  F1 (test): 0.4806
  Accuracy (test): 0.6650
  ‚úÖ Mejor modelo guardado (F1: 0.4806)


√âpoca 3/5: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 50/50 [01:59<00:00,  2.40s/it, loss=0.377]



√âpoca 3/5
  Loss: 0.4839
  F1 (test): 0.6851
  Accuracy (test): 0.7150
  ‚úÖ Mejor modelo guardado (F1: 0.6851)


√âpoca 4/5: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 50/50 [02:01<00:00,  2.43s/it, loss=0.207]



√âpoca 4/5
  Loss: 0.3359
  F1 (test): 0.7010
  Accuracy (test): 0.7100
  ‚úÖ Mejor modelo guardado (F1: 0.7010)


√âpoca 5/5: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 50/50 [02:04<00:00,  2.48s/it, loss=0.112]



√âpoca 5/5
  Loss: 0.2259
  F1 (test): 0.7027
  Accuracy (test): 0.7250
  ‚úÖ Mejor modelo guardado (F1: 0.7027)

‚úÖ Entrenamiento completado


## 9. Evaluaci√≥n del modelo


In [27]:
# Evaluar en train y test para calcular overfitting
print("Evaluando en conjunto de entrenamiento...")
train_results = evaluate_model(model, train_loader, device)

print("\nEvaluando en conjunto de prueba...")
test_results = evaluate_model(model, test_loader, device)

# Calcular diferencia F1 (overfitting)
diff_f1 = abs(train_results['f1'] - test_results['f1']) * 100

print("\n" + "="*80)
print("RESULTADOS FINALES - DISTILBERT")
print("="*80)
print(f"F1-score (train): {train_results['f1']:.4f}")
print(f"F1-score (test): {test_results['f1']:.4f}")
print(f"Accuracy (test): {test_results['accuracy']:.4f}")
print(f"Precision (test): {test_results['precision']:.4f}")
print(f"Recall (test): {test_results['recall']:.4f}")
print(f"Diferencia F1: {diff_f1:.2f}%")
print(f"\nMatriz de confusi√≥n (test):")
print(test_results['confusion_matrix'])

if diff_f1 < 5.0 and test_results['f1'] > 0.55:
    print("\n‚úÖ‚úÖ‚úÖ OBJETIVO CUMPLIDO: Overfitting < 5% Y F1 > 0.55")
elif diff_f1 < 6.0:
    print("\nüéØ MUY CERCA: Overfitting < 6%")
else:
    print("\n‚ö†Ô∏è  Overfitting a√∫n alto")

print("="*80)


Evaluando en conjunto de entrenamiento...

Evaluando en conjunto de prueba...

RESULTADOS FINALES - DISTILBERT
F1-score (train): 0.9468
F1-score (test): 0.7027
Accuracy (test): 0.7250
Precision (test): 0.6989
Recall (test): 0.7065
Diferencia F1: 24.41%

Matriz de confusi√≥n (test):
[[80 28]
 [27 65]]

‚ö†Ô∏è  Overfitting a√∫n alto


## 10. Guardar modelo (si cumple objetivos)


In [28]:
if diff_f1 < 6.0 and test_results['f1'] > 0.55:
    # Guardar modelo y tokenizador
    model_path = Path('../models/distilbert_model')
    model_path.mkdir(parents=True, exist_ok=True)
    
    # Guardar modelo completo
    model.save_pretrained(str(model_path))
    tokenizer.save_pretrained(str(model_path))
    
    # Guardar informaci√≥n del modelo
    model_info = {
        'model_type': 'DistilBERT',
        'model_name': model_name,
        'test_f1': test_results['f1'],
        'diff_f1': diff_f1,
        'train_f1': train_results['f1'],
        'num_epochs': NUM_EPOCHS,
        'learning_rate': LEARNING_RATE,
        'weight_decay': WEIGHT_DECAY,
        'batch_size': BATCH_SIZE
    }
    
    with open('../models/distilbert_info.pkl', 'wb') as f:
        pickle.dump(model_info, f)
    
    print(f"\n‚úÖ Modelo guardado en: {model_path}")
    print(f"‚úÖ Informaci√≥n guardada en: ../models/distilbert_info.pkl")
else:
    print("\n‚ö†Ô∏è  Modelo no guardado (no cumple objetivos)")
    print(f"   Overfitting: {diff_f1:.2f}% (objetivo: <6%)")
    print(f"   F1-score: {test_results['f1']:.4f} (objetivo: >0.55)")



‚ö†Ô∏è  Modelo no guardado (no cumple objetivos)
   Overfitting: 24.41% (objetivo: <6%)
   F1-score: 0.7027 (objetivo: >0.55)
