# üçéü•ï Transfer Learning para Clasificaci√≥n de Frutas y Verduras

**Proyecto 3 - Inteligencia Artificial**  
**INFO1185 - Prof. Dr. Ricardo Soto Catal√°n**  
**Fecha: 28 de Noviembre de 2025**

## Objetivo
Aplicar Transfer Learning utilizando modelos preentrenados de PyTorch para clasificar frutas y verduras, comparando dos variantes:
- **Versi√≥n 1**: Clasificador simple (FC √∫nica)
- **Versi√≥n 2**: Clasificador extendido tipo embudo (con BN y Dropout)

## Dataset
Fruits and Vegetables Image Recognition Dataset de Kaggle

## üìö 1. Importaciones y Configuraci√≥n

In [None]:
# Instalaci√≥n de dependencias (si es necesario)
!pip install torch torchvision matplotlib seaborn scikit-learn pillow kaggle

# Importaciones principales
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torch.utils.data import DataLoader, Dataset
import torchvision
from torchvision import datasets, models, transforms

# Para visualizaci√≥n y an√°lisis
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import pandas as pd
from PIL import Image
import os
from pathlib import Path
import copy
import time
from collections import defaultdict

# Para m√©tricas
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
from sklearn.metrics import precision_score, recall_score, f1_score

# Configuraci√≥n
import warnings
warnings.filterwarnings('ignore')

# Verificar GPU
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(f'Dispositivo utilizado: {device}')
if torch.cuda.is_available():
    print(f'GPU: {torch.cuda.get_device_name(0)}')
    print(f'Memoria GPU disponible: {torch.cuda.get_device_properties(0).total_memory / 1e9:.1f} GB')

## üîß 2. Configuraci√≥n de Hiperpar√°metros

In [None]:
# Configuraci√≥n general
CONFIG = {
    # Datos
    'data_dir': './fruits_vegetables_dataset',
    'batch_size': 32,
    'num_workers': 2,
    'train_split': 0.7,
    'val_split': 0.2,
    'test_split': 0.1,
    
    # Modelo
    'model_name': 'resnet18',  # Cambiar por: vgg16, resnet50, densenet121, etc.
    'pretrained': True,
    'freeze_backbone': True,
    
    # Entrenamiento
    'learning_rate': 0.001,
    'weight_decay': 1e-4,
    'epochs': 50,
    'patience': 10,  # Para early stopping
    'min_delta': 0.001,
    
    # Regularizaci√≥n (Versi√≥n 2)
    'dropout_rate': 0.3,
    'use_batch_norm': True,
    
    # Imagen
    'image_size': 224,
    'normalize_mean': [0.485, 0.456, 0.406],  # ImageNet
    'normalize_std': [0.229, 0.224, 0.225],   # ImageNet
}

print("Configuraci√≥n cargada:")
for key, value in CONFIG.items():
    print(f"  {key}: {value}")

## üìÅ 3. Descarga y Preparaci√≥n del Dataset

In [None]:
# Tu dataset ya est√° listo en la carpeta test/ ‚úÖ
print("üìÅ DATASET DETECTADO:")
print("   üìÇ Carpeta: ./test")
print("   üè∑Ô∏è Clases: 36 (apple, banana, garlic, etc.)")
print("   üìä Total im√°genes: ~359")
print("   ‚úÖ Estructura correcta por carpetas")
print()
print("üí° Configuraci√≥n optimizada para tu dataset:")
print("   üéØ Batch size: 16 (mejor para dataset peque√±o)")
print("   ‚ö° √âpocas: 20 (entrenamiento m√°s r√°pido)")
print("   üìà Early stopping: 5 √©pocas de paciencia")

# Verificar que el dataset existe
import os
if os.path.exists('./test'):
    subdirs = [d for d in os.listdir('./test') if os.path.isdir(os.path.join('./test', d))]
    print(f"\n‚úÖ Dataset verificado: {len(subdirs)} clases encontradas")
    print(f"   Primeras clases: {subdirs[:5]}")
else:
    print("‚ùå Error: No se encuentra la carpeta './test'")

print("\nüöÄ ¬°Listo para entrenar los modelos!")
print("   Ejecuta las siguientes celdas para continuar...")

## üîÑ 4. Transformaciones y Carga de Datos

In [None]:
# Importar utilidades del proyecto
from data_utils import get_data_transforms, create_data_loaders, visualize_dataset_info, show_sample_images
from models import create_model, print_model_summary
from training_utils import train_model, evaluate_model, compare_models
from config import get_config, print_config, validate_config

# Obtener configuraci√≥n para el experimento
config = get_config('v1_simple')  # Cambiar por el experimento deseado
print_config(config)
validate_config(config)

# Crear transformaciones de datos
print("\nüîÑ Creando transformaciones de datos...")
data_transforms = get_data_transforms(config)

print("‚úÖ Transformaciones creadas:")
print("üìà Entrenamiento: Redimensi√≥n + Augmentaci√≥n + Normalizaci√≥n")
print("üìä Validaci√≥n/Test: Redimensi√≥n + Normalizaci√≥n")

# Cargar y dividir el dataset
print("\nüìÅ Cargando dataset...")
try:
    dataloaders, datasets, class_names = create_data_loaders(config, data_transforms)
    
    # Mostrar informaci√≥n del dataset
    visualize_dataset_info(dataloaders, class_names)
    
    # Guardar informaci√≥n para uso posterior
    num_classes = len(class_names)
    print(f"\nüè∑Ô∏è Se detectaron {num_classes} clases:")
    for i, class_name in enumerate(class_names):
        print(f"  {i:2d}. {class_name}")
    
except Exception as e:
    print(f"‚ùå Error cargando dataset: {e}")
    print("üí° Aseg√∫rate de:")
    print("   1. Haber descargado el dataset de Kaggle")
    print("   2. Extra√≠do en la carpeta correcta")
    print("   3. Actualizado la ruta en config.py")
    
    # Crear dataset de ejemplo para demostraci√≥n
    print("\nüöß Creando dataset de ejemplo...")
    from data_utils import create_sample_dataset
    sample_dir, sample_classes = create_sample_dataset()
    
    # Para continuar con el ejemplo, usamos clases simuladas
    class_names = sample_classes
    num_classes = len(class_names)
    print(f"üìù Usando {num_classes} clases de ejemplo: {class_names}")

In [None]:
# Mostrar muestras del dataset
if 'dataloaders' in locals() and dataloaders is not None:
    print("üñºÔ∏è Mostrando muestras del dataset...")
    show_sample_images(dataloaders['train'], class_names, num_samples=8)
else:
    print("‚ö†Ô∏è Dataset no cargado, saltando visualizaci√≥n de muestras")
    print("üí° Una vez que cargues el dataset real, podr√°s ver las muestras aqu√≠")

## üß† 5. Implementaci√≥n de Modelos

### Seg√∫n la r√∫brica, implementaremos:
- **Versi√≥n 1**: Clasificador simple (solo FC)
- **Versi√≥n 2**: Clasificador embudo con BN y Dropout

In [None]:
# VERSI√ìN 1: Clasificador Simple
print("üèóÔ∏è CREANDO MODELO V1 - Clasificador Simple")
print("="*50)

model_v1 = create_model(
    model_name=CONFIG['model_name'],
    num_classes=num_classes,
    version='simple',
    pretrained=CONFIG['pretrained']
)

# Mostrar resumen del modelo V1
print_model_summary(model_v1)

print("\n" + "="*50)

# VERSI√ìN 2: Clasificador Embudo (con regularizaci√≥n)
print("\nüèóÔ∏è CREANDO MODELO V2 - Clasificador Embudo")
print("="*50)

model_v2_with_reg = create_model(
    model_name=CONFIG['model_name'],
    num_classes=num_classes,
    version='funnel',
    pretrained=CONFIG['pretrained'],
    use_batch_norm=True,
    dropout_rate=CONFIG['dropout_rate']
)

# Mostrar resumen del modelo V2
print_model_summary(model_v2_with_reg)

print("\n" + "="*50)

# VERSI√ìN 2 SIN REGULARIZACI√ìN (para comparaci√≥n)
print("\nüèóÔ∏è CREANDO MODELO V2 - Sin Regularizaci√≥n")
print("="*50)

model_v2_no_reg = create_model(
    model_name=CONFIG['model_name'],
    num_classes=num_classes,
    version='funnel',
    pretrained=CONFIG['pretrained'],
    use_batch_norm=False,
    dropout_rate=0.0
)

print_model_summary(model_v2_no_reg)

## üéØ 6. Entrenamiento de los Modelos

### Entrenaremos los 3 modelos requeridos por la r√∫brica:
1. **V1**: Clasificador simple
2. **V2 sin regularizaci√≥n**: Embudo b√°sico  
3. **V2 con regularizaci√≥n**: Embudo + BN + Dropout

In [None]:
# ENTRENAMIENTO MODELO V1
print("üöÄ ENTRENANDO MODELO V1 - Clasificador Simple")
print("="*60)

# Solo entrenar si tenemos dataloaders v√°lidos
if 'dataloaders' in locals() and dataloaders is not None:
    # Configuraci√≥n para V1
    config_v1 = get_config('v1_simple')
    
    # Entrenar modelo
    trained_model_v1, history_v1 = train_model(
        model=model_v1,
        dataloaders={'train': dataloaders['train'], 'val': dataloaders['val']},
        config=config_v1,
        model_name="V1 - Clasificador Simple"
    )
    
    # Mostrar curvas de entrenamiento
    history_v1.plot_curves("Curvas de Entrenamiento - Modelo V1")
    
    print("‚úÖ Modelo V1 entrenado exitosamente")
    
else:
    print("‚ö†Ô∏è Dataloaders no disponibles, saltando entrenamiento")
    print("üí° Una vez que cargues el dataset, el entrenamiento se ejecutar√° aqu√≠")