# Clasificación de Cobertura Forestal con MLP en PyTorch

## Introducción

En este proyecto construiremos, entrenaremos y evaluaremos un Perceptron Multicapa (MLP) para clasificar tipos de cobertura forestal utilizando el dataset CoverType. Este dataset contiene informacion cartográfica de áreas silvestres en el Roosevelt National Forest de Colorado, Estados Unidos.

El objetivo principal es alcanzar al menos un 93% de accuracy en el conjunto de prueba, lo cual requerirá una exploración cuidadosa de los datos, preprocesamiento adecuado y búsqueda de hiperparámetros.

## Workflow

1. Configuración del entorno y verificación de GPU
2. Carga y exploración del dataset
3. Preprocesamiento de datos
4. Creación del Dataset y DataLoaders de PyTorch
5. Construcción de la arquitectura MLP
6. Entrenamiento del modelo
7. Evaluación y análisis de resultados
8. Búsqueda de hiperparámetros con Optuna
9. Conclusiones y oportunidades de mejora

In [1]:
# Configuración e importación de librerías

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader, random_split

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from sklearn.datasets import fetch_covtype
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score

from tqdm import tqdm
import warnings
warnings.filterwarnings('ignore')

# Configuración de visualización
plt.style.use('seaborn-v0_8-whitegrid')
sns.set_palette('husl')

# Verificación del entorno
print('Versiones del entorno:')
print(f'PyTorch: {torch.__version__}')
print(f'NumPy: {np.__version__}')
print(f'Pandas: {pd.__version__}')
print()
print('Configuración de GPU:')
print(f'CUDA disponible: {torch.cuda.is_available()}')
if torch.cuda.is_available():
    print(f'Dispositivo: {torch.cuda.get_device_name(0)}')
    print(f'Memoria total: {torch.cuda.get_device_properties(0).total_memory / 1e9:.2f} GB')
    
# Definir dispositivo para entrenamiento
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(f'\nDispositivo de entrenamiento: {device}')

Versiones del entorno:
PyTorch: 2.9.0+cu130
NumPy: 2.3.5
Pandas: 2.3.3

Configuración de GPU:
CUDA disponible: True
Dispositivo: NVIDIA GeForce RTX 3050 6GB Laptop GPU
Memoria total: 6.44 GB

Dispositivo de entrenamiento: cuda
