<a href="https://colab.research.google.com/github/luiscargarcia/PF-IABD/blob/main/ProyectoFinalSAA.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Enunciado del Proyecto Final
## Curso de Especialización en Inteligencia Artificial y Big Data

## Título del Proyecto: Clasificación de Imágenes mediante Redes Neuronales Convolucionales

## 1. **Introducción y contexto**

Este proyecto final tiene como objetivo aplicar los conocimientos adquiridos durante el Curso de Especialización en Inteligencia Artificial y Big Data, centrándose en el campo de la Visión por Computador mediante Deep Learning.    

El alumnado deberá desarrollar, entrenar y evaluar diferentes modelos de redes neuronales para resolver un problema de clasificación de imágenes utilizando uno de los datasets propuestos.    
El alumno deberá usar sus conocimientos para manejar el ciclo de vida completo de un proyecto de IA, desde la carga y preprocesamiento de datos hasta el entrenamiento, evaluación y comparación de modelos, incluyendo técnicas como la construcción de redes desde cero y el Transfer Learning.

## 2. **Objetivo General**

Desarrollar y evaluar un sistema de clasificación de imágenes utilizando redes neuronales convolucionales (CNNs), comparando el rendimiento de modelos construidos desde cero con modelos basados en Transfer Learning.

## 3. **Datasets Propuestos (Seleccionar UNO)**

El alumno deberá seleccionar uno de los siguientes datasets para realizar su proyecto. Se recomienda explorar brevemente cada uno antes de tomar una decisión.

***CIFAR-10:***

- Descripción: Dataset clásico con 60,000 imágenes en color de 32x32 píxeles, distribuidas en 10 clases (aviones, coches, pájaros, gatos, ciervos, perros, ranas, caballos, barcos, camiones). 50,000 para entrenamiento y 10,000 para test.
- Fuente: Disponible directamente en Keras/TensorFlow Datasets (tf.keras.datasets.cifar10).
- Complejidad: Moderada, ideal para probar arquitecturas rápidamente.

***Intel Image Classification (Natural Scenes):***

- Descripción: Dataset con aproximadamente 25,000 imágenes de escenas naturales clasificadas en 6 categorías (buildings, forest, glacier, mountain, sea, street). Las imágenes tienen un tamaño de 150x150 píxeles.
- Fuente: Disponible en Kaggle (https://www.kaggle.com/datasets/puneet6060/intel-image-classification). Se requiere descarga y organización.
- Complejidad: Moderada-Alta, imágenes más grandes y realistas que CIFAR-10.

***Flowers-102:***

- Descripción: Dataset con 102 categorías de flores comunes en el Reino Unido. Contiene entre 40 y 258 imágenes por clase, con un total de 8,189 imágenes. Las imágenes varían en tamaño.
- Fuente: Disponible en TensorFlow Datasets (tensorflow_datasets.load('oxford_flowers102')) o para descarga manual.
- Complejidad: Alta, muchas clases con número variable de ejemplos, requiere buen manejo de preprocesamiento y posible desbalanceo.

***Waste Classification (TrashNet Modificado):***

- Descripción: Dataset con imágenes de residuos clasificadas en categorías como cartón, vidrio, metal, papel, plástico y otros/basura general. Existen varias versiones en Kaggle.
- Fuente: Buscar en Kaggle "Waste Classification Dataset" (ej: https://www.kaggle.com/datasets/techsash/waste-classification-data). Seleccionar una versión con estructura clara de carpetas por clase.
- Complejidad: Moderada-Alta, problema relevante con potencial variabilidad en las imágenes y posible desbalanceo.

***Food-101 (Subconjunto Recomendado):***

- Descripción: Dataset grande con 101 categorías de comida y 101,000 imágenes. Debido a su tamaño, se recomienda trabajar con un subconjunto (ej. 10-20 clases seleccionadas) o utilizar una versión pre-procesada más pequeña si se encuentra disponible.
- Fuente: Disponible en TensorFlow Datasets (tensorflow_datasets.load('food101')). Requiere filtrar clases si se usa un subconjunto.
- Complejidad: Alta (incluso con subconjunto), gran variabilidad intra-clase.    

## 4. **Tareas a Desarrollar**

El proyecto deberá incluir, como mínimo, los siguientes puntos desarrollados en un notebook de Jupyter (o Google Colab):

- Selección y Carga del Dataset:
    Justificar brevemente la elección del dataset.
- Cargar las imágenes y sus etiquetas correspondientes. Organizar los datos si es necesario (ej. desde Kaggle).
- Análisis Exploratorio de Datos (EDA):
    - Visualizar ejemplos de imágenes de cada clase.
    - Analizar las dimensiones de las imágenes y decidir un tamaño estándar para el preprocesamiento.
    - Estudiar la distribución de clases (histograma) e identificar posibles desbalanceos.
- Preprocesamiento de Datos:
    - Redimensionar las imágenes al tamaño estándar elegido.
    - Normalizar los valores de los píxeles (ej. rango 0-1).
    - Dividir el dataset en conjuntos de entrenamiento, validación y test.
    - Considerar la codificación de etiquetas (ej. sparse_categorical_crossentropy o categorical_crossentropy).
- Modelo 1: CNN desde Cero:
    - Diseñar, construir y compilar una Red Neuronal Convolucional propia. Debe tener al menos 2-3 bloques convolucionales (Conv2D, Activación, Pooling) y una sección de clasificación (Flatten, Dense).
    - Entrenar el modelo con el conjunto de entrenamiento.
    - Evaluar el modelo en el conjunto de validación durante el entrenamiento (monitorizar curvas de loss y accuracy).
    - Evaluar el modelo final en el conjunto de test (reporte de clasificación, matriz de confusión opcional).
- Modelo 2: Mejoras (Opcional pero Recomendado):
    - Si se detectó desbalanceo en el EDA, aplicar técnicas para mitigarlo (ej. class_weight en model.fit).
    - Aplicar técnicas de Data Augmentation utilizando ImageDataGenerator o capas de Keras para aumentar la robustez del modelo y reducir el overfitting.
    - Re-entrenar el modelo (o uno nuevo) con estas mejoras y evaluar.
- Modelo 3: Transfer Learning:
    - Seleccionar una arquitectura pre-entrenada (ej. VGG16, ResNet50V2, MobileNetV2, EfficientNet).
    - Cargar el modelo base con pesos pre-entrenados (ej. 'imagenet'), excluyendo la capa superior (include_top=False).
    - Congelar las capas del modelo base (trainable = False).
    - Añadir un nuevo clasificador (top model) adaptado al número de clases del dataset elegido (Flatten, Dense, Dropout, etc.).
    - Aplicar el preprocesamiento específico requerido por la red pre-entrenada (si lo tiene).
    - Compilar y entrenar únicamente el nuevo clasificador.
    - Evaluar el modelo final en el conjunto de test.
    - (Opcional Avanzado): Realizar Fine-Tuning (descongelar algunas capas superiores del modelo base y re-entrenar con una tasa de aprendizaje muy baja).
- Comparación y Conclusiones:
    - Presentar una tabla o resumen comparando las métricas clave (accuracy, precision, recall, F1-score) de los modelos desarrollados (CNN desde cero, CNN mejorada, Transfer Learning).
    - Discutir los resultados obtenidos: ¿Qué modelo funcionó mejor y por qué? ¿Qué desafíos se encontraron (overfitting, desbalanceo, tiempo de entrenamiento)?
    - Proponer posibles líneas de mejora futuras.   

## 5. **Herramientas**

- Lenguaje: Python 3.x   
- Librerías Principales: TensorFlow, Keras, Scikit-learn, NumPy, Pandas (opcional, para manejo de datos), Matplotlib, Seaborn.   
- Entorno: Jupyter Notebook o Google Colab (recomendado por la disponibilidad de GPUs gratuitas).   

## 6. **Entregable**

Un único archivo de Jupyter Notebook (.ipynb) que contenga:   
   - Todo el código Python ejecutado.    
   - Resultados de la ejecución de las celdas (salidas, gráficas).   
   - Texto en formato Markdown explicando cada paso, las decisiones tomadas, el análisis de los resultados y las conclusiones finales.   

## 7. **Criterios de Evaluación**

- Funcionalidad: El código es ejecutable y realiza las tareas solicitadas.
- Claridad del Código: Código bien estructurado, comentado y legible.
- Metodología: Correcta aplicación de las técnicas de preprocesamiento, modelado y evaluación.
- Análisis y Discusión: Profundidad y coherencia del análisis de resultados y las conclusiones.
- Presentación: Claridad y organización del notebook.
- Rendimiento del Modelo: Se valorará el esfuerzo por obtener modelos con buen rendimiento, aunque el resultado final no sea perfecto.

# Proyecto Final - Curso Especialización IA y Big Data CyL

## Nombre Alumno: [Tu Nombre Aquí]
## Dataset Elegido: [Nombre del Dataset]


## 0. CONFIGURACIÓN INICIAL
### 0.1 Importar librerías

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.models import Sequential
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.preprocessing import image_dataset_from_directory
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint
from tensorflow.keras.applications import VGG16, ResNet50V2, MobileNetV2 # Ejemplo, añadir/quitar según necesidad
from tensorflow.keras.applications import vgg16, resnet_v2, mobilenet_v2 # Para preprocesamiento específico
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix
from sklearn.utils import class_weight
import os
import zipfile
import random

# Para conectar con Google Drive (si se usa Colab)
# from google.colab import drive, files

print("Versión de TensorFlow:", tf.__version__)
# print("Num GPUs Available: ", len(tf.config.list_physical_devices('GPU'))) # Descomentar para verificar GPU


### 0.2. Configuración de Semillas y Parámetros Globales

In [None]:
SEED = 42
random.seed(SEED)
np.random.seed(SEED)
tf.random.set_seed(SEED)

# Parámetros (ajustar según dataset y pruebas)
IMAGE_WIDTH = 224  # Ejemplo, ajustar al dataset o red pre-entrenada
IMAGE_HEIGHT = 224 # Ejemplo, ajustar al dataset o red pre-entrenada
IMAGE_SIZE = (IMAGE_WIDTH, IMAGE_HEIGHT)
IMAGE_CHANNELS = 3
BATCH_SIZE = 32  # Ajustar según memoria disponible
EPOCHS_SCRATCH = 30 # Épocas para modelo desde cero
EPOCHS_TRANSFER = 20 # Épocas para transfer learning (puede ser menos)

### 0.3. Definición de Rutas (si aplica) - En Google Colab

In [None]:

# Ejemplo si se usa Google Drive en Colab
# drive.mount('/content/drive')
# BASE_FOLDER = '/content/drive/MyDrive/ProyectoFinalIA/'
# DATA_FOLDER = os.path.join(BASE_FOLDER, 'data') # Carpeta donde descargar/descomprimir datos
# MODEL_FOLDER = os.path.join(BASE_FOLDER, 'models') # Carpeta para guardar modelos entrenados

# Ejemplo si se trabaja localmente o en Colab sin Drive
DATA_FOLDER = './data/'
MODEL_FOLDER = './models/'

# Crear carpetas si no existen
# os.makedirs(DATA_FOLDER, exist_ok=True)
# os.makedirs(MODEL_FOLDER, exist_ok=True)


### 0.4. Funciones Auxiliares (Ejemplo: Plotear Curvas)

In [None]:
def plot_learning_curves(history, epochs, title_suffix=''):
    """Plotea las curvas de loss y accuracy para entrenamiento y validación."""

## 1. SELECCIÓN Y CARGA DEL DATASET

In [None]:
print("\n--- 1. Carga del Dataset ---")

#### 1.1. Descarga y Descompresión (si es necesario, ej. desde Kaggle)

In [None]:
# Ejemplo si se usa Kaggle API en Colab:
# !pip install kaggle --upgrade
# files.upload() # Subir kaggle.json
# !mkdir -p ~/.kaggle
# !cp kaggle.json ~/.kaggle/
# !chmod 600 ~/.kaggle/kaggle.json
# !kaggle datasets download -d puneet6060/intel-image-classification -p {DATA_FOLDER} --unzip

# O si se descarga un ZIP manualmente:
# zip_path = os.path.join(DATA_FOLDER, 'nombre_archivo.zip')
# extract_path = os.path.join(DATA_FOLDER, 'nombre_dataset')
# with zipfile.ZipFile(zip_path, 'r') as zip_ref:
#     zip_ref.extractall(extract_path)
# print(f"Dataset descomprimido en: {extract_path}")

# Definir la ruta principal al dataset descomprimido
# dataset_path = extract_path # O la ruta directa si ya está descargado

# --- TU CÓDIGO AQUÍ ---
# Asegúrate de que 'dataset_path' apunte a la carpeta principal del dataset
# que contiene subcarpetas para train/test o directamente las clases.
# dataset_path = os.path.join(DATA_FOLDER, 'intel-image-classification/seg_train/seg_train') # Ejemplo Intel

# --- FIN TU CÓDIGO ---

#### 1.2. Carga del dataset

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Carga los datos.
# --- FIN TU CÓDIGO ---

## 2. ANÁLISIS EXPLORATORIO DE DATOS (EDA)

In [None]:
print("\n--- 2. Análisis Exploratorio de Datos (EDA) ---")


#### 2.1. Visualización de Muestras

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Muestra algunas imágenes del conjunto de entrenamiento con sus etiquetas
# --- FIN TU CÓDIGO ---

#### 2.2. Análisis de Dimensiones y Formato

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Verifica las dimensiones de las imágenes cargadas y el formato de las etiquetas
# --- FIN TU CÓDIGO ---

#### 2.3. Distribución de Clases

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Calcula y visualiza cuántas imágenes hay por cada clase en el conjunto de entrenamiento
# Esto es crucial para detectar desbalanceo.
# --- FIN TU CÓDIGO ---


## 3. PREPROCESAMIENTO DE DATOS

In [None]:
print("\n--- 3. Preprocesamiento de Datos ---")

#### 3.1. Normalización / Escalado

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Aplicar normalización a los píxeles (usualmente a rango 0-1 o -1 a 1)
# Se puede hacer con una capa de Keras (Rescaling) o manualmente.
# --- FIN TU CÓDIGO ---

#### 3.2. División en Train / Validation / Test

In [None]:
# Conjuntos separados para entrenar, ajustar hiperparámetros
# y evaluar el rendimiento final de forma imparcial.

# --- TU CÓDIGO AQUÍ ---

# --- FIN TU CÓDIGO ---

## 4. MODELO 1: CNN DESDE CERO

In [None]:
print("\n--- 4. Modelo 1: CNN desde Cero ---")

#### 4.1. Construcción de la Arquitectura

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Define tu modelo CNN secuencial. Asegúrate que la capa de entrada
# coincida con IMAGE_SIZE y IMAGE_CHANNELS. La salida debe tener NUM_CLASSES neuronas.
# --- FIN TU CÓDIGO ---

#### 4.2. Compilación del Modelo

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Elige un optimizador, una función de pérdida y métricas
# --- FIN TU CÓDIGO ---

#### 4.3. Entrenamiento del Modelo

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Define callbacks (EarlyStopping es muy recomendable)
# --- FIN TU CÓDIGO ---

#### 4.4. Evaluación del Modelo

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Cargar el mejor modelo guardado por ModelCheckpoint

# Evaluar en el conjunto de test

# Generar reporte de clasificación

# Visualizar curvas de aprendizaje

# --- FIN TU CÓDIGO ---


## 5. MODELO 2: MEJORAS (DATA AUGMENTATION / CLASS WEIGHTING)

In [None]:
print("\n--- 5. Modelo 2: Mejoras (Data Augmentation / Class Weighting) ---")
# Esta sección es opcional pero muy recomendada, especialmente si hay overfitting o desbalanceo

#### 5.1. Cálculo de Pesos de Clase (si hay desbalanceo)

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Si el EDA mostró desbalanceo, calcula los pesos
# --- FIN TU CÓDIGO ---

#### 5.2. Definición de Data Augmentation

In [None]:
# Se puede hacer con capas de Keras o con ImageDataGenerator
# --- TU CÓDIGO AQUÍ ---

# --- FIN TU CÓDIGO ---

#### 5.3. Construcción y Entrenamiento del Modelo Mejorado

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Puedes reutilizar la arquitectura de `model_scratch` o definir una nueva.
# Si usas capas de augmentation, añádelas al principio.
# --- FIN TU CÓDIGO ---

#### 5.4. Evaluación del Modelo Mejorado

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Cargar el mejor modelo guardado

# Evaluar en el conjunto de test

# Generar reporte de clasificación

# Visualizar curvas de aprendizaje

# --- FIN TU CÓDIGO ---

## 6. MODELO 3: TRANSFER LEARNING

In [None]:
print("\n--- 6. Modelo 3: Transfer Learning ---")

### 6.1. Selección y Carga del Modelo Base Pre-entrenado

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Elige una red base (VGG16, ResNet50V2, MobileNetV2, etc.)
# Asegúrate que IMAGE_SIZE sea compatible con la red elegida (ej. 224x224 para muchas)
# --- FIN TU CÓDIGO ---

### 6.2. Creación del Nuevo Modelo (Base + Clasificador Propio)

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Define el preprocesamiento específico de la red elegida
# --- FIN TU CÓDIGO ---

### 6.3. Compilación y Entrenamiento (solo del clasificador)

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Compilar el modelo

# Definir callbacks

# --- FIN TU CÓDIGO ---

### 6.4. Evaluación del Modelo de Transfer Learning


In [None]:
# --- TU CÓDIGO AQUÍ ---
# Cargar el mejor modelo guardado

# Evaluar en el conjunto de test

# Generar reporte de clasificación

# Necesitas y_true_test (calculado en 4.4)

# Visualizar curvas de aprendizaje

# --- FIN TU CÓDIGO ---

### 6.5. Fine-Tuning (Opcional)

In [None]:

# --- TU CÓDIGO AQUÍ ---
# Descongela algunas capas superiores del modelo base

# Entrena unas pocas épocas más

# # Evaluar el modelo fine-tuned de forma similar a 6.4
# --- FIN TU CÓDIGO ---

## 7. COMPARACIÓN DE MODELOS Y CONCLUSIONES

In [None]:
print("\n--- 7. Comparación y Conclusiones ---")

### 7.1. Tabla Comparativa de Resultados

In [None]:
# --- TU CÓDIGO AQUÍ ---
# Crea una tabla (puedes usar print o librerías como Pandas) resumiendo
# las métricas clave (Accuracy, Precision, Recall, F1-Score en Test)
# para cada modelo entrenado (CNN Scratch, CNN Augmented, Transfer Learning, Fine-Tuned).

# Se recomienda extraer las métricas del classification_report para una comparación más detallada.
# --- FIN TU CÓDIGO ---

### 7.2. Discusión y Conclusiones Finales

In [None]:
# --- ESCRIBE TU ANÁLISIS AQUÍ (en celdas Markdown) ---
# * Comenta cuál modelo obtuvo el mejor rendimiento general y por qué crees que fue así.
# * Analiza las curvas de aprendizaje: ¿Hubo overfitting? ¿Ayudó el Data Augmentation?
# * ¿Cómo afectó el Transfer Learning al rendimiento y al tiempo de entrenamiento (observado)?
# * ¿Fue útil el Fine-Tuning (si se realizó)?
# * Menciona los principales desafíos encontrados durante el proyecto (carga de datos, preprocesamiento, entrenamiento, ajuste de hiperparámetros).
# * Propón posibles mejoras o siguientes pasos que podrían realizarse.
# ------------------------------------------------------------------------------

print("\n--- Fin del Proyecto ---")