In [None]:
%load_ext autoreload
%autoreload 2

In [None]:
import shutil
import os

In [None]:
import tensorflow as tf

In [None]:
dataset_dir = os.path.join('data', 'dataloader')

In [None]:
img_height = 224
img_width = 224
batch_size = 32

In [None]:
train_ds = tf.keras.preprocessing.image_dataset_from_directory(
    dataset_dir,
    validation_split=0.2,
    subset="training",
    seed=123,
    image_size=(img_height, img_width),
    batch_size=batch_size
)

val_ds = tf.keras.preprocessing.image_dataset_from_directory(
    dataset_dir,
    validation_split=0.2,
    subset="validation",
    seed=123,
    image_size=(img_height, img_width),
    batch_size=batch_size
)


In [None]:
class_names = train_ds.class_names
print(f"Clases detectadas: {class_names}")

In [None]:
AUTOTUNE = tf.data.AUTOTUNE

train_ds = train_ds.cache().shuffle(1000).prefetch(buffer_size=AUTOTUNE)
val_ds = val_ds.cache().prefetch(buffer_size=AUTOTUNE)

In [None]:
import matplotlib.pyplot as plt

In [None]:
plt.figure(figsize=(10, 10))
for images, labels in train_ds.take(1):
    for i in range(9):
        ax = plt.subplot(3, 3, i + 1)
        plt.imshow(images[i].numpy().astype("uint8"))
        plt.title(class_names[labels[i]])
        plt.axis("off")

## Justificación del enfoque experimental

Aunque hemos preparado un dataset con casi 20k recortes, sigue siendo **relativamente pequeño** para entrenar redes neuronales profundas (DNNs) desde cero.

¿Por qué?

- Modelos como ResNet, EfficientNet o Vision Transformers se entrenan sobre datasets enormes como **ImageNet** (1M+ imágenes).
- Las DNNs requieren grandes volúmenes de datos para evitar underfitting y aprender desde patrones básicos (bordes) hasta complejos (formas).
- En datasets pequeños, la práctica común es usar **transfer learning**, aprovechando pesos preentrenados y ajustando solo las capas finales.

### Referencias relevantes
- [EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks (arXiv)](https://arxiv.org/abs/1905.11946)  
- [Deep Residual Learning for Image Recognition — ResNet (arXiv)](https://arxiv.org/abs/1512.03385)  
- [Keras Applications: ResNet Models (Keras.io)](https://keras.io/api/applications/resnet/)  
- [TensorFlow Tutorial: Transfer Learning (TensorFlow.org)](https://www.tensorflow.org/tutorials/images/transfer_learning?hl=es-419)  
- [CS231n Stanford Lecture 17: Transfer Learning and Domain Adaptation (PDF)](https://cs231n.stanford.edu/slides/2021/lecture_17.pdf)

---

Sin embargo, antes de saltar al transfer learning, comprobaremos **empíricamente** qué rendimiento podemos lograr construyendo una CNN sencilla desde cero.

Esto nos dará:
- Una línea base de rendimiento.  
- Comprensión de las limitaciones del entrenamiento puro.  
- Datos para justificar (o no) el uso de modelos preentrenados.

---

**Próximo paso:**  
Construiremos y entrenaremos una CNN simple sobre nuestro dataset y analizaremos los resultados antes de decidir si migrar a transferencia.
