In [9]:
import os
import zipfile
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import matplotlib.pyplot as plt

# Ruta del archivo ZIP y carpeta destino
local_zip = "./practica_1_dataset.zip"
extract_folder = "./dataset"

# Descomprimir el archivo ZIP
with zipfile.ZipFile(local_zip, 'r') as zip_ref:
    zip_ref.extractall(extract_folder)

print("Descompresión completada.")

# Definir rutas de carpetas
train_dir = os.path.join(extract_folder, 'train')
test_dir = os.path.join(extract_folder, 'test')
valid_dir = os.path.join(extract_folder, 'valid')  # Si existe un conjunto de validación

# Verificar existencia de directorios
if os.path.exists(train_dir) and os.path.exists(test_dir):
    print(f"Directorio de entrenamiento encontrado: {train_dir}")
    print(f"Directorio de prueba encontrado: {test_dir}")
else:
    raise FileNotFoundError("ERROR: Verifica que el ZIP contiene 'train/' y 'test/' correctamente.")

# Crear generador de imágenes con aumento de datos para entrenamiento
train_datagen = ImageDataGenerator(
      rescale=1./255,
      rotation_range=30,
      width_shift_range=0.2,
      height_shift_range=0.2,
      shear_range=0.2,
      zoom_range=0.2,
      horizontal_flip=True,
      fill_mode='nearest')

train_generator = train_datagen.flow_from_directory(
        train_dir,
        target_size=(96, 96),
        batch_size=128,
        color_mode="rgb",
        class_mode='categorical')

# Generador de validación (si existe)
if os.path.exists(valid_dir):
    valid_datagen = ImageDataGenerator(rescale=1./255)
    valid_generator = valid_datagen.flow_from_directory(
        valid_dir,
        target_size=(96, 96),
        batch_size=128,
        color_mode="rgb",
        class_mode='categorical')
else:
    valid_generator = None  # No hay validación

# Generador de test
test_datagen = ImageDataGenerator(rescale=1./255)
test_generator = test_datagen.flow_from_directory(
        test_dir,
        target_size=(96, 96),
        batch_size=128,
        color_mode="rgb",
        class_mode='categorical')


Descompresión completada.
Directorio de entrenamiento encontrado: ./dataset/train
Directorio de prueba encontrado: ./dataset/test
Found 447 images belonging to 7 classes.
Found 127 images belonging to 7 classes.
Found 63 images belonging to 7 classes.


In [8]:
import os

# Función para listar clases y contar imágenes en cada una
def contar_imagenes_en_carpetas(base_dir, folder_name):
    folder_path = os.path.join(base_dir, folder_name)
    if os.path.exists(folder_path):
        print(f"\nEstructura de carpetas en '{folder_name}/':\n")
        for class_name in os.listdir(folder_path):
            class_path = os.path.join(folder_path, class_name)
            if os.path.isdir(class_path):
                num_images = len(os.listdir(class_path))
                print(f"Clase: {class_name} - {num_images} imágenes")
    else:
        print(f"\nEl directorio '{folder_name}' no existe.")

# Rutas de los directorios
base_dataset_folder = extract_folder  # La carpeta donde se descomprimió el dataset

# Contar imágenes en train, valid y test
contar_imagenes_en_carpetas(base_dataset_folder, 'train')
contar_imagenes_en_carpetas(base_dataset_folder, 'valid')
contar_imagenes_en_carpetas(base_dataset_folder, 'test')


Estructura de carpetas en 'train/':

Clase: fish - 157 imágenes
Clase: starfish - 33 imágenes
Clase: penguin - 47 imágenes
Clase: jellyfish - 31 imágenes
Clase: puffin - 45 imágenes
Clase: shark - 77 imágenes
Clase: stingray - 57 imágenes

Estructura de carpetas en 'valid/':

Clase: fish - 47 imágenes
Clase: starfish - 12 imágenes
Clase: penguin - 17 imágenes
Clase: jellyfish - 9 imágenes
Clase: puffin - 15 imágenes
Clase: shark - 11 imágenes
Clase: stingray - 16 imágenes

Estructura de carpetas en 'test/':

Clase: fish - 16 imágenes
Clase: starfish - 5 imágenes
Clase: penguin - 7 imágenes
Clase: jellyfish - 11 imágenes
Clase: puffin - 6 imágenes
Clase: shark - 10 imágenes
Clase: stingray - 8 imágenes
