# Reto de Clasificación de Imágenes de Animales | Ruta N

## Contexto del reto a resolver

## Creación del ambiente virtual e instalación de dependencias

Lo primero es tener instalado Anaconda o Miniconda. Luego de eso abrir el terminal y crear un entorno virtual con la siguiente línea.

In [None]:
%conda create -n RutaN python=3.9

Lo siguiente es activar el entorno virtual creado y luego instalar unas dependencias de NVidia para poder utilizar la GPU en el entrenamiento de los modelos.

In [None]:
%conda activate RutaN
%conda install -c conda-forge cudatoolkit=11.2 cudnn=8.1.0

A continuación se instalan todas las dependencias necesarias.

In [None]:
%pip install tensorflow==2.10

Por último, se exporta a un archivo de texto las dependencias utilizadas para facilitar la instalación en el futuro.

In [None]:
%pip freeze > requirements.txt

## Trabajando con el dataset

Lo que haremos será crear una función para distribuir aleatoriamente las imágenes de las 5 clases en 3 carpetas: train, test y validation. Para la carpeta de train destinaremos el 70% de las imágenes; para validation el 10% y para test el 20% restante.

In [1]:
import os
import random
import shutil

def distribuir_imagenes(carpeta_imagenes, carpetas_destino, proporciones, semilla = None):
    """
    Distribuye copias aleatorias de imágenes desde una carpeta de origen a varias carpetas de destino
    según las proporciones especificadas.

    Args:
        carpeta_imagenes (str): Ruta de la carpeta que contiene las imágenes.
        carpetas_destino (list of str): Lista de rutas de las carpetas de destino.
        proporciones (list of int): Lista de proporciones para cada carpeta de destino en porcentaje.
        semilla (int): Semilla para el generador de números aleatorios (opcional).
    """
    if sum(proporciones) != 100:
        raise ValueError("Las proporciones deben sumar 100.")

    if semilla is not None:
        random.seed(semilla)

    archivos = os.listdir(carpeta_imagenes)
    total_archivos = len(archivos)

    for i, carpeta_destino in enumerate(carpetas_destino):
        cantidad_archivos = total_archivos * proporciones[i] // 100

        # Crear la carpeta de destino si no existe
        os.makedirs(carpeta_destino, exist_ok=True)

        for _ in range(cantidad_archivos):
            archivo = random.choice(archivos)
            origen = os.path.join(carpeta_imagenes, archivo)
            destino = os.path.join(carpeta_destino, archivo)
            shutil.copy(origen, destino)

    print("Distribución de copias de imágenes completada.")

Comenzamos con las imágenes de los pájaros.

In [5]:

carpeta_imagenes = r"raw_dataset\birds"
carpetas_destino = [r"dataset\train\birds", r"dataset\test\birds", r"dataset\validation\birds"]
proporciones = [70, 20, 10]
semilla = 42
distribuir_imagenes(carpeta_imagenes, carpetas_destino, proporciones, semilla = semilla)

Distribución de copias de imágenes completada.


Continuamos con los gatos.

In [6]:
carpeta_imagenes = r"raw_dataset\cat"
carpetas_destino = [r"dataset\train\cat", r"dataset\test\cat", r"dataset\validation\cat"]
proporciones = [70, 20, 10]
semilla = 42
distribuir_imagenes(carpeta_imagenes, carpetas_destino, proporciones, semilla = semilla)

Distribución de copias de imágenes completada.


Los siguientes son los perros.

In [7]:
carpeta_imagenes = r"raw_dataset\dog"
carpetas_destino = [r"dataset\train\dog", r"dataset\test\dog", r"dataset\validation\dog"]
proporciones = [70, 20, 10]
semilla = 42
distribuir_imagenes(carpeta_imagenes, carpetas_destino, proporciones, semilla = semilla)

Distribución de copias de imágenes completada.


Ahora los peces.

In [8]:
carpeta_imagenes = r"raw_dataset\fish"
carpetas_destino = [r"dataset\train\fish", r"dataset\test\fish", r"dataset\validation\fish"]
proporciones = [70, 20, 10]
semilla = 42
distribuir_imagenes(carpeta_imagenes, carpetas_destino, proporciones, semilla = semilla)

Distribución de copias de imágenes completada.


Y por último los salvajes.

In [9]:
carpeta_imagenes = r"raw_dataset\wild"
carpetas_destino = [r"dataset\train\wild", r"dataset\test\wild", r"dataset\validation\wild"]
proporciones = [70, 20, 10]
semilla = 42
distribuir_imagenes(carpeta_imagenes, carpetas_destino, proporciones, semilla = semilla)

Distribución de copias de imágenes completada.
