<div align="center">

# Proyecto 3

## Sede central de Cartago

## Escuela de Ingeniería en Computación

## Inteligencia artificial (Gr 02 – IC6200)

### Regresión lineal con descenso del gradiente y selección de características

### Creado por

Esteban Pérez Picado – 2021046572

Joselyn Montero Rodríguez - 2022136356

Manuel A. Rodríguez Murillo - 2021028686

### 24-06-2025

### Semestre I

### Steven Andrey Pacheco Portuguez
</div>

## Introducción
...

## Importación de librerías

In [1]:
# Módulos del sistema
import os
import shutil
import random

# Manejo de imágenes
import cv2

# Manipulación de datos
import numpy as np
import pandas as pd

# Deep learning
import torch

# Utilidades adicionales
from tqdm import tqdm

In [2]:
# Conexion con drive
driveBit = 0
try:
    from google.colab import drive
    drive.mount('/content/drive')
    base_path = "/content/drive/MyDrive/archive"
    driveBit = 1
except ImportError:
    #Jupyter local
    #current_dir = os.path.dirname(os.path.abspath(__file__)) if '__file__' in globals() else os.getcwd()
    #base_path = os.path.join(current_dir, "data")
    print("Colab no detectado, usando ruta local:", base_path)

Mounted at /content/drive


In [3]:
dataset_path = base_path
csv_path = os.path.join(base_path, "BUTTERFLIES.csv")

In [None]:
# Se verifica que se esté trabajando con la gpu
device = torch.device("cuda" if torch.cuda.is_available () else "cpu")
print ("Is Torch Cuda Available? " + str (torch.cuda.is_available()))

Is Torch Cuda Available? True


## Selección de especies para el clasificador

In [None]:
# Cargar el archivo CSV que contiene las etiquetas de las imágenes
data = pd.read_csv(csv_path)

# Contar el número de muestras por especie
species_counts = data["labels"].value_counts()

# Obtener las 30 especies con mayor cantidad de muestras
top_30_species = species_counts.head(30).index.tolist()

print("Lista de las 30 especies con mayor cantidad de muestras:")
print(top_30_species)



Lista de las 30 especies con mayor cantidad de muestras:
['MOURNING CLOAK', 'GREEN HAIRSTREAK', 'BROWN ARGUS', 'BROOKES BIRDWING', 'SLEEPY ORANGE', 'CHALK HILL BLUE', 'HUMMING BIRD HAWK MOTH', 'WHITE LINED SPHINX MOTH', 'ATALA', 'BROWN SIPROETA', 'ARCIGERA FLOWER MOTH', 'BANDED ORANGE HELICONIAN', 'SCARCE SWALLOW', 'CRECENT', 'HERCULES MOTH', 'MILBERTS TORTOISESHELL', 'ROSY MAPLE MOTH', 'RED CRACKER', 'ORANGE TIP', 'BANDED TIGER MOTH', 'Iphiclus sister', 'CHECQUERED SKIPPER', 'EASTERN PINE ELFIN', 'EMPEROR GUM MOTH', 'DANAID EGGFLY', 'GREAT JAY', 'COPPER TAIL', 'EASTERN COMA', 'CLEOPATRA', 'BIRD CHERRY ERMINE MOTH']


## Reducción de dimensionalidad de imágenes

In [None]:
# Reduce la dimensión de las imágenes a 128x128 píxeles
def resize_image(img_path, size=(128, 128)):
    img = cv2.imread(img_path)
    if img is not None:
        resized_img = cv2.resize(img, size)
        return resized_img
    else:
        print(f"Error al cargar la imagen: {img_path}")
        return None

In [None]:
def process_images(base_path, top_species):
    """
    Reduce el tamaño de las imágenes de las 30 especies con mayor cantidad de muestras,
    y las almacena en una nueva carpeta llamada "species_selected"
    """
    # Crear la carpeta "species_selected" si no existe
    selected_species_path = os.path.join(base_path, "species_selected")
    os.makedirs(selected_species_path, exist_ok=True)

    # Recorrer las carpetas de train, test y valid
    for dir in ['train', 'test', 'valid']:
        dataset_path = os.path.join(base_path, dir)

        # Crear la carpeta para el tipo de dataset
        processed_path = os.path.join(selected_species_path, dir)
        os.makedirs(processed_path, exist_ok=True)

        # Verificar si la carpeta ya fue procesada
        if os.listdir(processed_path):  # Si hay archivos en la carpeta, ya fue procesada
            print(f"Las imágenes en '{dir}' ya han sido procesadas.")
            continue  # Saltar a la siguiente carpeta si ya fue procesada

        print(f"Procesando imágenes en '{dir}'...")

        # Recorrer las carpetas de especies
        for species in os.listdir(dataset_path):
            if species in top_species:
                species_path = os.path.join(dataset_path, species)

                # Crear una carpeta para la especie en "species_selected"
                species_selected_path = os.path.join(processed_path, species)
                os.makedirs(species_selected_path, exist_ok=True)

                # Recorrer las imágenes de la especie
                for img_filename in os.listdir(species_path):
                    img_path = os.path.join(species_path, img_filename)

                    # Redimensionar la imagen
                    resized_img = resize_image(img_path)
                    if resized_img is not None:

                        # Guardar la imagen redimensionada
                        output_path = os.path.join(species_selected_path, img_filename)
                        cv2.imwrite(output_path, resized_img)

        print(f"Finalizado el procesamiento de imágenes en '{dir}'.")

process_images(dataset_path, top_30_species)

Las imágenes en 'train' ya han sido procesadas.
Las imágenes en 'test' ya han sido procesadas.
Las imágenes en 'valid' ya han sido procesadas.


In [4]:
species_selected_path = os.path.join(dataset_path, "species_selected")
train_path = os.path.join(species_selected_path, 'train')
test_path = os.path.join(species_selected_path, 'test')

## Incorporación de muestras al set de testing

In [8]:
def move_samples_to_test(base_path, num_samples=20):
    """
    Mueve 20 muestras aleatorias del set de train al de test
    """
    # Recorrer las carpetas de especies en el conjunto de entrenamiento
    for species in os.listdir(train_path):
        species_train_path = os.path.join(train_path, species)
        species_test_path = os.path.join(test_path, species)

        # Verificar si la carpeta de la especie existe en el conjunto de test
        if not os.path.exists(species_test_path):
            os.makedirs(species_test_path)  # Crear la carpeta si no existe

        # Listar las imágenes ya existentes en el conjunto de test
        test_images = os.listdir(species_test_path) if os.path.exists(species_test_path) else []
        # Verificar si ya se han movido imágenes a la carpeta de test
        if len(test_images) > 5:
            print(f"Las imágenes en '{species_test_path}' ya han sido procesadas. Saltando esta especie.")
            continue  # Saltar a la siguiente especie si ya se han movido imágenes

        # Listar las imágenes en el conjunto de entrenamiento
        images = os.listdir(species_train_path)

        # Verificar que haya suficientes imágenes para mover
        if len(images) > num_samples:
            # Seleccionar aleatoriamente 20 imágenes
            samples_to_move = random.sample(images, num_samples)

            print(f"Moviendo imánegnes de {species} a test.")

            # Mover las imágenes seleccionadas al conjunto de test
            for img in samples_to_move:
                src_path = os.path.join(species_train_path, img)
                dst_path = os.path.join(species_test_path, img)

                # Mover la imagen
                shutil.move(src_path, dst_path)
        else:
            print(f"No hay suficientes imágenes en {species} para mover. Se encontraron {len(images)} imágenes.")

move_samples_to_test (species_selected_path)

Las imágenes en '/content/drive/MyDrive/archive/species_selected/test/GREAT JAY' ya han sido procesadas. Saltando esta especie.
Las imágenes en '/content/drive/MyDrive/archive/species_selected/test/HUMMING BIRD HAWK MOTH' ya han sido procesadas. Saltando esta especie.
Las imágenes en '/content/drive/MyDrive/archive/species_selected/test/RED CRACKER' ya han sido procesadas. Saltando esta especie.
Las imágenes en '/content/drive/MyDrive/archive/species_selected/test/BROWN ARGUS' ya han sido procesadas. Saltando esta especie.
Las imágenes en '/content/drive/MyDrive/archive/species_selected/test/WHITE LINED SPHINX MOTH' ya han sido procesadas. Saltando esta especie.
Las imágenes en '/content/drive/MyDrive/archive/species_selected/test/BIRD CHERRY ERMINE MOTH' ya han sido procesadas. Saltando esta especie.
Las imágenes en '/content/drive/MyDrive/archive/species_selected/test/BROWN SIPROETA' ya han sido procesadas. Saltando esta especie.
Las imágenes en '/content/drive/MyDrive/archive/specie