# Tesis

## Preprocesamiento

Crea bounding boxes a todas las imagenes 

In [12]:
import cv2
import os
import numpy as np

input_directories = [
    "dia",
    "doctor",
    "dulce",
    "granja",
    "mecanico",
    "montaña",
    "noche", 
    "playa",
    "saludable",
    "domestico"
    "salvaje"
]

# Ruta base del directorio de imágenes
base_image_directory = "/home/andres/ambientesVirtuales/PruebasML/Practicas/DatosAProcesar"
base_output_directory = "/home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados"

# Crear directorio de salida base si no existe
os.makedirs(base_output_directory, exist_ok=True)

# Procesar cada directorio
for directory in input_directories:
    image_directory = os.path.join(base_image_directory, directory)
    output_directory = os.path.join(base_output_directory, f"{directory}Etiquetado")

    # Crear directorio de salida para cada categoría si no existe
    os.makedirs(output_directory, exist_ok=True)

    print(f"Procesando imágenes en el directorio: {image_directory}")

    # Procesar cada imagen en el directorio
    for image_name in os.listdir(image_directory):
        image_path = os.path.join(image_directory, image_name)

        # Leer imagen en escala de grises
        image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
        if image is None:
            print(f"No se pudo leer la imagen {image_name} en {directory}")
            continue

        # Detectar bordes
        edges = cv2.Canny(image, 100, 200)
        kernel = np.ones((5, 5), np.uint8)
        # Aplicar dilatación
        dilated = cv2.dilate(edges, kernel, iterations=1)
        # Aplicar erosión
        kernelErosion = np.ones((7, 7), np.uint8)
        eroded = cv2.erode(dilated, kernelErosion, iterations=1)

        # Encontrar contornos
        contours, _ = cv2.findContours(dilated, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

        # Dibujar bounding box alrededor del área más grande
        if contours:
            largest_contour = max(contours, key=cv2.contourArea)
            x, y, w, h = cv2.boundingRect(largest_contour)
            result = cv2.cvtColor(image, cv2.COLOR_GRAY2BGR)
            cv2.rectangle(result, (x, y), (x+w, y+h), (0, 255, 0), 2)

            # Guardar la imagen procesada
            output_path = os.path.join(output_directory, image_name)
            cv2.imwrite(output_path, result)
            print(f"Imagen procesada guardada en {output_path}")
        else:
            print(f"No se encontraron contornos en {image_name} en {directory}")

Procesando imágenes en el directorio: /home/andres/ambientesVirtuales/PruebasML/Practicas/DatosAProcesar/doctor
Imagen procesada guardada en /home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados/doctorEtiquetado/doctor281.jpg
Imagen procesada guardada en /home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados/doctorEtiquetado/doctor509.jpg
Imagen procesada guardada en /home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados/doctorEtiquetado/doctor114.jpg
Imagen procesada guardada en /home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados/doctorEtiquetado/doctor69.jpg
Imagen procesada guardada en /home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados/doctorEtiquetado/doctor681.jpg
Imagen procesada guardada en /home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados/doctorEtiquetado/doctor314.jpg
Imagen procesada guardada en /home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados/doctorEtiquetado/doctor380.jpg
Imagen procesada guardada en

Procesando datos con diferentes valores para mejorar el etiquetado

In [40]:
import cv2
import os
import numpy as np

input_directories = [
    #"dia",
    "reDoctor", #"dulce",
    #"granja", #"mecanico",
    #"montaña",
    #"noche", 
    #"rePlaya",
    #"saludable", "domestico"
    #"salvaje"
]

# Rutas base
base_image_directory = "/home/andres/ambientesVirtuales/PruebasML/Practicas/DatosAProcesar"
base_output_directory = "/home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados"

# Crear directorio de salida base si no existe
os.makedirs(base_output_directory, exist_ok=True)

# Procesar cada directorio
for directory in input_directories:
    image_directory = os.path.join(base_image_directory, directory)
    output_directory = os.path.join(base_output_directory, f"{directory}Etiquetado")
    os.makedirs(output_directory, exist_ok=True)

    print(f"Procesando imágenes en el directorio: {image_directory}")

    for image_name in os.listdir(image_directory):
        image_path = os.path.join(image_directory, image_name)

        # Leer imagen en escala de grises
        image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
        if image is None:
            print(f"No se pudo leer la imagen {image_name} en {directory}")
            continue

        # Suavizar imagen para reducir ruido
        blurred = cv2.GaussianBlur(image, (7, 7), 0)

        # Detectar bordes con Canny (ajusta los umbrales si es necesario)
        edges = cv2.Canny(blurred, 1, 5)

        # Dilatar y erosionar para cerrar huecos pequeños
        kernel = np.ones((9, 9), np.uint8)
        dilated = cv2.dilate(edges, kernel, iterations=4)
        eroded = cv2.erode(dilated, kernel, iterations=2)

 # Encontrar contornos
        contours, _ = cv2.findContours(dilated, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

        # Dibujar bounding box alrededor del área más grande
        if contours:
            largest_contour = max(contours, key=cv2.contourArea)
            x, y, w, h = cv2.boundingRect(largest_contour)
            result = cv2.cvtColor(image, cv2.COLOR_GRAY2BGR)
            cv2.rectangle(result, (x, y), (x+w, y+h), (0, 255, 0), 2)

            # Guardar la imagen procesada
            output_path = os.path.join(output_directory, image_name)
            cv2.imwrite(output_path, result)
            print(f"Imagen procesada guardada en {output_path}")
        else:
            print(f"No se encontraron contornos en {image_name} en {directory}")
'''
# Encontrar contornos
        contours, _ = cv2.findContours(eroded, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

        # Filtrar contornos por área mínima
        min_area = 1000  # Ajusta este valor según tus imágenes
        valid_contours = [cnt for cnt in contours if cv2.contourArea(cnt) > min_area]

        # Dibujar bounding boxes para los contornos válidos
        result = cv2.cvtColor(image, cv2.COLOR_GRAY2BGR)
        for contour in valid_contours:
            x, y, w, h = cv2.boundingRect(contour)
            cv2.rectangle(result, (x, y), (x+w, y+h), (0, 255, 0), 2)

        # Guardar la imagen procesada
        output_path = os.path.join(output_directory, image_name)
        cv2.imwrite(output_path, result)
        print(f"Imagen procesada guardada en {output_path}")

'''

Procesando imágenes en el directorio: /home/andres/ambientesVirtuales/PruebasML/Practicas/DatosAProcesar/reDoctor
Imagen procesada guardada en /home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados/reDoctorEtiquetado/doctor47_aug_47.jpg
Imagen procesada guardada en /home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados/reDoctorEtiquetado/doctor46_aug_46.jpg
Imagen procesada guardada en /home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados/reDoctorEtiquetado/doctor26_aug_26.jpg
Imagen procesada guardada en /home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados/reDoctorEtiquetado/doctor48_aug_48.jpg
Imagen procesada guardada en /home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados/reDoctorEtiquetado/doctor38_aug_38.jpg


'\n# Encontrar contornos\n        contours, _ = cv2.findContours(eroded, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)\n\n        # Filtrar contornos por área mínima\n        min_area = 1000  # Ajusta este valor según tus imágenes\n        valid_contours = [cnt for cnt in contours if cv2.contourArea(cnt) > min_area]\n\n        # Dibujar bounding boxes para los contornos válidos\n        result = cv2.cvtColor(image, cv2.COLOR_GRAY2BGR)\n        for contour in valid_contours:\n            x, y, w, h = cv2.boundingRect(contour)\n            cv2.rectangle(result, (x, y), (x+w, y+h), (0, 255, 0), 2)\n\n        # Guardar la imagen procesada\n        output_path = os.path.join(output_directory, image_name)\n        cv2.imwrite(output_path, result)\n        print(f"Imagen procesada guardada en {output_path}")\n\n'

Se redimensiona las imagenes para tenerlas todas del mismo tamaño

In [52]:
import cv2
import os

# Configuración
input_directories = [
    "diaEtiquetado", 
    "doctorEtiquetado",
    "dulceEtiquetado",
    "granjaEtiquetado",
    "mecanicoEtiquetado",
    "montañaEtiquetado",
    "nocheEtiquetado",
    "playaEtiquetado",
    "saludableEtiquetado",
    "domesticoEtiquetado", 
    "salvajeEtiquetado"
]

# Ruta base del directorio de imágenes
base_image_directory = "/home/andres/ambientesVirtuales/PruebasML/Practicas/Procesados"
base_output_directory = "/home/andres/ambientesVirtuales/PruebasML/Practicas/DatosRedimencionados"

target_size = (640, 640)  # Tamaño deseado para las imágenes (ancho, alto)

# Procesar las imágenes en cada directorio
for directory in input_directories:
    input_directory = os.path.join(base_image_directory, directory)
    output_directory = os.path.join(base_output_directory, directory)

    # Crear el directorio de salida si no existe
    os.makedirs(output_directory, exist_ok=True)

    # Verificar que el directorio de entrada existe
    if not os.path.exists(input_directory):
        print(f"El directorio de entrada no existe: {input_directory}")
        continue

    # Procesar las imágenes en el directorio actual
    for image_name in os.listdir(input_directory):
        input_path = os.path.join(input_directory, image_name)
        output_path = os.path.join(output_directory, image_name)

        # Verificar que el archivo sea una imagen
        if not image_name.lower().endswith(('.png', '.jpg', '.jpeg')):
            print(f"Saltando archivo no válido: {image_name}")
            continue

        # Leer la imagen
        image = cv2.imread(input_path)
        if image is None:
            print(f"No se pudo leer la imagen: {input_path}")
            continue

        # Redimensionar la imagen
        resized_image = cv2.resize(image, target_size)

        # Guardar la imagen redimensionada
        cv2.imwrite(output_path, resized_image)
        print(f"Imagen redimensionada y guardada en: {output_path}")

print("Redimensionamiento completado.")


Imagen redimensionada y guardada en: /home/andres/ambientesVirtuales/PruebasML/Practicas/DatosRedimencionados/doctorEtiquetado/doctor281.jpg
Imagen redimensionada y guardada en: /home/andres/ambientesVirtuales/PruebasML/Practicas/DatosRedimencionados/doctorEtiquetado/doctor27_aug_27.jpg
Imagen redimensionada y guardada en: /home/andres/ambientesVirtuales/PruebasML/Practicas/DatosRedimencionados/doctorEtiquetado/doctor509.jpg
Imagen redimensionada y guardada en: /home/andres/ambientesVirtuales/PruebasML/Practicas/DatosRedimencionados/doctorEtiquetado/doctor114.jpg
Imagen redimensionada y guardada en: /home/andres/ambientesVirtuales/PruebasML/Practicas/DatosRedimencionados/doctorEtiquetado/doctor69.jpg
Imagen redimensionada y guardada en: /home/andres/ambientesVirtuales/PruebasML/Practicas/DatosRedimencionados/doctorEtiquetado/doctor681.jpg
Imagen redimensionada y guardada en: /home/andres/ambientesVirtuales/PruebasML/Practicas/DatosRedimencionados/doctorEtiquetado/doctor314.jpg
Imagen r

Se etiquetan las imagenes

In [53]:
import cv2
import os

base_input_directory = "/home/andres/ambientesVirtuales/PruebasML/Practicas/DatosRedimencionados"
input_directories = [
    "doctorEtiquetado", 
    "mecanicoEtiquetado",
    "domesticoEtiquetado",
    "salvajeEtiquetado",
    "nocheEtiquetado", 
    "diaEtiquetado",
    "montañaEtiquetado", 
    "playaEtiquetado",
    "granjaEtiquetado",
    "dulceEtiquetado",
    "saludableEtiquetado"
]
labels_directory = "/home/andres/ambientesVirtuales/PruebasML/Practicas/Labels"
os.makedirs(labels_directory, exist_ok=True)

for category_id, input_directory in enumerate(input_directories):
    print(f"Procesando directorio: {input_directory}")
    category_input_dir = os.path.join(base_input_directory, input_directory)
    category_labels_dir = os.path.join(labels_directory, input_directory)
    os.makedirs(category_labels_dir, exist_ok=True)

    for image_name in os.listdir(category_input_dir):
        if not image_name.lower().endswith(('.png', '.jpg', '.jpeg')):
            continue
        
        image_path = os.path.join(category_input_dir, image_name)
        image = cv2.imread(image_path)
        if image is None:
            print(f"No se pudo leer la imagen {image_path}")
            continue

        gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
        edges = cv2.Canny(gray_image, 150, 250)
        contours, _ = cv2.findContours(edges, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

        if contours:
            largest_contour = max(contours, key=cv2.contourArea)
            if cv2.contourArea(largest_contour) < 10:
                print(f"Contorno demasiado pequeño en {image_path}")
                continue

            x, y, w, h = cv2.boundingRect(largest_contour)
            img_h, img_w = gray_image.shape
            x_center = (x + w / 2) / img_w
            y_center = (y + h / 2) / img_h
            width = w / img_w
            height = h / img_h
            yolo_format = f"{category_id} {x_center:.6f} {y_center:.6f} {width:.6f} {height:.6f}"
            txt_name = os.path.splitext(image_name)[0] + ".txt"
            txt_path = os.path.join(category_labels_dir, txt_name)

            with open(txt_path, "w") as f:
                f.write(yolo_format + "\n")
        else:
            print(f"No se encontraron contornos en {image_path}")


Procesando directorio: doctorEtiquetado
Procesando directorio: playaEtiquetado
Procesando directorio: salvajeEtiquetado


Se dividen las imagenes

In [5]:
import os
import random
import shutil

def split_dataset(data_dir, train_dir, test_dir, test_size=0.3):
    """
    Divide las imágenes y sus archivos .txt correspondientes en conjuntos de entrenamiento y prueba de forma aleatoria.

    :param data_dir: Directorio donde están todas las imágenes y sus archivos .txt.
    :param train_dir: Directorio donde se guardarán las imágenes y .txt de entrenamiento.
    :param test_dir: Directorio donde se guardarán las imágenes y .txt de prueba.
    :param test_size: Proporción de imágenes para el conjunto de prueba (por defecto, 0.3 para 30%).
    """
    # Crear los directorios de salida si no existen
    os.makedirs(train_dir, exist_ok=True)
    os.makedirs(test_dir, exist_ok=True)

    # Obtener la lista de todas las imágenes (asumiendo extensión .jpg o .png)
    all_images = [f for f in os.listdir(data_dir) if f.endswith(('.jpg', '.png'))]

    # Mezclar las imágenes aleatoriamente
    random.shuffle(all_images)

    # Calcular el número de imágenes para el conjunto de prueba
    num_test = int(len(all_images) * test_size)

    # Dividir las imágenes
    test_images = all_images[:num_test]
    train_images = all_images[num_test:]

    # Mover las imágenes y sus archivos .txt al directorio correspondiente
    for img in train_images:
        img_path = os.path.join(data_dir, img)
        txt_path = os.path.join(data_dir, os.path.splitext(img)[0] + '.txt')

        shutil.copy(img_path, os.path.join(train_dir, img))
        if os.path.exists(txt_path):
            shutil.copy(txt_path, os.path.join(train_dir, os.path.basename(txt_path)))

    for img in test_images:
        img_path = os.path.join(data_dir, img)
        txt_path = os.path.join(data_dir, os.path.splitext(img)[0] + '.txt')

        shutil.copy(img_path, os.path.join(test_dir, img))
        if os.path.exists(txt_path):
            shutil.copy(txt_path, os.path.join(test_dir, os.path.basename(txt_path)))

    print(f"Conjunto dividido exitosamente:")
    print(f"  Imágenes de entrenamiento: {len(train_images)}")
    print(f"  Imágenes de prueba: {len(test_images)}")

# Configuración de directorios
data_directory = "/home/andres/ambientesVirtuales/PruebasML/Practicas/DatosEntrenamiento/Train"
train_directory = "/home/andres/ambientesVirtuales/PruebasML/Practicas/DatosEntrenamiento/newTrain"
test_directory = "/home/andres/ambientesVirtuales/PruebasML/Practicas/DatosEntrenamiento/newTest"

# Llamar a la función con una proporción de prueba del 30%
split_dataset(data_directory, train_directory, test_directory, test_size=0.3)


Conjunto dividido exitosamente:
  Imágenes de entrenamiento: 5858
  Imágenes de prueba: 2510


## Entrenamiento con Yolov5

In [7]:
# Crear archivo data.yaml con las rutas y clases correctas
with open('database.yaml', 'w') as f:
    f.write("""
train: /home/andres/ambientesVirtuales/PruebasML/Practicas/DatosEntrenamiento/newTrain
val: /home/andres/ambientesVirtuales/PruebasML/Practicas/DatosEntrenamiento/newTest

nc: 11
names: ['doctor', 'mecanico', 'domestico', 'salvaje', 'noche', 'dia', 'montaña', 'playa', 'granja', 'dulce', 'saludable']

""")


In [None]:
# Clonar el repositorio de YOLOv5
!git clone https://github.com/ultralytics/yolov5.git

%pip install -r yolov5/requirements.txt

fatal: destination path 'yolov5' already exists and is not an empty directory.


In [3]:
import torch
print(torch.cuda.is_available())
print(torch.cuda.device_count())

True
1


In [8]:
!python "/home/andres/ambientesVirtuales/PruebasML/Practicas/Tesis/yolov5/train.py" --img 640 --batch 16 --epochs 200 --data database.yaml --weights yolov5s.pt --device 0 --project "/home/andres/ambientesVirtuales/PruebasML/Practicas/resultados" --name experiment2

[34m[1mtrain: [0mweights=yolov5s.pt, cfg=, data=database.yaml, hyp=yolov5/data/hyps/hyp.scratch-low.yaml, epochs=200, batch_size=16, imgsz=640, rect=False, resume=False, nosave=False, noval=False, noautoanchor=False, noplots=False, evolve=None, evolve_population=yolov5/data/hyps, resume_evolve=None, bucket=, cache=None, image_weights=False, device=0, multi_scale=False, single_cls=False, optimizer=SGD, sync_bn=False, workers=8, project=/home/andres/ambientesVirtuales/PruebasML/Practicas/resultados, name=experiment2, exist_ok=False, quad=False, cos_lr=False, label_smoothing=0.0, patience=100, freeze=[0], save_period=-1, seed=0, local_rank=-1, entity=None, upload_dataset=False, bbox_interval=-1, artifact_alias=latest, ndjson_console=False, ndjson_file=False
[34m[1mgithub: [0m⚠️ YOLOv5 is out of date by 7 commits. Use 'git pull' or 'git clone https://github.com/ultralytics/yolov5' to update.
YOLOv5 🚀 v7.0-388-g882c35fc Python-3.10.12 torch-2.3.1+cu121 CUDA:0 (NVIDIA GeForce RTX 2050,

### Validar el modelo

In [10]:
#!python detect.py --weights /content/drive/MyDrive/tesis/resultados/experiment12/weights/best.pt --img 640 --source /content/drive/MyDrive/tesis/new_dataset/test/ic129.png
!python "/home/andres/ambientesVirtuales/PruebasML/Practicas/Tesis/yolov5/val.py" --data database.yaml --weights "/home/andres/ambientesVirtuales/PruebasML/Practicas/resultados/experiment27/weights/best.pt" --img 640 --device 0

[34m[1mval: [0mdata=database.yaml, weights=['/home/andres/ambientesVirtuales/PruebasML/Practicas/resultados/experiment27/weights/best.pt'], batch_size=32, imgsz=640, conf_thres=0.001, iou_thres=0.6, max_det=300, task=val, device=0, workers=8, single_cls=False, augment=False, verbose=False, save_txt=False, save_hybrid=False, save_conf=False, save_json=False, project=yolov5/runs/val, name=exp, exist_ok=False, half=False, dnn=False
YOLOv5 🚀 v7.0-388-g882c35fc Python-3.10.12 torch-2.3.1+cu121 CUDA:0 (NVIDIA GeForce RTX 2050, 3806MiB)

Fusing layers... 
Model summary: 157 layers, 7039792 parameters, 0 gradients, 15.8 GFLOPs
[34m[1mval: [0mScanning /home/andres/ambientesVirtuales/PruebasML/Practicas/DatosEntrenami[0m
                 Class     Images  Instances          P          R      mAP50   
                   all       2510       2517      0.738      0.751      0.764      0.665
                doctor       2510        216        0.6      0.634      0.656      0.579
             

### Exportar el modelo

In [2]:
!python "/home/andres/ambientesVirtuales/PruebasML/Practicas/Tesis/yolov5/export.py" --weights "/home/andres/ambientesVirtuales/PruebasML/Practicas/resultados/experiment27/weights/best.pt" --img 640 --batch 1 --device 0 --include torchscript

[34m[1mexport: [0mdata=yolov5/data/coco128.yaml, weights=['/home/andres/ambientesVirtuales/PruebasML/Practicas/resultados/experiment27/weights/best.pt'], imgsz=[640], batch_size=1, device=0, half=False, inplace=False, keras=False, optimize=False, int8=False, per_tensor=False, dynamic=False, cache=, simplify=False, mlmodel=False, opset=17, verbose=False, workspace=4, nms=False, agnostic_nms=False, topk_per_class=100, topk_all=100, iou_thres=0.45, conf_thres=0.25, include=['torchscript']
YOLOv5 🚀 v7.0-388-g882c35fc Python-3.10.12 torch-2.3.1+cu121 CUDA:0 (NVIDIA GeForce RTX 2050, 3806MiB)

Fusing layers... 
Model summary: 157 layers, 7039792 parameters, 0 gradients, 15.8 GFLOPs

[34m[1mPyTorch:[0m starting from /home/andres/ambientesVirtuales/PruebasML/Practicas/resultados/experiment27/weights/best.pt with output shape (1, 25200, 16) (13.8 MB)

[34m[1mTorchScript:[0m starting export with torch 2.3.1+cu121...
[34m[1mTorchScript:[0m export success ✅ 0.7s, saved as /home/andres/