# 40982 - Visión por Computador - Práctica 7 - Entrenando un detector
Isac Añor Santana

## Detector de palmeras
En esta práctica se realiza un entrenamiento personalizado de YOLOv7 para que detecte palmeras.

## Procedimiento

### Obtención de un conjunto de datos o Dataset
La obtención del Dataset la he hecho personalmente sacando fotos de palmeras que se encuentran en el Campus Universitario.

### Anotación del conjunto de datos
La anotación del [conjunto de datos](https://app.roboflow.com/vcp7/palm-tree-detection-0we3t) la he llevado a cabo usando la herramienta [Roboflow](https://app.roboflow.com/login). Antes de subir las imágenes a directamente a Roboflow, las redimensioné. Originalmente, tenían una dimensión de 3024 píxeles de ancho por 4032 de alto, lo que me pareció demasiado. En consecuencia fueron redimensionadas a 756x1008, igualmente, Roboflow posteriormente lleva a cabo un redimensionamiento a 640x640. El conjunto de datos original se encuentra en el directorio Datasets/Raw-Dataset, el redimensionnado en Datasets/Resized-Dataset y el anotado por Roboflow en Datasets/RoboflowPalmTreeAnotatedDataset. El dataset descargado de Roboflow cuenta con 452 imágenes para el conjunto de entrenamiento, 54 para el de validación y 27 para el de test.

### Entrenamiento
Tras crear el entorno virtual correspondiente y descargar yolov7, se mueven los directorios de entrenamiento, test y validación y se ejecuta el siguiente comando.

`python train.py --device 0 --weights yolov7.pt --cfg cfg/training/yolov7.yaml --data data/data.yaml --hyp data/hyp.scratch.custom.yaml --workers 1 --batch-size 4 --epochs 200 --name yolov7-palmeras`

En este caso, se ha puesto a entrenar durante unas dos horas. Al finalizar produce un fichero, best.pt, que contiene los pesos entrenados y se usará como parámetro posteriormente para realizar detecciones

### Prueba del entrenamiento personalizado
Para probar el entrenamiento se toman unas imágenes y videos grabados y se pasan por el detector. Las imágenes estarán bajo el directorio images/ y los vídeos en videos/. La detección se lleva a cabo en el resto del cuaderno. Los resultados se pueden ver bajo el directorio Results.

#### Paquetes necesarios

In [1]:
import cv2
import glob
import os
import numpy as np
import matplotlib.pyplot as plt
import shutil

In [None]:
# Verificación que cuda está disponible
import torch
print(torch.cuda.is_available())


#### Detección en imágenes

In [15]:
!python yolov7/detect.py --weights best.pt --conf 0.50 --source ./images/ --save-txt --device 0


Namespace(weights=['best.pt'], source='./images/', img_size=640, conf_thres=0.5, iou_thres=0.45, device='0', view_img=False, save_txt=True, save_conf=False, nosave=False, classes=None, agnostic_nms=False, augment=False, update=False, project='runs/detect', name='exp', exist_ok=False, no_trace=False)
Fusing layers... 
RepConv.fuse_repvgg_block
RepConv.fuse_repvgg_block
RepConv.fuse_repvgg_block
IDetect.fuse
 Convert model to Traced-model... 
 traced_script_module saved! 
 model is traced! 

3 Palm-Treess, Done. (27.0ms) Inference, (5.0ms) NMS
 The image with the result is saved in: runs\detect\exp3\IMG_20221201_151230_jpg.rf.ba5687dce938845643167b6e200aab80.jpg
1 Palm-Trees, Done. (23.0ms) Inference, (2.0ms) NMS
 The image with the result is saved in: runs\detect\exp3\IMG_20221201_151232_1_jpg.rf.bceee8ac331f23ee679f40c646664b46.jpg
1 Palm-Trees, Done. (25.0ms) Inference, (1.0ms) NMS
 The image with the result is saved in: runs\detect\exp3\IMG_20221201_151455_jpg.rf.6831eefc85c06088cb66

YOLOR  2022-12-2 torch 1.13.0 CUDA:0 (NVIDIA GeForce RTX 2060, 6143.5625MB)

  return _VF.meshgrid(tensors, **kwargs)  # type: ignore[attr-defined]
Model Summary: 314 layers, 36481772 parameters, 6194944 gradients, 103.2 GFLOPS


#### Detección en vídeos

In [16]:
!python yolov7/detect.py --weights best.pt --conf 0.5 --source videos/ --device 0

Namespace(weights=['best.pt'], source='videos/', img_size=640, conf_thres=0.5, iou_thres=0.45, device='0', view_img=False, save_txt=False, save_conf=False, nosave=False, classes=None, agnostic_nms=False, augment=False, update=False, project='runs/detect', name='exp', exist_ok=False, no_trace=False)
Fusing layers... 
RepConv.fuse_repvgg_block
RepConv.fuse_repvgg_block
RepConv.fuse_repvgg_block
IDetect.fuse
 Convert model to Traced-model... 
 traced_script_module saved! 
 model is traced! 

video 1/4 (1/212) c:\Users\Isac\OneDrive - Universidad de Las Palmas de Gran Canaria\Cuarto\Semestre_1\40982-VisionPorComputador\Practicas\P7\videos\VID_20221201_152109.mp4: 1 Palm-Trees, Done. (20.0ms) Inference, (6.0ms) NMS
video 1/4 (2/212) c:\Users\Isac\OneDrive - Universidad de Las Palmas de Gran Canaria\Cuarto\Semestre_1\40982-VisionPorComputador\Practicas\P7\videos\VID_20221201_152109.mp4: 1 Palm-Trees, Done. (17.0ms) Inference, (2.0ms) NMS
video 1/4 (3/212) c:\Users\Isac\OneDrive - Universidad

YOLOR  2022-12-2 torch 1.13.0 CUDA:0 (NVIDIA GeForce RTX 2060, 6143.5625MB)

  return _VF.meshgrid(tensors, **kwargs)  # type: ignore[attr-defined]
Model Summary: 314 layers, 36481772 parameters, 6194944 gradients, 103.2 GFLOPS


Por algún motivo desconocido, le da la vuelta a los vídeos así que toca volver a darles la vuelta. He usado esta entrada de [stackoverflow](https://stackoverflow.com/questions/67507275/rotate-video-180-with-opencv-python).

In [26]:
def flip_video(input_file_path, output_file_path):
    #that's my original video - the one that I want to rotate 180 degrees 
    cap = cv2.VideoCapture(input_file_path)
        
    frame_number = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))

    # Get width and height
    frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))

    # here I'm trying to write the new rotated video
    # Open the output video file before the loop, cv2.VideoWriter_fourcc(*"mp4v") = 0x7634706d
    newvideoR = cv2.VideoWriter(output_file_path, cv2.VideoWriter_fourcc(*"mp4v"), 24, (frame_width, frame_height))
        
    # Original Frames
    #frames = []
    for i in range(frame_number):
        ret, frame = cap.read()
        #frames.append(frame)  # No need to append the original frames

        #here's where I try to rotate the video 
        new = cv2.rotate(frame, cv2.ROTATE_180)
        
        #cv2.imshow('output', new)
        #if cv2.waitKey(1) & 0xFF == ord('q'):
        #    break

        newvideoR.write(new)

    newvideoR.release()
    cap.release()

In [27]:
for input_path in  glob.glob("runs\detect\exp4\*"):
    output_path = "Results\\Videos\\" + os.path.basename(input_path)
    flip_video(input_path, output_path)
    