# Descripción 
El objetivo de este notebook es la implementación de YOLO V4 adaptado al número de clases que sean necesarias. Para ello, lo único que se requiere es subir dos carpeta:
1.  Directorio de imágenes con etiquetas: Se trata de un directorio en el que existen imágenes y las etiquetas estan en formato YOLO, el nombre de las etiquetas y las imágenes deben ser el mismo, difiriendo únicamente en la extension.
2.  Directorio de imágenes sin etiquetas: Se trata de un directorio con únicamente imágenes, no deben existir objetos a detectar.

Por último se deben cambiar las rutas de 3 variables:
1.  `PATH_DATA`: Debe coincidir con la ruta donde se encuentre este notebook y los directorios descritos anteriormente.
2.  `PATH_ORIGINAL_DATASET_WITH_OBJ`: Debe ser PATH_DATA + `/nombre del directorio de imágenes con etiquetas`
3.  `PATH_ORIGINAL_DATASET_WITHOUT_OBJ`: Debe ser PATH_DATA + `/nombre del directorio de imágenes sin etiquetas`

NOTA: El directorio PATH_ORIGINAL_DATASET_WITH_OBJ debe de tener un archivo classes.txt dónde vengan anotadas las clases que se quieren detectar mediante YOLO. El resto de rutas no se deben tocar.

Esto es una implementación de YOLO_V4 adaptado a imágenes de espectrogramas de la red e-callisto. Para el etiquetado de las imágenes se ha utilizado [labelImg](https://github.com/tzutalin/labelImg), una herramienta de código abierto. Para poder utilizarla a continuación se dejan los pasos a realizar para instalar y configurar:

```
1.   Abrir Anaconda 3 Navigator, crear un nuevo entorno e instalar:
  *   pyqt
  *   lxml
2.   Abrir Anaconda 3 prompt, y  escribir los siguientes comandos:
  *   cd ruta_deseada_descarga_herramienta
  *   git clone https://github.com/tzutalin/labelImg
  *   cd labelImg-master
  *   pyrcc5 -o resources.py resources.qrc
  *   move resources.py, resources.qrc libs
3.   Estos pasos solo se deben hacer una vez, ahora cada vez que se quiera ejecutar, abrimos un Anaconda3 prompt en la ruta de la herramienta:
  *   python labelimg.py
```

Para generar un directorio con imágenes y etiquetas una vez abierto labelImg:
1. Click sobre Change save dir: Seleccionar el directorio en el que ya se encuentran las imagenes. En caso de no querer mezclarlos, hacer una copia de ese directorio con imagenes, pero al final deben estar en el mismo directorio las imágenes y las etiquetas.
2. Click sobre Open dir: Seleccionar el directorio dónde se encuentran las imagenes a etiquetar, debe ser el mismo sobre el que se guardarán las etiquetas, es decir, el seleccionado en el paso anterior.
3. Click sobre el botón debajo de save: Clickar hasta que aparezca YOLO, esto es el formato en el que deseamos guardar las etiquetas.

***NOTA sobre labelImg: Se debe borrar todo el contenido de data/predefined_classes.txt para que más adelante se empiece a enumerar las clases desde las que nosotros hemos ido definiendo.***


# 1-Imports y definición de rutas

In [None]:
# MANIPULACION DE DATOS
import numpy  as np
import pandas as pd
from numpy import save
from tqdm import tqdm


# MANEJO DE FICHEROS
import os
import shutil
from google.colab import drive

# EVALUACION DEL MODELO
from sklearn.metrics import classification_report, confusion_matrix, ConfusionMatrixDisplay, precision_score

# VISUALIZACION DE DATOS
import matplotlib.pyplot as plt
from matplotlib import cm

drive.mount('/content/drive')

# DEFINICION DE NUMERO DE CLASES Y SUS NOMBRES
def get_classes():
  with open(PATH_ORIGINAL_DATASET_WITH_OBJ + 'classes.txt', 'r') as classes:
    classes = classes.read().splitlines()
  return classes


# DEFINICION DE RUTAS
PATH_DATA                         = '/content/drive/MyDrive/E-Callisto/Yolo_automatico/'  # Ruta con el dir de trabajo
PATH_ORIGINAL_DATASET_WITH_OBJ    = PATH_DATA + 'Dataset_with_obj/'                       # Ruta donde se guardan los datos de imagenes y etiquetas originales con objetos
PATH_ORIGINAL_DATASET_WITHOUT_OBJ = PATH_DATA + 'Dataset_without_obj/'                    # Ruta donde se guardan los datos de imagenes y etiquetas originales sin objetos

PATH_IMGS_WITHOUT_OBJ             = PATH_DATA + 'imgs_without_objects/'                   # Ruta donde se guardan las imágenes sin objetos
PATH_LABELS_WITHOUT_OBJ           = PATH_DATA + 'labels_without_objects/'                 # Ruta donde se guardan las etiquetas sin objetos (etiquetas vacias necesarias para el entrenamiento)
PATH_IMGS_WITH_OBJ                = PATH_DATA + 'imgs_with_objects/'                      # Ruta donde se guardan las imágenes con objetos etiquetados en formato YOLO
PATH_LABELS_WITH_OBJ              = PATH_DATA + 'labels_with_objects/'                    # Ruta donde se guardan las etiquetas de los objetos

PATH_YOLO_DATASET                 = PATH_DATA + 'yolo_dataset/'                           # Ruta donde se guardara todo lo relativo a YOLO (dataset, resultados ...)
PATH_RESULTS                      = PATH_DATA + 'yolo_dataset/results/'                   # Ruta donde se guardaran las predicciones, la generación de imagenes con cajas y las métricas
CLASSES_NAMES                     = get_classes()                                         # Nombre de las clases
NUM_CLASSES                       = len(CLASSES_NAMES)                                    # Numero de clases



!nvidia-smi
print('PATH DATA:{}'.format(PATH_DATA))
print(CLASSES_NAMES)
print(os.listdir(PATH_DATA))

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Thu Jun 16 10:39:15 2022       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.32.03    Driver Version: 460.32.03    CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|   0  Tesla T4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   38C    P8     9W /  70W |      0MiB / 15109MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                       

# 2-Configuración del Dataset
En este punto se exponen todos los pasos necesarios para generar el conjunto de datos yolov4 a partir de etiquetas e imágenes.

##2.1-Mover el conjunto de datos original con objetos
En caso de que el conjunto de datos original tenga las imagenes dispersas en diferentes carpetas, se agrupan todas las imagenes sobre PATH_IMGS_WITH_OBJ con la misma extension (.jpg) independientemente de las extensiones iniciales, y las etiquetas sobre PATH_LABELS_WITH_OBJ

In [None]:
def extract_data_from_dir(path_dir, images):
  subdirs = [path_dir + dir + '/' for dir in os.listdir(path_dir) if os.path.isdir(path_dir + '/' + dir)]
  if len(subdirs) == 0:
    images = images + [path_dir + f for f in os.listdir(path_dir) if f.endswith('.jpg') or f.endswith('.png') or f.endswith('.jpeg')]
    # test_correspondence(images, labels)
  else:
    for subdir in subdirs:
      images = extract_data_from_dir(subdir, images)
  return images


def reformat_original_dataset(path_or_dataset, path_imgs_with_obj, path_labels_with_obj, change_name=0):
  images = []
  images = extract_data_from_dir(path_or_dataset, images)
  if os.path.isdir(path_imgs_with_obj):   shutil.rmtree(path_imgs_with_obj)
  if os.path.isdir(path_labels_with_obj): shutil.rmtree(path_labels_with_obj)
  os.makedirs(path_imgs_with_obj)
  os.makedirs(path_labels_with_obj)
  for i in tqdm(range(len(images)), desc='Moviendo los datos de la carpeta original {} a {} y {}'.format(path_or_dataset, path_imgs_with_obj, path_labels_with_obj)):
    fname = images[i].split('/')[-1].split('.')[0]
    if os.path.isfile(images[i].split('.')[0] + '.txt'): # Si existe la etiqueta para una determinada imagen
      if change_name:
        shutil.copy2(images[i],                        path_imgs_with_obj   + str(i) + '.jpg') # Movemos la imagen cambiando el nombre por   i.jpg
        shutil.copy2(images[i].split('.')[0] + '.txt', path_labels_with_obj + str(i) + '.txt') # Movemos la etiqueta cambiando el nombre por i.txt
      else:
        shutil.copy2(images[i],                        path_imgs_with_obj   + fname + '.jpg')  # Movemos la imagen manteniendo el nombre original
        shutil.copy2(images[i].split('.')[0] + '.txt', path_labels_with_obj + fname + '.txt')  # Movemos la etiqueta manteniendo el nombre original
  print(f"\nNum imagenes: {len(os.listdir(path_imgs_with_obj))} Num etiquetas: {len(os.listdir(path_labels_with_obj))}")


reformat_original_dataset(PATH_ORIGINAL_DATASET_WITH_OBJ, PATH_IMGS_WITH_OBJ, PATH_LABELS_WITH_OBJ, change_name=0)
print(os.listdir(PATH_DATA))

Moviendo los datos de la carpeta original /content/drive/MyDrive/E-Callisto/Yolo_automatico/Dataset_with_obj/ a /content/drive/MyDrive/E-Callisto/Yolo_automatico/imgs_with_objects/ y /content/drive/MyDrive/E-Callisto/Yolo_automatico/labels_with_objects/: 100%|██████████| 30/30 [00:00<00:00, 155.92it/s]


Num imagenes: 13 Num etiquetas: 13
['Dataset_with_obj', 'Dataset_without_obj', 'Yolo_automatico.ipynb', 'imgs_without_objects', 'labels_without_objects', 'imgs_with_objects', 'labels_with_objects']





##2.2-Mover el conjunto de datos original sin objetos y generar etiquetas vacías
En [darknet](https://github.com/AlexeyAB/darknet) se recomienda añadir imágenes sin objetos a detectar para un entrenamiento más efectivo.

Moveremos las imágenes del conjunto de datos de imágenes sin objetos a PATH_IMGS_WITHOUT_OBJ y generaremos y guardaremos ficheros .txt vacíos a forma de etiqueta en PATH_LABELS_WITHOUT_OBJ

In [None]:
def format_no_obj_dataset(path_original_dataset_without_obj, path_imgs_without_obj, path_labels_without_obj, change_name=0):
  if os.path.isdir(path_imgs_without_obj): shutil.rmtree(path_imgs_without_obj)
  os.makedirs(path_imgs_without_obj)
  if os.path.isdir(path_labels_without_obj): shutil.rmtree(path_labels_without_obj)
  os.makedirs(path_labels_without_obj)
  fnames = []
  fnames = extract_data_from_dir(path_original_dataset_without_obj, fnames)
  for i in tqdm(range(len(fnames)), desc='Moving and formating dataset without obj'):
    if change_name == 1:
      shutil.copy2(fnames[i], path_imgs_without_obj + str(i) + '.jpg')
      open(path_labels_without_obj + str(i) + '.txt', mode='w').close()
    else:
      fname = fnames[i].split('/')[-1].split('.')[0]
      shutil.copy2(fnames[i], path_imgs_without_obj +  fname + '.jpg')
      open(path_labels_without_obj + fname + '.txt', mode='w').close()

format_no_obj_dataset(PATH_ORIGINAL_DATASET_WITHOUT_OBJ, PATH_IMGS_WITHOUT_OBJ, PATH_LABELS_WITHOUT_OBJ)
print(os.listdir(PATH_DATA))

Moving and formating dataset without obj: 100%|██████████| 50/50 [00:44<00:00,  1.12it/s]

['Dataset_with_obj', 'Dataset_without_obj', 'Yolo_automatico.ipynb', 'imgs_with_objects', 'labels_with_objects', 'imgs_without_objects', 'labels_without_objects']





##2.3-Generar los ficheros necesarios para trabajar con darknet


1.   classes.names: En este archivo se deben apuntar los nombres de las clases del dataset, de esta forma cuando YOLO prediga la clase 0, reflejará el nombre de la primera línea de este fichero, por ejemplo, `I`.
2.   image_data.data: En este archivo se reflejan todos los datos necesarios para entrenar el modelo:
  *   classes = número de clases a detectar
  *   train = ruta hacia el fichero.txt que contiene en su interior la ruta hacia todas las imágenes que se quieren utilizar para entrenar el modelo
  *   valid = ruta hacia el fichero.txt que contiene en su interior la ruta hacia todas las imágenes que se quieren utilizar para validar el modelo
  *   names = ruta hacia el fichero classes.names explicado
  *   backup = ruta hacia el directorio en el que se guardarán los pesos durante el entrenamiento

In [None]:
def create_binary(objects_names, path_yolo_dataset):
  if not os.path.isdir(path_yolo_dataset): os.makedirs(path_yolo_dataset)
  print('Creating Binary')
  with open(path_yolo_dataset + 'classes.names', 'w') as names:
    for name in objects_names:
      names.write(name + '\n')

  with open(path_yolo_dataset + 'image_data.data', 'w') as data:
    # Number of classes to detect   
    data.write('classes = ' + str(len(objects_names)) + '\n')
    # Path to train.txt, file with all the paths of imgs that are going to be used for train
    data.write('train = ' + path_yolo_dataset +  'train.txt' + '\n')
    # Path to train.txt, file with all the paths of imgs that are going to be used for validate
    data.write('valid = ' + path_yolo_dataset +  'dev.txt'  +  '\n')
    # Path to classes.names, file with all the names of classes that are desired to detect
    data.write('names = ' + path_yolo_dataset + 'classes.names' + '\n')
    # Path to the desired path where weights are going to be saved
    data.write('backup = '+ path_yolo_dataset + 'backup' )
  with open(path_yolo_dataset + 'image_data.data', 'r') as data:
    plain_text = data.read()
    print('Binary content:\n', plain_text)
  if not os.path.isdir(path_yolo_dataset + 'backup/'): os.makedirs(path_yolo_dataset + 'backup/')

create_binary(CLASSES_NAMES, PATH_YOLO_DATASET)
print(os.listdir(PATH_DATA))

Creating Binary
Binary content:
 classes = 4
train = /content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/train.txt
valid = /content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/dev.txt
names = /content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/classes.names
backup = /content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/backup
['Dataset_with_obj', 'Dataset_without_obj', 'Yolo_automatico.ipynb', 'imgs_with_objects', 'labels_with_objects', 'imgs_without_objects', 'labels_without_objects', 'yolo_dataset']


##2.4-Generar conjunto de datos en formato YOLO


*   Para el entrenamiento de YOLO, dentro del archivo PATH_YOLO_DATASET/train.txt necesitamos introducir los datos de entrenamiento, que será la ruta de cada una de las imágenes que se quieren utilizar para entrenar, y además la etiqueta deberá de estar en el mismo directorio que la imagen, ya que se buscará el mismo nombre pero con extensión .txt para encontrar la etiqueta.
*   **Por ello, vamos a mover todas las imágenes y las etiquetas en formato YOLO al directorio YOLO_DATASET/data/** y de todas ellas **vamos a destinar el 75% a entrenar, el 10% siguiente a validar y el último 15% lo reservaremos para ver como se comporta el modelo** una vez finalizado el entrenamiento.
*   Por tanto, train.txt tendrá el 75% de rutas de imágenes, dev.txt el 10% y test.txt el 15% restante.


In [None]:
def generate_yolo_dataset_format(path_dest, path_imgs, path_labels, data_type, remove_dir=0):
  print('\n' + '='*50)
  path_dest     = path_dest + 'data/'
  if os.path.isdir(path_dest) and remove_dir:
    try:
      shutil.rmtree(path_dest)
      os.remove(path_dest[:-5] + 'train.txt')
      os.remove(path_dest[:-5] + 'dev.txt')
      os.remove(path_dest[:-5] + 'test.txt')
    except:
      pass
  if not os.path.isdir(path_dest): os.makedirs(path_dest)
  print('START: Number of files in dir: {}'.format(len(os.listdir(path_dest))))
  cont          = len(os.listdir(path_dest))//2
  data          = [f for f in os.listdir(path_labels) if not f.startswith('classes')]
  train_samples = data[:int(len(data)*0.75)]
  dev_samples   = data[int(len(data)*0.75):int(len(data)*0.85)]
  test_samples  = data[int(len(data)*0.85):]
  print('SPLIT {} > TRAIN|DEV|TEST {}-{}-{}-{}'.format(data_type, 0, int(len(data)*0.75), int(len(data)*0.85), len(data)))
  #75% data to train
  with open(path_dest[:-5] + 'train.txt', 'a') as f: # el -5 es para quitar el /data
    for fname in tqdm(train_samples, desc='Moving imgs and labels for train ' + data_type):
      # Movemos la imagen y etiqueta a yolo_dataset/data/
      shutil.copy2(path_imgs   + fname[:-4] + '.jpg', path_dest + fname[:-4] + '.jpg') # el -4 es para quitar la extension .png o .txt
      shutil.copy2(path_labels + fname[:-4] + '.txt', path_dest + fname[:-4] + '.txt')
      # REFLEJAMOS EN train.txt el fichero correspondiente (solo la imagen, la etiqueta no hay que apuntarla, ya que tiene el mismo nombre solo que con extension .txt)
      f.write(path_dest + fname[:-4] + '.jpg' + '\n')

  #10% data to dev
  with open(path_dest[:-5] + 'dev.txt', 'a') as f:
    for fname in tqdm(dev_samples, desc='Moving imgs and labels for dev ' + data_type):
      shutil.copy2(path_imgs   + fname[:-4] + '.jpg', path_dest + fname[:-4] + '.jpg')
      shutil.copy2(path_labels + fname[:-4] + '.txt', path_dest + fname[:-4] + '.txt')
      f.write(path_dest + fname[:-4] + '.jpg' + '\n')

  #15% data to test
  with open(path_dest[:-5] + 'test.txt', 'a') as f:
    for fname in tqdm(test_samples, desc='Moving imgs and labels for test ' + data_type):
      shutil.copy2(path_imgs   + fname[:-4] + '.jpg', path_dest + fname[:-4] + '.jpg')
      shutil.copy2(path_labels + fname[:-4] + '.txt', path_dest + fname[:-4] + '.txt')
      f.write(path_dest + fname[:-4] + '.jpg' + '\n')

  print('\nEND: Number of files in dir: {}'.format(len(os.listdir(path_dest))))
  print('='*50)


generate_yolo_dataset_format(PATH_YOLO_DATASET, PATH_IMGS_WITH_OBJ,    PATH_LABELS_WITH_OBJ,    data_type='with objects',    remove_dir=1)
generate_yolo_dataset_format(PATH_YOLO_DATASET, PATH_IMGS_WITHOUT_OBJ, PATH_LABELS_WITHOUT_OBJ, data_type='without objects', remove_dir=0) 

print(os.listdir(PATH_YOLO_DATASET))


START: Number of files in dir: 0
SPLIT with objects > TRAIN|DEV|TEST 0-9-11-13


Moving imgs and labels for train with objects: 100%|██████████| 9/9 [00:00<00:00, 43.81it/s]
Moving imgs and labels for dev with objects: 100%|██████████| 2/2 [00:00<00:00, 42.08it/s]
Moving imgs and labels for test with objects: 100%|██████████| 2/2 [00:00<00:00, 76.18it/s]



END: Number of files in dir: 26

START: Number of files in dir: 26
SPLIT without objects > TRAIN|DEV|TEST 0-37-42-50


Moving imgs and labels for train without objects: 100%|██████████| 37/37 [00:00<00:00, 81.16it/s]
Moving imgs and labels for dev without objects: 100%|██████████| 5/5 [00:00<00:00, 68.53it/s]
Moving imgs and labels for test without objects: 100%|██████████| 8/8 [00:00<00:00, 92.64it/s]


END: Number of files in dir: 126
['classes.names', 'image_data.data', 'backup', 'train.txt', 'dev.txt', 'test.txt', 'data']





In [None]:
imgs_with_objects = len(os.listdir(PATH_IMGS_WITH_OBJ))
lbls_with_objects = len(os.listdir(PATH_LABELS_WITH_OBJ))

imgs_without_objects = len(os.listdir(PATH_IMGS_WITHOUT_OBJ))
lbls_without_objects = len(os.listdir(PATH_LABELS_WITHOUT_OBJ))

print('imgs with objects: {} | labels with objects {} | imgs without objects {} | labels without objects {} \nTotal: {}, files in dir {}'.format(imgs_with_objects, lbls_with_objects, imgs_without_objects, lbls_without_objects,
                                                                                                                                (imgs_with_objects + lbls_with_objects + imgs_without_objects + lbls_without_objects), len(os.listdir(PATH_YOLO_DATASET + '/data/'))  ))

imgs with objects: 13 | labels with objects 13 | imgs without objects 50 | labels without objects 50 
Total: 126, files in dir 126


In [None]:
def mostrar_contenido_fichero(path_fichero):
  with open(path_fichero, 'rt') as f:
    print(f.readlines())


mostrar_contenido_fichero(PATH_YOLO_DATASET + 'train.txt')
mostrar_contenido_fichero(PATH_YOLO_DATASET + 'dev.txt')
mostrar_contenido_fichero(PATH_YOLO_DATASET + 'test.txt')

['/content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/data/AUSTRIA-Krumbach_20220101_033000_10.jpg\n', '/content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/data/AUSTRIA-Krumbach_20220101_034500_10.jpg\n', '/content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/data/AUSTRIA-Krumbach_20220101_040000_10.jpg\n', '/content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/data/AUSTRIA-Krumbach_20220101_043000_10.jpg\n', '/content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/data/AUSTRIA-Krumbach_20220101_044500_10.jpg\n', '/content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/data/AUSTRIA-Krumbach_20220101_050000_10.jpg\n', '/content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/data/AUSTRIA-Krumbach_20220101_051500_10.jpg\n', '/content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/data/AUSTRIA-Krumbach_20220101_053000_10.jpg\n', '/content/drive/MyDrive/E-Callisto/Yolo_automatico/yolo_dataset/data/AUSTRIA-Krumbach_20220101_

#3-Descarga y configuración del repositorio para ajustarlo sobre el conjunto de datos personalizado de una única clase
En este punto se exponen los pasos necesarios para descargar el repositorio que contiene YOLO V4, configurar el makefile, compilar el programa con make y crear los archivos .cfgs necesarios para entranar y después poder hacer predicciones sobre una única clase (solo queremos detectar las matrículas)
##**Esta configuración solo es necesaria ejecutarla una vez**

##3.1-Clonar el repositorio en la ruta deseada y configurar el makefile

In [None]:
os.chdir(PATH_DATA)
!git clone https://github.com/AlexeyAB/darknet
print('DIRS: ', os.listdir(PATH_DATA))
!sudo chmod +x darknet

Cloning into 'darknet'...
remote: Enumerating objects: 15424, done.[K
remote: Counting objects: 100% (1/1), done.[K
remote: Total 15424 (delta 0), reused 1 (delta 0), pack-reused 15423[K
Receiving objects: 100% (15424/15424), 14.05 MiB | 9.32 MiB/s, done.
Resolving deltas: 100% (10364/10364), done.
Checking out files: 100% (2050/2050), done.
DIRS:  ['Dataset_with_obj', 'Dataset_without_obj', 'Yolo_automatico.ipynb', 'imgs_with_objects', 'labels_with_objects', 'imgs_without_objects', 'labels_without_objects', 'yolo_dataset', 'darknet']


In [None]:
def configure_makefile(path_data):
  # Read the file and get the lines
  with open(PATH_DATA + 'darknet/Makefile', mode='rt') as makefile:
    data = makefile.readlines()
    print(data)
  # Change the value of desired parameters to speedup training using GPU
  data[0] = 'GPU=1\n'
  data[1] = 'CUDNN=1\n'
  data[3] = 'OPENCV=1\n'
  # Save the new file
  with open(PATH_DATA + 'darknet/Makefile', mode='wt') as makefile:
    makefile.writelines(data)

configure_makefile(PATH_DATA)

['GPU=0\n', 'CUDNN=0\n', 'CUDNN_HALF=0\n', 'OPENCV=0\n', 'AVX=0\n', 'OPENMP=0\n', 'LIBSO=0\n', 'ZED_CAMERA=0\n', 'ZED_CAMERA_v2_8=0\n', '\n', '# set GPU=1 and CUDNN=1 to speedup on GPU\n', '# set CUDNN_HALF=1 to further speedup 3 x times (Mixed-precision on Tensor Cores) GPU: Volta, Xavier, Turing and higher\n', '# set AVX=1 and OPENMP=1 to speedup on CPU (if error occurs then set AVX=0)\n', '# set ZED_CAMERA=1 to enable ZED SDK 3.0 and above\n', '# set ZED_CAMERA_v2_8=1 to enable ZED SDK 2.X\n', '\n', 'USE_CPP=0\n', 'DEBUG=0\n', '\n', 'ARCH= -gencode arch=compute_35,code=sm_35 \\\n', '      -gencode arch=compute_50,code=[sm_50,compute_50] \\\n', '      -gencode arch=compute_52,code=[sm_52,compute_52] \\\n', '\t    -gencode arch=compute_61,code=[sm_61,compute_61]\n', '\n', 'OS := $(shell uname)\n', '\n', '# GeForce RTX 3070, 3080, 3090\n', '# ARCH= -gencode arch=compute_86,code=[sm_86,compute_86]\n', '\n', '# Kepler GeForce GTX 770, GTX 760, GT 740\n', '# ARCH= -gencode arch=compute_30

##3.2-Compilar con la nueva configuración y verificar la instalación

In [None]:
os.chdir(PATH_DATA + 'darknet')
!make
!./darknet

mkdir -p ./obj/
mkdir -p backup
chmod +x *.sh
g++ -std=c++11 -std=c++11 -Iinclude/ -I3rdparty/stb/include -DOPENCV `pkg-config --cflags opencv4 2> /dev/null || pkg-config --cflags opencv` -DGPU -I/usr/local/cuda/include/ -DCUDNN -Wall -Wfatal-errors -Wno-unused-result -Wno-unknown-pragmas -fPIC -Ofast -DOPENCV -DGPU -DCUDNN -I/usr/local/cudnn/include -c ./src/image_opencv.cpp -o obj/image_opencv.o
[01m[K./src/image_opencv.cpp:[m[K In function ‘[01m[Kvoid draw_detections_cv_v3(void**, detection*, int, float, char**, image**, int, int)[m[K’:
                 float [01;35m[Krgb[m[K[3];
                       [01;35m[K^~~[m[K
[01m[K./src/image_opencv.cpp:[m[K In function ‘[01m[Kvoid draw_train_loss(char*, void**, int, float, float, int, int, float, int, char*, float, int, int, double)[m[K’:
             [01;35m[Kif[m[K (iteration_old == 0)
             [01;35m[K^~[m[K
[01m[K./src/image_opencv.cpp:1150:10:[m[K [01;36m[Knote: [m[K...this statement, but

## 3.3-Descarga de los pesos de YOLO_V4 para utilizarlos como pesos iniciales a aplicar durante el entrenamiento, lo que aumentará MAP sobre nuestro conjunto de datos

In [None]:
os.chdir(PATH_DATA + 'darknet')
!wget https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.conv.137

--2022-06-16 10:38:07--  https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.conv.137
Resolving github.com (github.com)... 20.205.243.166
Connecting to github.com (github.com)|20.205.243.166|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://objects.githubusercontent.com/github-production-release-asset-2e65be/75388965/48bfe500-889d-11ea-819e-c4d182fcf0db?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAIWNJYAX4CSVEH53A%2F20220616%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20220616T103807Z&X-Amz-Expires=300&X-Amz-Signature=7eeec6455f564896c555a0fd80ecf76f035b46b0598e70727ffc2d6d731328bf&X-Amz-SignedHeaders=host&actor_id=0&key_id=0&repo_id=75388965&response-content-disposition=attachment%3B%20filename%3Dyolov4.conv.137&response-content-type=application%2Foctet-stream [following]
--2022-06-16 10:38:07--  https://objects.githubusercontent.com/github-production-release-asset-2e65be/75388965/48bfe500-889d-11ea-819e-c4d

## 3.4-Configurar yolo_train.cfg y yolo_test.cfg
Como vamos a utilizar menos clases que el conjunto de datos COCO que se utilizó originalmente para entrenar a YOLO_V4, se harán las siguientes modificaciones recomendadas en el propio repositorio:


1. Subdivisiones = 16
2. max_batches = NUM_CLASSES * 2000
3. num_steps = 0,8 * max_batches, 0,9 * max_batches
4. capas_yolo = num_classes = NUM_CLASSES
5. capa_convolucional_anterior_a_yolo = filtros = (NUM_CLASSES + 5) * B, donde B = 3 y se refiere al número de cajas que se calculan para cada característica de la convolución.

yolo_test.cfg es una copia de yolo_train.cfg, sólo que los lotes y la subdivisión se quedan en 1.

In [None]:
def configure_cfg_files(num_classes):
  """
  Create yolov4_train.cfg and yolov4_test.cfg files based on number of classes
  """
  with open(PATH_DATA + 'darknet/cfg/yolov4.cfg', mode='rt') as yolo_cfg:
    data = yolo_cfg.readlines()
    print('Original YOLO V4 cfg: \n', data)
  # Change the value of desired parameters
  max_batches  = (num_classes * 2000)
  filters      = (num_classes + 5) * 3 # filtros = (NUM_CLASSES + 5) * B
  data_filters = 'filters=' + str(filters) + '\n'
  data_classes = 'classes=' + str(num_classes) + '\n'
  # Train cfg configuration
  data[1]    = 'batch=32' + '\n'
  data[2]    = 'subdivisions=16' + '\n'
  data[18]   = 'max_batches=' + str(max_batches) + '\n'
  data[20]   = 'steps=' + str(int(0.8 * max_batches)) + ', ' + str(int(0.9 * max_batches)) + '\n'
  data[960]  = data_filters
  data[967]  = data_classes
  data[1048] = data_filters
  data[1055] = data_classes
  data[1136] = data_filters
  data[1143] = data_classes
  print('Train YOLO V4 cfg: \n', data)

  with open(PATH_DATA + 'darknet/cfg/yolov4_train.cfg', mode='wt') as yolo_cfg:
    yolo_cfg.writelines(data)
  
  # Test cfg configuration
  data[1] = 'batch=1' + '\n'
  data[2] = 'subdivisions=1' + '\n'
  data[3] = '# Test\n'
  print('Test YOLO V4 cfg: \n', data)

  with open(PATH_DATA + 'darknet/cfg/yolov4_test.cfg', mode='wt') as yolo_cfg:
    yolo_cfg.writelines(data)


configure_cfg_files(NUM_CLASSES)

Original YOLO V4 cfg: 
 ['[net]\n', 'batch=64\n', 'subdivisions=8\n', '# Training\n', '#width=512\n', '#height=512\n', 'width=608\n', 'height=608\n', 'channels=3\n', 'momentum=0.949\n', 'decay=0.0005\n', 'angle=0\n', 'saturation = 1.5\n', 'exposure = 1.5\n', 'hue=.1\n', '\n', 'learning_rate=0.0013\n', 'burn_in=1000\n', 'max_batches = 500500\n', 'policy=steps\n', 'steps=400000,450000\n', 'scales=.1,.1\n', '\n', '#cutmix=1\n', 'mosaic=1\n', '\n', '#:104x104 54:52x52 85:26x26 104:13x13 for 416\n', '\n', '[convolutional]\n', 'batch_normalize=1\n', 'filters=32\n', 'size=3\n', 'stride=1\n', 'pad=1\n', 'activation=mish\n', '\n', '# Downsample\n', '\n', '[convolutional]\n', 'batch_normalize=1\n', 'filters=64\n', 'size=3\n', 'stride=2\n', 'pad=1\n', 'activation=mish\n', '\n', '[convolutional]\n', 'batch_normalize=1\n', 'filters=64\n', 'size=1\n', 'stride=1\n', 'pad=1\n', 'activation=mish\n', '\n', '[route]\n', 'layers = -2\n', '\n', '[convolutional]\n', 'batch_normalize=1\n', 'filters=64\n', 's

#4-Entrenamiento YOLO V4

##4.1-Mover al directorio y dar permisos de ejecución

In [None]:
os.chdir(PATH_DATA + 'darknet')
!sudo chmod +x darknet
!./darknet

usage: ./darknet <function>


##4.2-Entrenamiento
**descripción del comando:** !./darknet detector train PATH_TO_.data file PATH_TO_yolov4_train.cfg PATH_TO_weights -dont_show -map

**-donwt_show** es para desactivar Loss-Window, ya que las ventanas en los notebooks son difíciles de manejar. Tendremos un gráfico de la evolución del entrenamiento en darknet/chart.png

**-map** es para calcular la precisión media para el conjunto de validación, se calcula por primera vez en la iteración 1000 y 1 vez cada 100 iteraciones después

In [None]:
!./darknet detector train ../yolo_dataset/image_data.data cfg/yolov4_train.cfg yolov4.conv.137 -dont_show -map

 CUDA-version: 11010 (11020), cuDNN: 7.6.5, GPU count: 1  
 OpenCV version: 3.2.0
 Prepare additional network for mAP calculation...
 0 : compute_capability = 750, cudnn_half = 0, GPU: Tesla T4 
net.optimized_memory = 0 
mini_batch = 1, batch = 16, time_steps = 1, train = 0 
   layer   filters  size/strd(dil)      input                output
   0 Create CUDA-stream - 0 
 Create cudnn-handle 0 
conv     32       3 x 3/ 1    608 x 608 x   3 ->  608 x 608 x  32 0.639 BF
   1 conv     64       3 x 3/ 2    608 x 608 x  32 ->  304 x 304 x  64 3.407 BF
   2 conv     64       1 x 1/ 1    304 x 304 x  64 ->  304 x 304 x  64 0.757 BF
   3 route  1 		                           ->  304 x 304 x  64 
   4 conv     64       1 x 1/ 1    304 x 304 x  64 ->  304 x 304 x  64 0.757 BF
   5 conv     32       1 x 1/ 1    304 x 304 x  64 ->  304 x 304 x  32 0.379 BF
   6 conv     64       3 x 3/ 1    304 x 304 x  32 ->  304 x 304 x  64 3.407 BF
   7 Shortcut Layer: 4,  wt = 0, wn = 0, outputs: 304 x 304 x  6

#5-Realizar predicciones con el modelo entrenado

##5.1-Predecir una única imagen

In [None]:
def imShow(path):
  import cv2
  import matplotlib.pyplot as plt
  %matplotlib inline
  image = cv2.imread(path)
  height, width = image.shape[:2]
  resized_image = cv2.resize(image,(3*width, 3*height), interpolation = cv2.INTER_CUBIC)
  fig = plt.gcf()
  fig.set_size_inches(18, 10)
  plt.axis('off')
  plt.imshow(cv2.cvtColor(resized_image, cv2.COLOR_BGR2RGB))
  plt.show()


if not os.path.isdir(PATH_YOLO_DATASET + '/results'): os.makedirs(PATH_YOLO_DATASET + '/results')
os.chdir(PATH_DATA + 'darknet')
!sudo chmod +x darknet
!./darknet detector test ../yolo_dataset/image_data.data cfg/yolov4_test.cfg ../yolo_dataset/backup/yolov4_train_best.weights ../yolo_dataset/ejemplo/ejemplo.jpg -thresh 0.5 -dont_show -ext_output > ../yolo_dataset/results/probador.txt
# !./darknet detector test ../yolo_dataset/image_data.data cfg/yolov4_test.cfg yolov4.conv.137 ../yolo_dataset/data/0.jpg -thresh 0.8 -dont_show -ext_output > ../yolo_dataset/results/probador.txt
imShow('predictions.jpg')

 CUDA-version: 11010 (11020), cuDNN: 7.6.5, GPU count: 1  
 OpenCV version: 3.2.0
 0 : compute_capability = 750, cudnn_half = 0, GPU: Tesla T4 
   layer   filters  size/strd(dil)      input                output
   0 conv     32       3 x 3/ 1    608 x 608 x   3 ->  608 x 608 x  32 0.639 BF
   1 conv     64       3 x 3/ 2    608 x 608 x  32 ->  304 x 304 x  64 3.407 BF
   2 conv     64       1 x 1/ 1    304 x 304 x  64 ->  304 x 304 x  64 0.757 BF
   3 route  1 		                           ->  304 x 304 x  64 
   4 conv     64       1 x 1/ 1    304 x 304 x  64 ->  304 x 304 x  64 0.757 BF
   5 conv     32       1 x 1/ 1    304 x 304 x  64 ->  304 x 304 x  32 0.379 BF
   6 conv     64       3 x 3/ 1    304 x 304 x  32 ->  304 x 304 x  64 3.407 BF
   7 Shortcut Layer: 4,  wt = 0, wn = 0, outputs: 304 x 304 x  64 0.006 BF
   8 conv     64       1 x 1/ 1    304 x 304 x  64 ->  304 x 304 x  64 0.757 BF
   9 route  8 2 	                           ->  304 x 304 x 128 
  10 conv     64       1

AttributeError: ignored

##5.2-Predecir múltiples imágenes guardadas sus rutas en un fichero

###5.2.1-Generar fichero con rutas en base a un directorio con imágenes
Se puede usar el archivo test.txt sin necesidad de usar esta celda para predecir el 15% de imágenes que se reservaron anteriormente para el conjunto de test.

Sin embargo, en caso de subir imagenes a un nuevo directorio y querer predecir estas imágenes, es posible generar el fichero.txt necesario mediante esta celda.

Solo se debe especificar la ruta del directorio con las imagenes en la variable `img_dir` y el destino de ese fichero en la variable `dest`

In [None]:
def generate_txt_file(img_dir, dest):
  fnames = [img_dir + f for f in os.listdir(img_dir)]
  with open(dest, 'w') as f:
    for fname in fnames:
      f.write(fname + '\n')

img_dir = PATH_YOLO_DATASET + 'tests/' + 'ejemplos'
dest    = PATH_YOLO_DATASET + 'tests/' + 'ejemplo.txt'
generate_txt_file(img_dir, dest)

###5.2.2-Realizar predicciones sobre las imagenes guardadas en el fichero
Solo se debe cambiar el nombre del fichero origen (el que tiene apuntadas las rutas de las imagenes a predecir) `../yolo_dataset/test.txt` y el destino del fichero sobre el que serán volcadas las predicciones realizadas `../yolo_dataset/results/test.txt`

In [None]:
!./darknet detector test ../yolo_dataset/image_data.data cfg/yolov4_test.cfg ../yolo_dataset/backup/yolov4_train_best.weights -thresh 0.9 -dont_show -ext_output -save_labels < ../yolo_dataset/test.txt > ../yolo_dataset/results/test.txt

#6-Generar información en base a predicciones

##6.1-Crear imágenes con cajas en base al fichero de predicciones

Se deben especificar las variables:

`yolo_prediction_file` = Ruta donde se encuentra el fichero de predicciones ya creado por YOLO

`dir_original_imgs`    = Ruta del directorio donde se encuentran las imagenes originales que se quieren utilizar para crear unas nuevas con las predicciones dibujadas sobre ellas.

`dir_imgs_with_boxes`  = Ruta del directorio donde se quieren almacenar las imagenes con las predicciones dibujadas

In [None]:
import os
import shutil
import re
from tqdm import tqdm
import cv2
import matplotlib.pyplot as plt
import matplotlib
# matplotlib.use('Agg')


def coordinates_on_bounds(coordinate, width_image, height_image, is_label=0):
    """
    This function makes coordinates to stay on bounds
    """
    x, y = coordinate
    x    = 0 if x < 0 else x
    x    = width_image if x > width_image else x
    y    = 0 if y < 0 else y
    y    = height_image if y > height_image else y
    if is_label and y == 0:
        y = y + 15
    return (x, y)


def draw_text_with_background(img, text,
          font=cv2.FONT_HERSHEY_PLAIN,
          pos=(0, 0),
          font_scale=1,
          font_thickness=1,
          text_color=(0, 255, 0),
          text_color_bg=(0, 0, 0)
          ):

    x, y = pos
    text_size, _ = cv2.getTextSize(text, font, font_scale, font_thickness)
    text_w, text_h = text_size
    cv2.rectangle(img, pos, (x + text_w, y + text_h), text_color_bg, -1)
    cv2.putText(img, text, (x, y + text_h + font_scale - 1), font, font_scale, text_color, font_thickness)

    # return text_size


def generate_img_with_boxes(boxes_coordinates, dir_original_imgs, path_dest_imgs_with_boxes, fname, burst_type):
    if not os.path.isdir(path_dest_imgs_with_boxes + 'bursts/' + burst_type): os.makedirs(path_dest_imgs_with_boxes + 'bursts/' + burst_type)

    img = cv2.imread(dir_original_imgs + fname)
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    height, width = img.shape[:-1]
    for box in boxes_coordinates:
        burst_type      = box.split(' ')[0]
        c, l, t, r, b   = map(int, box.split(' ')[1:]) # confidence, left, top, right, bottom
        point_1         = coordinates_on_bounds((l, t), width, height)
        point_2         = coordinates_on_bounds((r, b), width, height)
        label_pos       = coordinates_on_bounds((l, t-10), width, height, is_label=1)
        # Draw the rectangle to remark the object detected
        img             = cv2.rectangle(img, (point_1), (point_2), (0, 255, 0), 1)
        # Draw the text description of the object detected with background to visualize it better
        draw_text_with_background(img, burst_type + '-' + str(c) + '%', pos=(label_pos))
        # cv2.putText(img, str(c) + '%', (label_pos), cv2.FONT_HERSHEY_SIMPLEX, 0.4, (36,255,12), 1)
    plt.imshow(img)
    plt.axis('off')
    plt.savefig(path_dest_imgs_with_boxes + 'bursts/' + burst_type + '/' + fname, bbox_inches='tight', pad_inches=0.0, dpi=150)



def obtain_boxes(lines, classes_names):
    """
    INITIAL FORMAT
    Burst: 24%	(left_x:  148   top_y:  -25   width:   37   height:  351)
    RECTANGLE FORMAT
                  IMG  PUNTO_1   PUNTO_2   COLOR      ANCHO_RECTANGULO
    cv2.rectangle(img, (x1, y1), (x2, y2), (255,0,0), 2)
    RETURN FORMAT
    ['CONFIDENCE LEFT TOP (LEFT + WIDTH) (TOP + HEIGHT)', 'CONFIDENCE LEFT TOP (LEFT + WIDTH) (TOP + HEIGHT)', ...]
    """
    boxes = []

    clear_lines      = []
    next_line_is_box = True
    next_line        = 1
    while next_line_is_box:
        clear_lines.append(lines[next_line])
        next_line        = next_line + 1
        next_line_is_box = lines[next_line].startswith(tuple(classes_names))
    for line in clear_lines:
        line_aux = [ele for ele in line.split(' ') if ele!='']
        print('\n', line_aux)
        print(line_aux[1].split())
        burst_type = line.split(' ')[0]
        confidence = line_aux[1].split()[0][:-1]
        left       = int(line_aux[2])
        top        = int(line_aux[4])
        width      = int(line_aux[6])
        height     = int(line_aux[8][:-1])
        box        = burst_type + ' ' + str(confidence) + ' ' + str(left) + ' ' + str(top) + ' ' + str(left + width) + ' ' + str(top + height) + '\n'
        boxes.append(box)
    return boxes


def generate_imgs_from_pred_file(yolo_prediction_file, dir_original_imgs, init_path_files, path_dest_imgs_with_boxes, classes_names, new_execution=0):
    if os.path.isdir(path_dest_imgs_with_boxes):
      if new_execution: shutil.rmtree(path_dest_imgs_with_boxes)
    else:
      os.makedirs(path_dest_imgs_with_boxes + 'no_bursts/')
    

    with open(yolo_prediction_file, 'r') as nasty_file:
        lines = nasty_file.read().splitlines()
        for i in tqdm(range(len(lines)), desc='Generating jpgs from YOLO_V4 predictions file '):
            if lines[i].startswith(init_path_files):
                fname = lines[i].split('/')[-1].split('.')[0]
                if lines[i+1].startswith(tuple(classes_names)):
                    boxes = obtain_boxes(lines[i:]) # This transform to rectangle opencv coordinates
                    generate_img_with_boxes(boxes, dir_original_imgs, path_dest_imgs_with_boxes, fname, lines[i+1].split(' ')[0])
                
                # This is only for move normal data, only SB data is desired, so we generate less images
                else:
                    try:
                        shutil.copy2(dir_original_imgs + fname, path_dest_imgs_with_boxes + 'no_bursts/')
                    except Exception as e:
                        print(e)
    print(f"\nFiles in {path_dest_imgs_with_boxes + 'bursts/'}: {len(os.listdir(path_dest_imgs_with_boxes + 'bursts/'))} | Files in {path_dest_imgs_with_boxes + 'no_bursts/'}: {len(os.listdir(path_dest_imgs_with_boxes + 'no_bursts/'))}")




yolo_prediction_file = PATH_RESULTS + 'test.txt'
dir_original_imgs    = PATH_YOLO_DATASET + 'data/'
init_path_files      = dir_original_imgs
dir_imgs_with_boxes  = PATH_RESULTS + 'imgs_with_boxes_test/'


generate_imgs_from_pred_file(yolo_prediction_file, dir_original_imgs, init_path_files, dir_imgs_with_boxes, CLASSES_NAMES, new_execution=1)

Generating jpgs from YOLO_V4 predictions file :   0%|          | 0/1683 [00:00<?, ?it/s]


 ['license_plate:', '98%\t(left_x:', '223', 'top_y:', '171', 'width:', '97', 'height:', '27)']
['98%', '(left_x:']


Generating jpgs from YOLO_V4 predictions file :   1%|          | 13/1683 [00:01<03:40,  7.58it/s]


 ['license_plate:', '91%\t(left_x:', '347', 'top_y:', '448', 'width:', '276', 'height:', '81)']
['91%', '(left_x:']


Generating jpgs from YOLO_V4 predictions file :   1%|          | 17/1683 [00:03<06:12,  4.48it/s]


KeyboardInterrupt: ignored

##6.2-Generar reporte en base al fichero de predicciones

In [None]:
from tqdm import tqdm
import numpy as np
import cv2
import re
from datetime import datetime, timedelta

def get_img_width(fname):
  img = cv2.imread(fname)
  return img.shape[0]


def get_datetime_from_fname(fname):
  'Extrat file date time from file name'
  data     = fname.split('_')
  station  = data[0]
  date_pos = 1
  time_pos = 2
  # FILE DATE
  file_year  = int(data[date_pos][:4])
  file_month = int(data[date_pos][4:6])
  file_day   = int(data[date_pos][6:])
  # FILE TIME
  file_hour  = int(data[time_pos][:2])
  file_mins  = int(data[time_pos][2:4])
  file_sec   = int(data[time_pos][4:])

  # FILE DATETIME
  file_date_time = datetime(file_year, file_month, file_day, file_hour, file_mins, file_sec)

  return file_date_time




def obtain_times_from_lines(lines, width_img, fname, bursts_dates, bursts_times, stations, classes_names):
    """
    INITIAL FORMAT
    Burst: 24%	(left_x:  148   top_y:  -25   width:   37   height:  351)
    return: [HH:MM-HH:MM, HH:MM-HH:MM, ...]
    fname: ALASKA-ANCHORAGE_20220331_183024_01_IV
    """
    next_line_is_burst = True
    next_line          = 1
    while next_line_is_burst:
      # Update condition to break while
      next_line          = next_line + 1
      next_line_is_burst = lines[next_line].startswith((tuple(classes_names))
      # Get data from line
      current_line = lines[next_line - 1]
      line_aux = [ele for ele in current_line.split(' ') if ele!='']
      print('\n', line_aux)
      print(line_aux[1].split())
      confidence = line_aux[1].split()[0][:-1]
      left       = int(line_aux[2])
      top        = int(line_aux[4])
      width      = int(line_aux[6])
      height     = int(line_aux[8][:-1])
      box        = str(confidence) + ' ' + str(left) + ' ' + str(top) + ' ' + str(left + width) + ' ' + str(top + height) + '\n'
      boxes.append(box)
      right        = left + width
      # Format data to get start and end of bursts
      time_start = left/width_img * 15#left/width = [0-1], [0-1] * 15 = pos temporal
      time_end   = right/width_img * 15

      if time_start < 0: time_start = 0 
      if time_end > 15:  time_end   = 15 
      # Create datetime from file name
      file_datetime = get_datetime_from_fname(fname)
      # Get datetimes sbs
      sb_start = file_datetime + timedelta(minutes=time_start)
      sb_end   = file_datetime + timedelta(minutes=time_end)
      
      # Get dates sbs
      sb_start_year  = str(sb_start.year)
      sb_start_month = '0' + str(sb_start.month) if sb_start.month < 10 else str(sb_start.month)
      sb_start_day   = '0' + str(sb_start.day)   if sb_start.day   < 10 else str(sb_start.day)
      sb_start_date  = sb_start_year + sb_start_month + sb_start_day

      sb_end_year    = str(sb_end.year)
      sb_end_month   = '0' + str(sb_end.month) if sb_end.month < 10 else str(sb_end.month)
      sb_end_day     = '0' + str(sb_end.day)   if sb_end.day   < 10 else str(sb_end.day)
      sb_end_date    = sb_end_year + sb_end_month + sb_end_day
      
      # Get times sbs
      sb_start_hour   = '0' + str(sb_start.hour)   if sb_start.hour   < 10 else str(sb_start.hour)
      sb_start_minute = '0' + str(sb_start.minute) if sb_start.minute < 10 else str(sb_start.minute)
      sb_start_time   = sb_start_hour + ':' + sb_start_minute
      sb_end_hour     = '0' + str(sb_end.hour)     if sb_end.hour     < 10 else str(sb_end.hour)
      sb_end_minute   = '0' + str(sb_end.minute)   if sb_end.minute   < 10 else str(sb_end.minute)
      sb_end_time     = sb_end_hour + ':' + sb_end_minute

      # station name
      station = fname.split('/')[-1].split('_')[0]

      if sb_start_date == sb_end_date:
        bursts_times.append(sb_start_time + '-' + sb_end_time)
        bursts_dates.append(sb_start_date)
        stations.append(station)

      else:
        bursts_times.append(sb_start_time + '-23:59')
        bursts_dates.append(sb_start_date)
        stations.append(station)

        bursts_times.append('00:00-' + sb_end_time)
        bursts_dates.append(sb_end_date)
        stations.append(station)

    return bursts_dates, bursts_times, stations

def generate_report_from_prediction_file(yolo_prediction_file, path_save_report, classes_names, img_width=0):
  # col_0, col_1, col_2, col_3 = 0, 16, 32, 40
  col_0, col_1, col_2 = 16, 16, 8
  bursts_times = []
  stations     = []
  bursts_dates = []
  report_name  = path_save_report + 'general_report.txt'
  if os.path.isfile(report_name): os.remove(report_name)

  # OBTAIN LIST OF DATETIMES AND ANOTHER ONE WITH LINKED STATION TO THE SB DETECTED
  with open(yolo_prediction_file, 'r') as nasty_file:
    lines = nasty_file.read().splitlines()
    for i in tqdm(range(len(lines)), desc='Parsing file to generate report '):
      if lines[i].startswith(init_path_files):
        fname = init_path_files + lines[i].split('/')[-1].split('.')[0] + '.jpg'
        if lines[i+1].startswith((tuple(classes_names)):
          # Obtain start and ends bursts
          if img_width == 0:
            img_width = get_img_width(fname)
          bursts_dates, bursts_times, stations = obtain_times_from_lines(lines[i:], img_width, fname, bursts_dates, bursts_times, stations)
  # Convert list to np
  bursts_datetimes = np.array([bursts_dates[i] + bursts_times[i] for i in range(len(bursts_dates))])
  bursts_dates     = np.array(bursts_dates)
  bursts_times     = np.array(bursts_times)
  stations         = np.array(stations)
  unique_bursts_datetimes = np.unique(bursts_datetimes)
  # WRITE REPORT
  with open(report_name, mode='w') as report:
    # WRITE HEADER
    report.write(f'{"#Date": <{col_0}} {"Time": <{col_1}} {"Type": <{col_2}} Stations\n')
    report.write('#-------------------------------------------------------------------------------\n')
    # WRITE GROUPED DATA
    for burst_datetime in tqdm(unique_bursts_datetimes, desc='Generating report'):
      indexes         = np.array(np.where(bursts_datetimes == burst_datetime)[0])
      current_staions = (', ').join(np.unique(stations[indexes]))
      ##              Date                                 Time                                 Type            Stations
      report.write(f'{str(bursts_dates[indexes[0]]): <{col_0}} {str(bursts_times[indexes[0]]): <{col_1}} {"?": <{col_2}} {current_staions}\n')


init_path_files      =            # Directorio donde se encontraban originalmente las imagenes en el momento de realizar las predicciones
w, h                 = (496, 369) # Ancho y alto de las imagenes estandarizadas, en caso de no conocerse o no haberse estandarizado, poner un 0, se abrira la imagen y se obtendra su ancho, esto hara que sea mas lento la generacion del reporte
PATH_RESULTS         = 'results/' # directorio donde se quieren guardar los resultados
yolo_prediction_file = 'yolo_predictions_files/pred_all_stations.txt'
generate_report_from_prediction_file(yolo_prediction_file, PATH_RESULTS, img_wdith=w)