<a href="https://colab.research.google.com/github/al34n1x/DataScience/blob/master/8.Machine_Learning/descriptores/6.object_detection.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Implementación de modelo predictor para detección de objetos:

La siguiente implementación utiliza librerías como `OpenCV` y `Tensorflow` para la detección de objetos basado en imágenes.
Los requisitos y settings debajo descriptos aplican principalmente para poder ser ejecutados en un ambiente de `Google Colab`. Si se desea correrlo de forma local utilizando `Jupyter Notebook`, se recomienda realizar las configuraciones e instalaciones de paquetes dentro de un virtual environment o `Conda Environments` (https://conda.io/projects/conda/en/latest/user-guide/concepts/environments.html)

Fuente Implementación: https://github.com/ZaheedaT/computer-vision-flaskapp


In [14]:
import warnings
warnings.filterwarnings('ignore')

In [None]:
!pip install cvlib
!pip install h5py
!pip install typing-extensions
!pip install wheel
!pip install imageai
!pip install tensorflow

In [7]:
import datetime
import os
import json
import numpy as np
import cv2
import cvlib as cv
from cvlib.object_detection import draw_bbox
from imageai.Detection import VideoObjectDetection
from bson import json_util
import tensorflow as tf

In [4]:
def detect_and_draw_box(img_filepath, img_output, model="yolo.h5", confidence=0.5):

  img = cv2.imread(img_filepath)
  bbox, label, conf = cv.detect_common_objects(img, confidence=confidence, model=model)
  output_image = draw_bbox(img, bbox, label, conf) 
  output_image_path = os.path.join(img_output, 'output_image.jpg')
  cv2.imwrite(output_image_path, output_image)

  response = write_response(bbox, label, conf, width = img.shape[1], height= img.shape[0])
  write_json(img_output, "out_response.json", data=response)
  #add_data(response)
  filetype = 'image'
  
  return output_image_path, response, filetype

- **img = cv2.imread(img_filepath)**: OpenCV lee la imagen en una matriz numpy para que nuestro modelo la entienda.
- **bbox, label, conf = cv.detect_common_objects(img,confidence, model)**: detect_common_objects utiliza un preentrenado para detectar 80 objetos comunes.
Devuelve las coordenadas del cuadro delimitador (un cuadro alrededor de un objeto detectado), las etiquetas predichas correspondientes y las puntuaciones de confianza para los objetos detectados en la imagen.
- **output_image = draw_bbox(img, bbox, label, conf)**: luego dibujamos los cuadros y las etiquetas en la imagen para obtener una imagen de salida.
- **output_image_path = os.path.join(img_output, 'output_image.jpg')**: Declaramos el nombre de salida de la imagen y la ruta donde se debe guardar.
- **cv2.imwrite(output_image_path, output_image)**: que se utiliza para guardar una imagen en cualquier dispositivo o ruta de almacenamiento.

In [2]:
def write_response(bbox, label, conf,width, height):

    response= dict()
    response['Bounding Box Coordinates'] = bbox
    response['Object Class'] = label
    response['Confidence'] = conf
    now = datetime.datetime.now()
    timestamp = str(now.strftime("%Y-%m-%d_%H:%M:%S"))
    response['Timestamp'] = timestamp
    response['Image Metadata'] = {'width': width, 'height': height}

    return response

In [3]:
def write_json(target_path, target_file, data):

    with open(os.path.join(target_path, target_file), 'w') as f:
        json.dump(data, f)

In [None]:
INPUT_FOLDER = os.path.join('images', 'input', 'photographer.png')
OUTPUT_FOLDER = os.path.join('images', 'output')

output_image_path, response, filetype = detect_and_draw_box(INPUT_FOLDER, OUTPUT_FOLDER)

In [10]:
INPUT_FOLDER = os.path.join('images', 'input', 'car_pedestrian.png')
OUTPUT_FOLDER = os.path.join('images', 'output')

output_image_path, response, filetype = detect_and_draw_box(INPUT_FOLDER, OUTPUT_FOLDER)