# Detección de elementos


En este ejemplo vamos a usa el modelo [YOLO](https://arxiv.org/pdf/1612.08242.pdf), gracias al cual podremos detectar los elementos que aparecen dentro de una fotgrafia o video.

La identificación que obtendremos con YOLO consite en una etiqueta indicando que es lo que se ha detectado y las posiciones en la que se enuentra este objeto.

La implementación que usaresmos será la proporcionado por la bibliotece [darkflow](https://github.com/thtrieu/darkflow).

## PASO 1: definición y carga del modelos
En este paso cargaremos el modelo de YOLO, así como los pesos del entrenamiento de este para YOLOv2 608x608 que podemos obtener [aquí](https://pjreddie.com/darknet/yolov2/). El fichero de pesos descargados debemos colocarlo dentro de un carpeta llamada `bin` en la carpeta en la que hemso guardado la biblioteca *darkflow*.

In [1]:
from darkflow.net.build import TFNet

#Vamos a la carpeta donde se encuentra darkflow-master
%cd '/Users/Mario/Downloads/darkflow-master/'

options = {
    'model': 'cfg/yolo.cfg',
    'load': 'bin/yolo.weights',
    'threshold': 0.3,
    'gpu': 1.0
}

tfnet = TFNet(options)

#Se vuelve al directorio de ejecución
%cd '-'

/Users/Mario/Downloads/darkflow-master
Parsing ./cfg/yolo.cfg
Parsing cfg/yolo.cfg
Loading bin/yolo.weights ...
Successfully identified 203934260 bytes
Finished in 1.49076604843s
Model has a coco model name, loading coco labels.

Building net ...
Source | Train? | Layer description                | Output size
-------+--------+----------------------------------+---------------
Instructions for updating:
Colocations handled automatically by placer.
       |        | input                            | (?, 608, 608, 3)
 Load  |  Yep!  | conv 3x3p1_1  +bnorm  leaky      | (?, 608, 608, 32)
 Load  |  Yep!  | maxp 2x2p0_2                     | (?, 304, 304, 32)
 Load  |  Yep!  | conv 3x3p1_1  +bnorm  leaky      | (?, 304, 304, 64)
 Load  |  Yep!  | maxp 2x2p0_2                     | (?, 152, 152, 64)
 Load  |  Yep!  | conv 3x3p1_1  +bnorm  leaky      | (?, 152, 152, 128)
 Load  |  Yep!  | conv 1x1p0_1  +bnorm  leaky      | (?, 152, 152, 64)
 Load  |  Yep!  | conv 3x3p1_1  +bnorm  leaky      

# PASO 2: Carga de la imagen que queremos procesar

In [2]:
import cv2

img = cv2.imread('../datasets/test_4.png', cv2.IMREAD_COLOR)
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

## PASO 3: Pasamos la imagen por el modelo

In [3]:
result = tfnet.return_predict(img)

## PASO 4: Procesmiento de los resultados
Una vez se tienen los resultados del procesamiento, es posible pintar el recuadro que indica cada objeto, así como la etiqueta asignada por el modelo

In [4]:
from PIL import Image, ImageDraw, ImageFont


imgagen = Image.fromarray(img, 'RGB')
draw = ImageDraw.Draw(imgagen)
fnt = ImageFont.truetype('/Library/Fonts/Arial Bold.ttf', 90)

for elemetno in result:
    tl = (elemetno['topleft']['x'], elemetno['topleft']['y'])
    br = (elemetno['bottomright']['x'], elemetno['bottomright']['y'])
    label = elemetno['label']
    draw.rectangle((tl, br), outline="red")
    draw.text(tl, label, font=fnt )
imgagen.show()