In [1]:
#Se importan las librerías necesarias
import numpy as np
import cv2
import time
import os
import tensorflow as tf

In [2]:
class DetectorAPI:
    def __init__(self, path_to_ckpt):
        self.path_to_ckpt = path_to_ckpt
 
        self.detection_graph = tf.Graph()
        with self.detection_graph.as_default():
            od_graph_def = tf.GraphDef()
            with tf.gfile.GFile(self.path_to_ckpt, 'rb') as fid:
                serialized_graph = fid.read()
                od_graph_def.ParseFromString(serialized_graph)
                tf.import_graph_def(od_graph_def, name='')
 
        self.default_graph = self.detection_graph.as_default()
        self.sess = tf.Session(graph=self.detection_graph)
 
        # Definir los tensores de entrada y salida para detection_graph
        self.image_tensor = self.detection_graph.get_tensor_by_name('image_tensor:0')
        # Cada caja representa una parte de la imagen donde un objeto en particular fue detectado
        self.detection_boxes = self.detection_graph.get_tensor_by_name('detection_boxes:0')
        # Cada puntaje representa un nivel de precisión
        
        self.detection_scores = self.detection_graph.get_tensor_by_name('detection_scores:0')
        self.detection_classes = self.detection_graph.get_tensor_by_name('detection_classes:0')
        self.num_detections = self.detection_graph.get_tensor_by_name('num_detections:0')
 
    def processFrame(self, image):
        # El modelo esperado espera imágenes con el siguiente formato [1, None, None, 3]
        image_np_expanded = np.expand_dims(image, axis=0)
        # Comienza la detección
        start_time = time.time()
        (boxes, scores, classes, num) = self.sess.run(
            [self.detection_boxes, self.detection_scores, self.detection_classes, self.num_detections],
            feed_dict={self.image_tensor: image_np_expanded})
        end_time = time.time()
 
 
        im_height, im_width,_ = image.shape
        boxes_list = [None for i in range(boxes.shape[1])]
        #Comienza a dibujar las cajas en el lugar donde se encontró algo
        for i in range(boxes.shape[1]):
            boxes_list[i] = (int(boxes[0,i,0] * im_height),
                        int(boxes[0,i,1]*im_width),
                        int(boxes[0,i,2] * im_height),
                        int(boxes[0,i,3]*im_width))
        #Regresa las cajas que encontró
        return boxes_list, scores[0].tolist(), [int(x) for x in classes[0].tolist()], int(num[0])
 
    def close(self):
        self.sess.close()
        self.default_graph.close()

In [5]:
#Cargamos nuesto clasificador
model_path = '../../xmls/faster_rcnn_inception_v2_coco_2018_01_28/frozen_inference_graph.pb'
odapi = DetectorAPI(path_to_ckpt=model_path)
threshold = 0.7

rutaDatasets = '../../Videos/Datasets/'
nombreDataset = 'CamNet 352 x 288/'
#Asigamos un directorio donde se guardarán nuestros archivos
directorioSalida ='../../Videos/Resultados/Salida Faster R-CNN/'


try:
    # Creamos el directorio de salida
    os.mkdir(directorioSalida)
    print( directorioSalida ,  " Creado ") 
except FileExistsError:
    # Si ya esxistía, se cacha la excepción
    print( directorioSalida ,  " Ya existia")

try:
    #Creamos los de salida
    f = open(directorioSalida+"Salida HAAR.csv", "x")
    f2 = open(directorioSalida+"Conteo de activacion Faster R-CNN.csv", "x")
except:
    #Si ya existiían, se procede a abrilos
    f = open(directorioSalida+"Salida HAAR.csv", "w")
    f2 = open(directorioSalida+"Conteo de activacion Faster R-CNN.csv", "w")

contador = 1
#Se colocán las cabeceras de los archivos
f.write("nombre, tiempo, fps \n")
f2.write("nombre, cuadros Totales, cuadrosActivados \n")

#En este ciclo 'for' se toman en cuenta todos los vídeos que se quieran procesar
for i in range(8): 
    #Esta bandera es para indicar que aún nos encontramos trábjando con un vídeo en espeficico
    ban = True
    #El contador de cuadros se inicializa en 0 para cada vídeo
    contadorCuadros = 0
    #Se da el nombre de entrada del video, en este caso los videos 
    #son nombrados con "video_n" para automatizar el proceso
    nombreEntrada = "video_"+str(i+1) 

    #Se carga el vídeo que queremos utilizar
    cap=cv2.VideoCapture(rutaDatasets+nombreDataset+nombreEntrada+'.mp4')
    #Obtenemos los FPS
    fps = cap.get(cv2.CAP_PROP_FPS)

    #Definimos tamaño a redimensionar
    frame_width = 352#
    frame_height = 288#

    #Le damos un nombre al vídeo que tendremos como salida
    nombreSalida = "salida"+str(contador)+"_"+str(fps)+"fps"

    # Definimos el codec y guardamos el video
    out = cv2.VideoWriter(directorioSalida+nombreSalida+'.avi',cv2.VideoWriter_fourcc('M','J','P','G'), int(fps), (frame_width,frame_height))
    #Asignamos el contador de activación en 0
    contadorActivacion = 0 
    #Asignamos un tiempo de inicio
    inicio = time.time()
    #Este cliclo 'While' nos dice si los cuadros de un video fueron ya procesados
    while ban:
        #Se lee un cuadro del video
        r, frame = cap.read()
        #Se aumenta el contador de cuadros
        contadorCuadros = contadorCuadros + 1
        #se verifica si el vídeo aún tiene cuadros por procesar
        if r == True:
            #Este proceso es el mismo que se vío anteriormente
            frame = cv2.resize(frame, (frame_width, frame_height))

            #Activamos el detector con el cuadro seleccionado
            boxes, scores, classes, num = odapi.processFrame(frame)
            #El detector nos arroja coorenadas con lo que podría una persona
            #Recordemos que este detector puede detectar una gran variedad de cosas 
            for i in range(len(boxes)):
                # la clase 1, es la que representa 'humanos'
                if classes[i] == 1 and scores[i] > threshold:
                    box = boxes[i]
                    #Se procede a pintar un rectangulo en el grame
                    cv2.rectangle(frame,(box[1],box[0]),(box[3],box[2]),(255,0,0),2)
                    #Se aumenta el contador de activación, pues el algoritmo encontró una persona
                    contadorActivacion = contadorActivacion + 1 

            #Mostramos el frame
            cv2.imshow('Faster R CNN',frame)
            #Guardamos ese frame
            out.write(frame)

            key = cv2.waitKey(1)
            if key & 0xFF == ord('q'):
                ban = False
        else:
            #En caso de que no tenga cuadros por procesar se sale del ciclo
            ban = False

    contador = contador + 1
    fin = time.time()
    segundos = fin - inicio
    fpsNuevos = contadorCuadros/segundos
    #Se guardan los resultados en los archivos
    f.write(str(nombreEntrada) + ',' + str(segundos) + ',' + str(fpsNuevos)+ '\n')
    f2.write(str(nombreEntrada) + ',' + str(contadorCuadros) + ',' + str(contadorActivacion)+'\n')
    #Se imprimen por pantalla los resulatodos
    print(nombreEntrada + " FPS: " +str(fpsNuevos)) 
    print(nombreEntrada + " Tiempo total: " + str(segundos))
    #Se cierran los capturadores
    cap.release()
    out.release()

#Se cierran los archivos
f.close()    
f2.close()
cv2.destroyAllWindows()q

../../Videos/Resultados/Salida Faster R-CNN/  Creado 
Tiempo transcurrido: 5.354699373245239
Tiempo transcurrido: 0.41631054878234863
Tiempo transcurrido: 0.43109774589538574
Tiempo transcurrido: 0.41509461402893066
Tiempo transcurrido: 0.4190952777862549
Tiempo transcurrido: 0.4140932559967041
Tiempo transcurrido: 0.4070918560028076
video_1 FPS: 0.8763166779767536
video_1 Tiempo total: 7.987979888916016
Tiempo transcurrido: 0.40609192848205566
video_2 FPS: 2.414912182216503
video_2 Tiempo total: 0.4140937328338623
Tiempo transcurrido: 0.41109299659729004
Tiempo transcurrido: 0.44009900093078613
Tiempo transcurrido: 0.4210951328277588
Tiempo transcurrido: 0.4100961685180664
Tiempo transcurrido: 0.41628122329711914
Tiempo transcurrido: 0.42856574058532715
Tiempo transcurrido: 0.41509294509887695
video_3 FPS: 2.316849212440416
video_3 Tiempo total: 3.0213446617126465
Tiempo transcurrido: 0.4050920009613037
video_4 FPS: 2.4207576757100866
video_4 Tiempo total: 0.41309380531311035
Tiempo t