In [4]:
import imutils
import argparse
import cv2
import time



def pyramid(image, scale=1.5, min_size=(30, 30)):
    """
    Genera imágenes sucesivamente más pequeñas con base a los parámetros proporcionados.
    :param image: Imagen base.
    :param scale: Factor de reducción de cada nivel de la pirámide.
    :param min_size: Dimensiones mínimas que debe tener un nivel de la pirámide.
    :return: Un nuevo nivel de la pirámide en cada llamada.
    """
    yield image  # El primer de la pirámide será la imagen original.

    while True:
        # Reducimos el ancho de la imagen con base a `scale`, y luego la
        # redimensionamos manteniendo la relación de aspecto.
        width = int(image.shape[1] / scale)
        image = imutils.resize(image, width=width)

        # Si el resultado es una imagen más pequeña de lo esperada, paramos.
        if image.shape[0] < min_size[1] or image.shape[1] < min_size[0]:
            break

        # Retorna el siguiente nivel de la pirámide.
        yield image


def sliding_window(image, step_size, window_size):
    """
    Genera ventanas de tamaño `window_size` hasta haber recorrido toda la imagen.
    :param image: Imagen sobre la cual generar ventanas.
    :param step_size: Número de píxeles que nos moveremos en cada dirección.
    :param window_size: Dimensiones de la ventana deslizante.
    :return: Coordenadas (x, y) de la esquina superior izquierda de la ventana, y la región como tal.
    """
    for y in range(0, image.shape[0], step_size):
        for x in range(0, image.shape[1], step_size):
            yield x, y, image[y:y + window_size[1], x:x + window_size[0]]

In [10]:
#Test de la pirámide de imágenes

# Leemos la imagen.
image = cv2.imread('Dataset_images/00001.jpg')

# Generamos y enumeramos cada nivel de la pirámide.
for index, level in enumerate(pyramid(image, scale=1.5)):
    # Mostramos el nivel actual.
    cv2.imshow(f'Nivel {index + 1}', level)
    print(f'Dimensiones: {level.shape}')
    cv2.waitKey(0)

Dimensiones: (800, 1360, 3)
Dimensiones: (532, 906, 3)
Dimensiones: (354, 604, 3)
Dimensiones: (235, 402, 3)
Dimensiones: (156, 268, 3)
Dimensiones: (103, 178, 3)
Dimensiones: (68, 118, 3)
Dimensiones: (44, 78, 3)


In [5]:
#Test de la ventana deslizante

# Cargamos la imagen en memoria.
image = cv2.imread('Dataset_images/00001.jpg')


#Iteramos cada nivel/imagen de la pirámide
for index, layer in enumerate(pyramid(image, scale=1.5)):
    # ... y en cada uno deslizaremos una ventana con las proporciones especificadas, moviéndonos 32 píxeles a la vez.
    for x, y, window in sliding_window(layer, step_size=32, window_size=(100, 100)):
        # Si la ventana actual no cumple con el tamaño deseado, la ignoramos.
        if window.shape[0] != 100 or window.shape[1] != 100:
            continue

        # AQUÍ ES DONDE APLICARÍAMOS EL CLASIFICADOR DE MACHINE LEARNING. SIN EMBARGO, COMO NO TENEMOS
        # NINGUNO AÚN, PINTAREMOS LA VENTANA EN LA IMAGEN.
        clone = layer.copy()
        cv2.rectangle(clone, (x, y), (x + 100, y + 100), (0, 255, 0), 2)
        cv2.imshow('Ventana', clone)

        cv2.waitKey(1)
        time.sleep(0.025)
