# Ejercicio 5:

Genere un video en un patio o en un hall de edificio donde en un principio se vea vacío y luego aparezca una persona. Mediante los métodos de motion detection (sin usar deep learning) logre una detección de la persona cuando entra al cuadro suponiendo la utilidad para una cámara de seguridad.

Luego sobre el mismo video aplique los algoritmos de flujo denso y disperso que se mostraron en clase.

Escriba una reflexión sobre los resultados en el formato md dentro del Jupyter Notebook.

## Instalacion / Importacion de librerias:

In [None]:
!pip install -q mediapy

[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/1.6 MB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━━━[0m[90m╺[0m[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.5/1.6 MB[0m [31m13.5 MB/s[0m eta [36m0:00:01[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m [32m1.6/1.6 MB[0m [31m29.9 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.6/1.6 MB[0m [31m21.3 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
import mediapy as media  # Importar la biblioteca mediapy para manejo de medios
import cv2  # Importar OpenCV para el procesamiento de imágenes y videos
import numpy as np

## Preparacion del video:

In [None]:
# Conversion del video a un formato mas liviano
!ffmpeg -y -i video_motion_detection.mp4 -vf "scale=400:-2" -an video_motion_detection_400.mp4

ffmpeg version 4.4.2-0ubuntu0.22.04.1 Copyright (c) 2000-2021 the FFmpeg developers
  built with gcc 11 (Ubuntu 11.2.0-19ubuntu1)
  configuration: --prefix=/usr --extra-version=0ubuntu0.22.04.1 --toolchain=hardened --libdir=/usr/lib/x86_64-linux-gnu --incdir=/usr/include/x86_64-linux-gnu --arch=amd64 --enable-gpl --disable-stripping --enable-gnutls --enable-ladspa --enable-libaom --enable-libass --enable-libbluray --enable-libbs2b --enable-libcaca --enable-libcdio --enable-libcodec2 --enable-libdav1d --enable-libflite --enable-libfontconfig --enable-libfreetype --enable-libfribidi --enable-libgme --enable-libgsm --enable-libjack --enable-libmp3lame --enable-libmysofa --enable-libopenjpeg --enable-libopenmpt --enable-libopus --enable-libpulse --enable-librabbitmq --enable-librubberband --enable-libshine --enable-libsnappy --enable-libsoxr --enable-libspeex --enable-libsrt --enable-libssh --enable-libtheora --enable-libtwolame --enable-libvidstab --enable-libvorbis --enable-libvpx --enab

### Reproduccion del video:

In [None]:
url = 'video_motion_detection_400.mp4'
video = media.read_video(url)
media.show_video(video)

0
This browser does not support the video tag.


## Funciones comunes a todos los problemas:

In [None]:
def draw_contours(frame, contours, color=(0, 255, 0), thickness=2):
    # Comprobar si la imagen es en escala de grises (1 canal)
    if len(frame.shape) == 2 or frame.shape[2] == 1:
        # Convertir la imagen de escala de grises a color (3 canales)
        result_image = cv2.cvtColor(frame, cv2.COLOR_GRAY2BGR)
    else:
        # Si ya es una imagen de color, simplemente hacer una copia
        result_image = frame.copy()

    # Dibujar cada contorno en la imagen
    for contour in contours:
        # Obtener el rectángulo delimitador para cada contorno
        x, y, w, h = cv2.boundingRect(contour)
        # Dibujar el rectángulo
        cv2.rectangle(result_image, (x, y), (x + w, y + h), color, thickness)

    return result_image

# Función para procesar un video:
def video_processor(filename_in, filename_out, process_func, max_time=10, **kwargs):
    # Abrir el video de entrada para lectura
    with media.VideoReader(filename_in) as r:
        # Crear un archivo de video de salida
        with media.VideoWriter(filename_out, shape=r.shape, fps=r.fps, bps=r.bps) as w:
            count = 0  # Inicializar contador de fotogramas
            prev_image = None  # Inicializar la imagen previa

            # Iterar sobre cada imagen (fotograma) del video
            for image in r:
                new_image = media.to_uint8(image)  # Convertir la imagen a formato flotante

                # Comprobar si es la primera imagen
                if prev_image is None:
                    prev_image = new_image.copy()

                # Procesar la imagen utilizando la función dada
                processed_image = process_func(new_image, prev_image, **kwargs)

                # Añadir la imagen procesada al video de salida
                w.add_image(processed_image)

                # Actualizar la imagen previa
                prev_image = new_image.copy()

                # Incrementar el contador de fotogramas
                count += 1

                # Detener el proceso si se alcanza el tiempo máximo
                if count >= max_time * r.fps:
                    break

## Frame Difference:

In [None]:
# Función actualizada para detectar movimientos y dibujar cuadros delimitadores:
def process_frame_difference_full(new_image, prev_image, **kwargs):
    # Convertir las imágenes a escala de grises
    new_gray = cv2.cvtColor(new_image, cv2.COLOR_RGB2GRAY)
    prev_gray = cv2.cvtColor(prev_image, cv2.COLOR_RGB2GRAY)

    # Calcular la diferencia absoluta entre los fotogramas actual y anterior
    frame_diff = cv2.absdiff(new_gray, prev_gray)

    # Normalizar la imagen de diferencia
    norm_diff = cv2.normalize(frame_diff, None, 0, 255, cv2.NORM_MINMAX)

    # Umbralizar la imagen para resaltar las diferencias
    _, thresh = cv2.threshold(norm_diff, 30, 255, cv2.THRESH_BINARY)

    # Dilatar la imagen umbralizada para mejorar la detección de contornos
    kernel = np.ones((5,5),np.uint8)
    dilated = cv2.dilate(thresh, kernel, iterations = 1)

    # Convertir la imagen dilatada a formato adecuado para findContours
    dilated = dilated.astype(np.uint8)

    # Encontrar contornos en la imagen dilatada
    contours, _ = cv2.findContours(dilated, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

    # Dibujar cuadros delimitadores alrededor de los contornos
    if kwargs.get('draw_mode', 0) == 0:
      result_image = draw_contours(new_image, contours)
    elif kwargs.get('draw_mode', 0) == 1:
      result_image = draw_contours(thresh, contours)

    return result_image


# Nombres de los archivos de video de entrada y salida
filename_in = 'video_motion_detection_400.mp4'
filename_out = 'video_motion_detection_frame_difference_full.mp4'

# Llamar a la función para procesar el video
video_processor(filename_in, filename_out, process_frame_difference_full,
                max_time=10, draw_mode=0)


In [None]:
# Mostrar el video resultante
media.show_video(media.read_video(filename_out), fps=30)

0
This browser does not support the video tag.


## Flujo Optico:

### Flujo Optico Disperso:

In [None]:
def process_sparse_optical_flow(new_image, prev_image):
    # Preparamos las imagenes de trabajo
    new_gray = cv2.cvtColor(new_image, cv2.COLOR_BGR2GRAY)
    prev_gray_image = cv2.cvtColor(prev_image, cv2.COLOR_BGR2GRAY)

    # Verificar si ya se han detectado las características de Shi-Tomasi
    if not hasattr(process_sparse_optical_flow, "shi_tomasi_done"):
        # Definir parámetros para la detección de esquinas de Shi-Tomasi
        feature_params = dict(maxCorners=300, qualityLevel=0.2, minDistance=2, blockSize=7)
        # Detectar puntos característicos en la imagen
        process_sparse_optical_flow.prev_points = cv2.goodFeaturesToTrack(new_gray, mask=None, **feature_params)
        # Crear una máscara para dibujar el flujo óptico
        process_sparse_optical_flow.mask = np.zeros_like(new_image)
        # Marcar que se ha completado la detección de Shi-Tomasi
        process_sparse_optical_flow.shi_tomasi_done = True

    # Continuar si se ha completado la detección de Shi-Tomasi
    if process_sparse_optical_flow.shi_tomasi_done:
        prev_points = process_sparse_optical_flow.prev_points
        mask = process_sparse_optical_flow.mask

    # Parámetros para el flujo óptico de Lucas-Kanade
    lk_params = dict(winSize=(15, 15), maxLevel=2,
                     criteria=(cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 0.03))

    # Calcular el flujo óptico de Lucas-Kanade
    new_points, status, error = cv2.calcOpticalFlowPyrLK(prev_gray_image, new_gray, prev_points, None, **lk_params)
    # Filtrar puntos buenos
    good_old = prev_points[status == 1]
    good_new = new_points[status == 1]
    color = (0, 255, 0)  # Color para el dibujo
    # Dibujar el movimiento (flujo óptico)
    for i, (new, old) in enumerate(zip(good_new, good_old)):
        a, b = new.astype(int).ravel()
        c, d = old.astype(int).ravel()
        mask = cv2.line(mask, (a, b), (c, d), color, 2)
        new_image = cv2.circle(new_image, (a, b), 3, color, -1)

    # Combinar la imagen actual con las líneas de flujo óptico dibujadas
    output = cv2.add(new_image, mask)
    # Actualizar puntos para el siguiente cuadro
    process_sparse_optical_flow.prev_points = good_new.reshape(-1, 1, 2)
    return output

# Nombres de los archivos de video de entrada y salida
filename_in = 'video_motion_detection_400.mp4'
filename_out = 'video_motion_detection_flujo_optico_disperso.mp4'

# Llamar a la función para procesar el video
video_processor(filename_in, filename_out, process_sparse_optical_flow,
                max_time=15)

In [None]:
# Mostrar el video resultante
media.show_video(media.read_video(filename_out), fps=30)

0
This browser does not support the video tag.


### Flujo Optico Denso:

In [None]:
# Función para procesar el flujo óptico denso
def process_dense_optical_flow(new_image, prev_image):
    # Convierte la nueva imagen a escala de grises
    gray = cv2.cvtColor(new_image, cv2.COLOR_BGR2GRAY)

    if not hasattr(process_dense_optical_flow, "init_done"):
        process_dense_optical_flow.prev_gray = cv2.cvtColor(new_image, cv2.COLOR_BGR2GRAY)
        process_dense_optical_flow.mask = np.zeros_like(new_image)
        process_dense_optical_flow.mask[..., 1] = 255
        process_dense_optical_flow.init_done = True

    if process_dense_optical_flow.init_done:
        prev_gray = process_dense_optical_flow.prev_gray
        mask = process_dense_optical_flow.mask

    # Calcula el flujo óptico
    flow = cv2.calcOpticalFlowFarneback(prev_gray, gray, None, 0.5, 3, 15, 3, 5, 1.2, 0)
    # Computa magnitud y ángulo de los vectores 2D
    magnitude, angle = cv2.cartToPolar(flow[..., 0], flow[..., 1])
    # Establece el tono de la imagen según la dirección del flujo óptico
    mask[..., 0] = angle * 180 / np.pi / 2
    # Establece el valor de la imagen según la magnitud del flujo óptico
    mask[..., 2] = cv2.normalize(magnitude, None, 0, 255, cv2.NORM_MINMAX)
    # Convierte de HSV a RGB
    rgb = cv2.cvtColor(mask, cv2.COLOR_HSV2BGR)
    # Actualiza la imagen previa a gris
    process_dense_optical_flow.prev_grayprev_gray = gray.copy()
    return rgb

# Nombres de los archivos de video de entrada y salida
filename_in = 'video_motion_detection_400.mp4'
filename_out = 'video_motion_detection_flujo_optico_denso.mp4'

# Llamar a la función para procesar el video
video_processor(filename_in, filename_out, process_dense_optical_flow,
                max_time=15)

In [None]:
# Mostrar el video resultante
media.show_video(media.read_video(filename_out), fps=30)

0
This browser does not support the video tag.


## Background Sustraction:

In [None]:
def process_back_sub(new_image, prev_image, **kwargs):
  # Inicializar el sustractor de fondo si aún no se ha hecho
  if not hasattr(process_back_sub, 'init_done'):
    # Obtener el método de sustracción de fondo especificado
    method = kwargs.get('method', 'MOG') # buscamos el metodo, sino por defecto que sea MOG
    match method:
      case 'CNT':
          process_back_sub.back_method = cv2.bgsegm.createBackgroundSubtractorCNT()
      case 'GMG':
          process_back_sub.back_method = cv2.bgsegm.createBackgroundSubtractorGMG()
      case 'GSOC':
          process_back_sub.back_method = cv2.bgsegm.createBackgroundSubtractorGSOC()
      case 'LSBP':
          process_back_sub.back_method = cv2.bgsegm.createBackgroundSubtractorLSBP()
      case 'KNN':
          process_back_sub.back_method = cv2.createBackgroundSubtractorKNN()
      case 'MOG' | 'MOG2':
          process_back_sub.back_method = cv2.createBackgroundSubtractorMOG2(detectShadows=kwargs.get('detect_shadows', True))
      case _:
          print(f'Método {method} no implementado')
    process_back_sub.init_done = True

  # Aplicar el método de sustracción de fondo seleccionado a la nueva imagen
  back_method = process_back_sub.back_method
  foreground_mask = back_method.apply(new_image)

  # Umbralizar la máscara para resaltar los objetos en movimiento
  _, thresh = cv2.threshold(foreground_mask, kwargs.get('threshold_val', 30), 255, cv2.THRESH_BINARY)

  # Aplicar erosión y dilatación para mejorar la segmentación
  kernel_size = kwargs.get('kernel_size', 5)
  kernel = np.ones((kernel_size, kernel_size), np.uint8)
  thresh = cv2.erode(thresh, kernel, iterations=kwargs.get('erode_iterations', 1))
  thresh = cv2.dilate(thresh, kernel, iterations=kwargs.get('dilate_iterations', 1))

  # Encontrar contornos
  contours, _ = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

  # Determinar qué imagen se usará para dibujar los contornos
  match result_frame:
    case 'mask':
        result_image = cv2.cvtColor(foreground_mask, cv2.COLOR_GRAY2BGR)
    case 'morph':
        result_image = cv2.cvtColor(thresh, cv2.COLOR_GRAY2BGR)
    case _:  # original
      result_image = new_image

  # Dibujar cuadros delimitadores (bounding boxes)
  show_boxes = kwargs.get('show_boxes', True)
  if show_boxes:
    for contour in contours:
        if cv2.contourArea(contour) > kwargs.get('min_area', 100):
            x, y, w, h = cv2.boundingRect(contour)
            result_image = cv2.rectangle(result_image, (x, y), (x+w, y+h), (0, 255, 0), 2)

  return result_image

In [None]:
# Nombres de los archivos de video de entrada y salida
filename_in = 'video_motion_detection_400.mp4'
result_frame = 'original'   # Opciones: 'mask', 'morph', 'original'
for method in ['MOG', 'CNT', 'GMG', 'GSOC', 'LSBP', 'KNN']:
  filename_out = f'video_motion_detection_background_sustraction_{method}.mp4'

  # Llamar a la función para procesar el video
  video_processor(filename_in, filename_out, process_back_sub,
                  max_time=10, method=method, result_frame=result_frame)

  # Mostrar el video resultante
  print(f'Método {method}:')
  media.show_video(media.read_video(filename_out), fps=30)

Método MOG:


0
This browser does not support the video tag.


Método CNT:


0
This browser does not support the video tag.


Método GMG:


0
This browser does not support the video tag.


Método GSOC:


0
This browser does not support the video tag.


Método LSBP:


0
This browser does not support the video tag.


Método KNN:


0
This browser does not support the video tag.
