# **Projeto Final - Estimação da Pose de um Robô Móvel**

**Alunos:** André Paiva Conrado Rodrigues, Romualdo Oliveira Santos Filho

**Matéria:** ENGG64 - Visão Computacional - 2023.2

## 1 - Importação de dependências e configurações

In [None]:
import numpy as np
import cv2 as cv
import matplotlib as mpl
from matplotlib import pyplot as plt

## 2 - Funções de processamento do vídeo

In [None]:
def extract_frames(filename):

    """Extrai os frames do vídeo."""
    
    frames = []
    video_capture = cv.VideoCapture(filename)
    while True:
        ret, frame = video_capture.read()
        if ret:
            frames.append(cv.cvtColor(frame, cv.COLOR_BGR2RGB))
        else:
            break
    video_capture.release()
    return frames

In [None]:
def gaussian_blur(frames):

    """Aplica desfoque gaussiano em uma
    sequência de frames."""
    
    proc_frames = []
    for frame in frames:
        proc_frame = cv.GaussianBlur(frame, (5, 5), 0)
        proc_frames.append(proc_frame)
    return proc_frames

In [None]:
def color_mask(frames):

    """Segmenta elementos de uma sequência de
    frames com tonalidades próximas do vermelho.
    Retorna uma imagem binária."""

    proc_frames = []
    for frame in frames:
        mask1 = cv.inRange(cv.cvtColor(frame, cv.COLOR_RGB2HSV), (0, 120, 40), (20, 220, 125))
        mask2 = cv.inRange(cv.cvtColor(frame, cv.COLOR_RGB2HSV), (165, 120, 40), (180, 220, 125))
        mask = cv.bitwise_or(mask1, mask2)
        proc_frames.append(mask)
    return proc_frames

In [None]:
def erode_and_dilate(frames):

    """Erosão e dilatação em imagem binária."""

    proc_frames = []
    kernel_open1 = cv.getStructuringElement(cv.MORPH_ELLIPSE, (5, 5))
    kernel_close = cv.getStructuringElement(cv.MORPH_ELLIPSE, (45, 45))
    kernel_open2 = cv.getStructuringElement(cv.MORPH_ELLIPSE, (7, 7))
    for frame in frames: 
        proc_frame = cv.morphologyEx(frame, cv.MORPH_OPEN, kernel_open1)
        proc_frame = cv.morphologyEx(proc_frame, cv.MORPH_CLOSE, kernel_close)
        proc_frame = cv.morphologyEx(proc_frame, cv.MORPH_OPEN, kernel_open2)
        proc_frames.append(proc_frame)
        
    return proc_frames

In [None]:
def blob_extractor(frames):

    """Extrai blobs da imagem, os quais devem
    corresponder a limites de área e perímetro
    estabelecidos."""

    proc_frames = []
    for frame in frames:
        proc_frame = np.zeros(frame.shape, dtype=np.uint8)
        contours, hierarchy = cv.findContours(frame, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)
        for i, cnt in enumerate(contours):
            if(cv.contourArea(cnt) >= 70 and \
               cv.contourArea(cnt) <= 8000 and \
               cv.arcLength(cnt, True) >= 80):
                cv.drawContours(proc_frame, [cnt], 0, (255), -1)
        proc_frames.append(proc_frame)
    return proc_frames

In [None]:
def centroid(frames):
    # FUNÇÃO PARA EXTRAÇÃO DE CENTROIDE
    # IMPLEMENTAR
    pass

In [None]:
def ellipse(frames):
    # FUNÇÃO PARA EXTRAÇÃO DE ELIPSE EQUIVALENTE
    # IMPLEMENTAR
    pass

In [None]:
def uv_plot(list_centroids):
    # FUNÇÃO PARA PLOT DE (U, V) x T
    # IMPLEMENTAR
    pass

In [None]:
def theta_plot(list_ellipses):
    # FUNÇÃO PARA PLOT DE ORIENTAÇÃO x T
    # IMPLEMENTAR
    pass

In [None]:
def path_plot(list_centroids):
    # FUNÇÃO PARA PLOT DE TRAJETÓRIA NO PLANO DA IMAGEM
    # IMPLEMENTAR
    pass

In [None]:
def composite_plot(frames,
                   list_centroids,
                   list_ellipses):
    # FUNÇÃO PARA PLOT COMPOSTO
    # IMPLEMENTAR
    pass

In [None]:
def write_video(frames, filename='output'):

    """Grava uma sequência de frames em um
    arquivo de vídeo."""

    out = cv.VideoWriter('output/' + filename + '.avi',
                         cv.VideoWriter_fourcc(*'MJPG'),
                         30,
                         (frames[0].shape[1], frames[0].shape[0]))
    if len(frames[0].shape) == 2:
        conversion = cv.COLOR_GRAY2BGR
    else:
        conversion = cv.COLOR_RGB2BGR
    for frame in frames:
        out.write(cv.cvtColor(frame, conversion))
    out.release()

In [None]:
def full_processing(filename):

    # FUNÇÃO PARCIALMENTE IMPLEMENTADA

    """Efetua todos os passos de processamento
    em um determinado arquivo de vídeo, gerando
    representações intermediárias e gráficos
    do processamento."""


    name = filename.split('/')[-1].split('.')[0]
    frames = extract_frames(filename)
    gaussian_frames = gaussian_blur(frames)
    color_seg = color_mask(gaussian_frames)
    eroded_and_dilated = erode_and_dilate(color_seg)
    blobbed = blob_extractor(eroded_and_dilated)

    write_video(gaussian_frames, name + '-01-GaussianBlur')
    write_video(color_seg, name + '-02-ColorSegmentation')
    write_video(eroded_and_dilated, name + '-03-ErosionAndDilation')
    write_video(blobbed, name + '-04-BlobExtraction')


## 3 - Aplicação das funções

### 3.1 - Vídeo 1

In [None]:
full_processing("images/Video1_husky.mp4")

### 3.2 - Vídeo 2

In [None]:
full_processing("images/video2_husky.mp4")