### Parte 1) Filtro pelo pacote OpenCV para operações avançadas: (i) detectar contornos; (ii) detectar objeto; (iii) detectar padrões (rosto) em tempo real.

i) Detectar contornos:

In [6]:
#Importando o pacote OpenCV (depois de instalá-lo)
import cv2

#Ler uma imagem e mostrá-la
gatim = cv2.imread('gatim.jfif', cv2.IMREAD_COLOR)
cv2.imshow("Gatinho", gatim)

#Transformar a imagem em preto e branco (apesar dela já ser)
gatimcinza = cv2.cvtColor(gatim, cv2.COLOR_BGR2GRAY)
cv2.imshow("Gatinho preto e branco", gatimcinza)

# Imagem com os contornos destacados (canny = filtro com um Sobel kernel)
canny = cv2.Canny(gatimcinza, 125, 175)
cv2.imshow('Contornos do gatinho', canny)
cv2.waitKey(0)

-1

ii) Detectar objetos

Neste código iremos utilizar o pacote openCV junto com um banco de dados (COCO dataset) de objetos, no intuito de detectar objetos semelhantes ao que possuem no banco de dados:

Exemplo 1: Detectar um carro

In [8]:
import cv2 # Importar pacote openCV

img = cv2.imread('carro.PNG')

# Crinado um array para colocar os nomes dos objetos
classNames= []
classFile = 'coco.names' #Importando a pasta dos nomes dos objetos
with open(classFile,'rt') as f:
    classNames = f.read().rstrip('\n').split('\n')

# Importando as outras pastas dos bancos de dados (COCO dataset)
configPath = 'ssd_mobilenet_v3_large_coco_2020_01_14.pbtxt'
weightsPath = 'frozen_inference_graph.pb'

# Criar um modelo de detecção a partir de uma network de deep learning
net = cv2.dnn_DetectionModel(weightsPath,configPath)
net.setInputSize(320,320)
net.setInputScale(1.0/ 127.5)
net.setInputMean((127.5, 127.5, 127.5))
net.setInputSwapRB(True)

classIds, confs, bbox = net.detect(img, confThreshold=0.5)# Detecta arrays iguais do modelo 
#ClassIds=numero de identificação do objeto  #confthreshold=limite para detectar objeto

#Caso encontre o contorno, marca e coloca o nome
for classId, confidence, box in zip(classIds.flatten(), confs.flatten(), bbox):
    cv2.rectangle(img, box, color=(0, 255,0), thickness=2)
    cv2.putText(img, classNames[classId-1], (box[0]+10, box[1]+30), cv2.FONT_HERSHEY_COMPLEX,1,(0,255,0),2)
    
cv2.imshow("Saida", img) # Mostra a imagem
cv2.waitKey(0)

-1

Exemplo 2: Detectar gato e carro

In [9]:
import cv2 # Importar pacote openCV

img = cv2.imread('cars-and-cats.jpg')

# Crinado um array para colocar os nomes dos objetos
classNames= []
classFile = 'coco.names' #Importando a pasta dos nomes dos objetos
with open(classFile,'rt') as f:
    classNames = f.read().rstrip('\n').split('\n')

# Importando as outras pastas dos bancos de dados (COCO dataset)
configPath = 'ssd_mobilenet_v3_large_coco_2020_01_14.pbtxt'
weightsPath = 'frozen_inference_graph.pb'

# Criar um modelo de detecção a partir de uma network de deep learning
net = cv2.dnn_DetectionModel(weightsPath,configPath)
net.setInputSize(320,320)
net.setInputScale(1.0/ 127.5)
net.setInputMean((127.5, 127.5, 127.5))
net.setInputSwapRB(True)

classIds, confs, bbox = net.detect(img, confThreshold=0.5)# Detecta arrays iguais do modelo 
#ClassIds=numero de identificação do objeto  #confthreshold=limite para detectar objeto

#Caso encontre o contorno, marca e coloca o nome
for classId, confidence, box in zip(classIds.flatten(), confs.flatten(), bbox):
    cv2.rectangle(img, box, color=(0, 255,0), thickness=2)
    cv2.putText(img, classNames[classId-1], (box[0]+10, box[1]+30), cv2.FONT_HERSHEY_COMPLEX,1,(0,255,0),2)
    
cv2.imshow("Saida", img) # Mostra a imagem
cv2.waitKey(0)

-1

iii) detectar padrões (rosto) em tempo real.

Agora iremos executar este mesmo códico para reconhecer objetos e rostos em tempo real através da webcam. Como será utilizado um vídeo, temos que adicionar um loop com o while:

In [10]:
import cv2 # Importar pacote openCV

cap = cv2.VideoCapture(0) # Capturar video da webcam
cap.set(3,1280)
cap.set(4,720)
cap.set(10,70)

# Crinado um array para colocar os nomes dos objetos
classNames= []
classFile = 'coco.names' #Importando a pasta dos nomes dos objetos
with open(classFile,'rt') as f:
    classNames = f.read().rstrip('\n').split('\n')


# Importando as outras pastas dos bancos de dados (COCO dataset)
configPath = 'ssd_mobilenet_v3_large_coco_2020_01_14.pbtxt'
weightsPath = 'frozen_inference_graph.pb'

# Criar um modelo de detecção a partir de uma network de deep learning
net = cv2.dnn_DetectionModel(weightsPath,configPath)
net.setInputSize(320,320)
net.setInputScale(1.0/ 127.5)
net.setInputMean((127.5, 127.5, 127.5))
net.setInputSwapRB(True)

# Loop para gerar o video
while True:
    success,img = cap.read() # Lê o video e separa as imagens em img (success mostra um true)
    classIds, confs, bbox = net.detect(img,confThreshold=0.5) # Detecta arrays iguais do modelo 
    #ClassIds=numero de identificação do objeto  #confthreshold=limite para detectar objeto
    if len(classIds) != 0: #Caso encontre o contorno, marca e coloca o nome
        for classId, confidence,box in zip(classIds.flatten(),confs.flatten(),bbox):
            cv2.rectangle(img,box,color=(0,255,0),thickness=2)
            cv2.putText(img,classNames[classId-1].upper(),(box[0]+10,box[1]+30),
            cv2.FONT_HERSHEY_COMPLEX,1,(0,255,0),2)
            cv2.putText(img,str(round(confidence*100,2)),(box[0]+200,box[1]+30),
            cv2.FONT_HERSHEY_COMPLEX,1,(0,255,0),2)

    cv2.imshow('Captura de webcam',img) # Mostrar video
    if cv2.waitKey(1) == ord('q'):
        break #Para quebrar o loop quando apertar o botão 'q'
    if cv2.getWindowProperty('Captura de webcam', cv2.WND_PROP_VISIBLE) < 1:
        break #Para quebrar o loop quando fechar a janela

# Depois de quebrar o loop, fecha a webcam e fecha todas as janelas abertas
cap.release()
cv2.destroyAllWindows()

### Parte 2) OpenCV para rastrear o movimento de um objeto colorido: pêndulo com barbante pendurando um objeto colorido e capture o movimento como função do tempo do vídeo.

Nesta etapa iremos utilizar o pacote openCV para rastrear o movimento de um pêndulo, para isso iremos obter o contorno de objetos em movimento e distinguir quando o objeto está parado (ou seja quando ele está no ponto mais alto), para assim obter o periodo de oscilação e com isso poder obter a acerelação gravitacional. 

In [11]:
# Importanto as bilbiotecas  
from typing import Tuple
import cv2
import time
import numpy

length = 0.15 # Comprimento da corda

capture = cv2.VideoCapture("testependulo2.mp4") # Puxa o vídeo dos arquivos
fps = round(capture.get(cv2.CAP_PROP_FPS), 2) # Encontra e arredonda o frame rate (fps)

# Obtendos os frames do video em duas matrizes 
_, frame1 = capture.read()
_, frame2 = capture.read()

time_start = time.time() # Define o tempo inicial
# Definindo alguns arrays que serão utilizados mais adiante
labels = []
stops_list = []
T_list = []
T_half_list = []
T_timestamps = []

# Função para calcular o tempo (retorna um tuple de 3 elementos)
def calc_T() -> Tuple[float, float, float]:
    avg = round(numpy.mean(T_list), 2) #Periodo médio (avg=average)
    low = round(numpy.min(T_list), 2) #Periodo mínimo
    high = round(numpy.max(T_list), 2) #Periodo máximo
    return (avg, low, high)

# Função para calcular a aceleração gravitacional (retorna um tuple de 3 elementos)
def calc_g() -> Tuple[float, float, float]:
    T_avg, T_min, T_max = calc_T()
    # Considerando pequenas oscilações (seno de teta = teta)
    g_avg = (4 * 3.14 * 3.14 * length) / (T_avg**2) #g médio (avg=average)
    g_min = (4 * 3.14 * 3.14 * length) / (T_max**2) #g mínimo
    g_max = (4 * 3.14 * 3.14 * length) / (T_min**2) #g máximo
    return (round(g_avg, 2), round(g_min, 2), round(g_max, 2))

# Função para colocar texto no video
def drawText(text: str, color: Tuple[int, int, int], pos: Tuple[int, int], big=False, console=False):
    if console:
        print(text)
    if big:
        scale = 1
        thickness = 4
    else:
        scale = 0.6
        thickness = 2

    cv2.putText(frame1, str(text), org=pos, fontFace=cv2.FONT_HERSHEY_SIMPLEX,
                fontScale=scale, color=color, thickness=3)


prev_moving = False # Como não há movimento antes de tudo, deve ser false
stops_count = 0 # Quantidades de vezes que o movimento para


#Começar o loop para o video
while capture.isOpened() and frame1 is not None and frame2 is not None:
    t0 = cv2.getTickCount() # Retorna o número de ciclos de clock após um evento de referência
    T = cv2.absdiff(frame1, frame2) # Calcula a diferença absoluta por elemento entre duas matrizes
    gray = cv2.cvtColor(T, cv2.COLOR_BGR2GRAY) # Deixando a imagem preto e branco
    blur = cv2.GaussianBlur(gray, (5, 5), 0) # Aplicando blur por gaussiana
    _, threshold = cv2.threshold(blur, 20, 255, cv2.THRESH_BINARY) # Aplicando um limite (define melhor o contorno)
    dilated = cv2.dilate(threshold, None, iterations=1) # Aumenta a área do conotorno
    '''''
    Assim, já com a imagem binária, encontra os contornos e retorna uma lista com todos os contornos,
    cada contorno individual é uma matriz Numpy de coordenadas (x, y) de pontos de fronteira do objeto.
    '''''
    contours, _ = cv2.findContours(dilated, cv2.RETR_TREE, method=cv2.CHAIN_APPROX_SIMPLE)
    
    time_total = round(time.time() - time_start, 2) # Tempo progredindo no loop
    big_moving_things = 0 # Variável para mostrar que está se movendo
    
    for contour in contours:
        (x, y, w, h) = cv2.boundingRect(contour) # Cria caixas delimitadoras e círculos para contornos

        if cv2.contourArea(contour) < 500: # Continua o loop para uma áreas pequenas (n encontra contorno)
            continue
        else:
            big_moving_things += 1 
            cv2.rectangle(frame1, pt1=(x, y), pt2=(x + w, y + h), color=(0, 255, 0), thickness=2)
            # Continua o loop, porém muda a variável e marca contornos maiores com um retângulo

    if big_moving_things > 0: # Caso encontre contorno, mostra a mensagem "move" no video
        msg = "move"
        color = (0, 255, 0)
        prev_moving = True
    else:
        msg = "n move" # Caso não encontre contorno, mostra a mensagem "n move" no video
        color = (0, 0, 255)
        if prev_moving: #Caso encontre um contorno no frame anterior (havia movimento)
            stops_list.append(time_total) #Tempo em que a oscilação acaba

            if len(stops_list) > 1:
                T_half = round(time_total - stops_list[-2], 2)
                '''''
                Se a lista com os tempos que não há oscilação for maior q 1, retira ela do periodo 
                total para descontar e tem-se a "metade do periodo" 
                '''''
            else:
                T_half = 0

            if T_half >= 0.3:
                prev_moving = False
                stops_count += 1
                T_half_list.append(T)
                '''''
                Se a lista com os tempos que não há oscilação for maior ou igual a 0.3, considera-se o
                último frame como estático e adiciona o periodo à lista de metades do periodo. 
                '''''

            if (stops_count % 2 == 0):
                T_timestamp = time.time()
                T_timestamps.append(T_timestamp)
                '''''
                Se a a variável for par, ou seja, se o if anterir ocorrer duas vezes, quatro, seis,
                etc, indicando que o pendulo percorreu um periodo inteiro, adiciona o tempo desta 
                marcação na lista T_timestamp.
                '''''
                if len(T_timestamps) > 3:
                    T = round(T_timestamp - T_timestamps[-2], 2)
                    T_list.append(T)
                    labels.append(f"T: {T}")
                    '''''
                    Neste último if, caso a soma dos valores da lista sejam maiores q 3 
                    (isso para tirar os primeiros periodos q foram grandes demais), adicionamos o
                    periodo da oscilação para T_list
                    '''''
    # Colocar os tempos no video um embaixo do outro
    label_y = 60
    for label in labels:
        label_y += 30
        drawText(label, color, (10, label_y))
        
    # Colocar no video se está se movendo e o tempo total
    drawText(msg, color, (10, 40))
    drawText(f"tempo: {time_total}", color, (120, 40))
    
    # Colocar no video o g médio e o período médio caso forem medidos
    if T_list:
        g_avg, _, _ = calc_g()
        drawText(f"g med: {g_avg}", color, (250, 40))
        T_avg, _, _ = calc_T()
        drawText(f"T med: {T_avg}", color, (430, 40))

    
    # Mostrar o video
    cv2.imshow("Movimento pendulo", frame1)
    cv2.imshow("Contornos", blur)
    frame1 = frame2
    _, frame2 = capture.read()
    if cv2.waitKey(1) == 27:
        break
    if cv2.waitKey(1) == ord('q'):
        break #Para quebrar o loop quando apertar o botão 'q'/
    if cv2.getWindowProperty('Movimento pendulo', cv2.WND_PROP_VISIBLE) < 1:
        break #Para quebrar o loop quando fechar a janela
    if cv2.getWindowProperty('Contornos', cv2.WND_PROP_VISIBLE) < 1:
        break #Para quebrar o loop quando fechar a janela

# Fim do loop

# Para facilitar a visualização, escrever os resultados finais:
T_avg, T_min, T_max = calc_T()
print(f"Medido em {len(T_list)} periodos. T medio: {T_avg}, T min: {T_min}, T max: {T_max}")
g_avg, g_min, g_max = calc_g()
print(f"g medio: {g_avg}, g min: {g_min}, g max: {g_max}")

cv2.destroyAllWindows()
capture.release()

Medido em 9 periodos. T medio: 0.72, T min: 0.2, T max: 1.83
g medio: 11.41, g min: 1.77, g max: 147.89


In [12]:
from typing import Tuple
import cv2
import time
import numpy

length = 0.25

capture = cv2.VideoCapture("penduloferro.mp4")
fps = round(capture.get(cv2.CAP_PROP_FPS), 2)

_, frame1 = capture.read()
_, frame2 = capture.read()

time_start = time.time()
labels = []
stops_list = []
T_list = []
T_half_list = []
T_timestamps = []


def calc_T() -> Tuple[float, float, float]:
    avg = round(numpy.mean(T_list), 2)
    low = round(numpy.min(T_list), 2)
    high = round(numpy.max(T_list), 2)
    return (avg, low, high)


def calc_g() -> Tuple[float, float, float]:
    T_avg, T_min, T_max = calc_T()
    g_avg = (4 * 3.14 * 3.14 * length) / (T_avg**2)
    g_min = (4 * 3.14 * 3.14 * length) / (T_max**2)
    g_max = (4 * 3.14 * 3.14 * length) / (T_min**2)

    return (round(g_avg, 2), round(g_min, 2), round(g_max, 2))


def drawText(text: str,
             color: Tuple[int, int, int],
             pos: Tuple[int, int],
             big=False,
             console=False):
    if console:
        print(text)

    if big:
        scale = 1
        thickness = 4
    else:
        scale = 0.6
        thickness = 2

    cv2.putText(frame1, str(text), org=pos, fontFace=cv2.FONT_HERSHEY_SIMPLEX,
                fontScale=scale, color=color, thickness=3)


prev_moving = False
stops_count = 0
while capture.isOpened() and frame1 is not None and frame2 is not None:
    t0 = cv2.getTickCount()
    T = cv2.absdiff(frame1, frame2)
    gray = cv2.cvtColor(T, cv2.COLOR_BGR2GRAY)
    blur = cv2.GaussianBlur(gray, (5, 5), 0)
    _, threshold = cv2.threshold(blur, 20, 255, cv2.THRESH_BINARY)
    dilated = cv2.dilate(threshold, None, iterations=1)
    contours, _ = cv2.findContours(
        dilated, cv2.RETR_TREE, method=cv2.CHAIN_APPROX_SIMPLE)

    time_total = round(time.time() - time_start, 2)
    big_moving_things = 0
    for contour in contours:
        (x, y, w, h) = cv2.boundingRect(contour)

        if cv2.contourArea(contour) < 400:
            continue
        else:
            big_moving_things += 1
            cv2.rectangle(frame1, pt1=(x, y), pt2=(x + w, y + h),
                          color=(0, 255, 0), thickness=2)

    if big_moving_things > 0:
        msg = "move"
        color = (0, 255, 0)
        prev_moving = True
    else:
        msg = "n move"
        color = (0, 0, 255)
        if prev_moving:
            stops_list.append(time_total)

            if len(stops_list) > 1:
                T_half = round(time_total - stops_list[-2], 2)
            else:
                T_half = 0

            if T_half >= 0.3:
                prev_moving = False
                stops_count += 1
                T_half_list.append(T)

            if (stops_count % 2 == 0):
                T_timestamp = time.time()
                T_timestamps.append(T_timestamp)
                if len(T_timestamps) > 4:
                    T = round(T_timestamp - T_timestamps[-2], 2)
                    T_list.append(T)
                    labels.append(
                        f"T: {T}")

    label_y = 60
    for label in labels:

        label_y += 30
        drawText(label, color, (10, label_y))

    drawText(msg, color, (10, 40))
    drawText(f"total: {time_total}", color, (120, 40))

    if T_list:
        g_avg, _, _ = calc_g()
        drawText(f"g med: {g_avg}", color, (250, 40))

        T_avg, _, _ = calc_T()
        drawText(f"T med: {T_avg}", color, (390, 40))

        #print(f"g avg: {g_avg}, T avg: {T_avg}, stops count: {stops_count}")

    t1 = cv2.getTickCount()
    processing_time = round((t1-t0)/cv2.getTickFrequency(), 3)
    #print(f"processing took {processing_time} seconds.")

    cv2.imshow("Movimento pendulo", frame1)
    frame1 = frame2
    _, frame2 = capture.read()
    if cv2.waitKey(1) == 27:
        break



T_avg, T_min, T_max = calc_T()
print(f"Medido em {len(T_list)} periodos. T medio: {T_avg}, T min: {T_min}, T max: {T_max}")
g_avg, g_min, g_max = calc_g()
print(f"g medio: {g_avg}, g min: {g_min}, g max: {g_max}")

cv2.destroyAllWindows()
capture.release()

Medido em 37 periodos. T medio: 1.38, T min: 0.07, T max: 2.72
g medio: 5.18, g min: 1.33, g max: 2012.16


Neste caso foi aumentado o número no "if len(T_timestamps) > 4:" pois os primeiros periodos estavam muito grandes.