# Relatório de Laboratório 3: Captura de Imagem e Vídeo
**Disciplina:** Processamento Digital de Imagens (2026.1)  
**Professor:** Celso Kurashima  

**Equipe:**
* Eduardo de Souza Carrilho - RA: 11201812084
* Gabriel Figueiredo de Souza - RA: 11202230332
* Lucas Goncalves De Oliveira - RA: 11202021135

**Data do Experimento:** 24/02/2026  
**Data de Entrega:** 27/02/2026

## 1. Introdução
Este relatório descreve as atividades do Laboratório 3, focadas na captura e manipulação de fluxos de vídeo e imagem utilizando a biblioteca **OpenCV**. O objetivo é compreender como o computador interpreta entradas de câmeras e arquivos, as diferenças entre espaços de cores e o controle de frames por segundo (FPS).

## 2. Procedimentos Experimentais

Para a realização das atividades, os procedimentos foram divididos em três etapas principais:

### 2.1. Configuração do Ambiente
Os experimentos foram realizados em ambiente Linux, utilizando um Ambiente Virtual (venv) para isolamento das dependências. As principais bibliotecas instaladas foram o `opencv-python` para visão computacional, `numpy` para o suporte às matrizes de pixels e `matplotlib` para renderização de resultados estáticos dentro do notebook.



### 2.2. Execução da Parte 1 (Análise Técnica)
Os scripts fornecidos foram executados via terminal para validar as funções básicas da biblioteca. O foco foi entender como o OpenCV interpreta as *flags* de leitura, como gerencia o tempo de espera entre quadros e como codifica matrizes de dados para arquivos de vídeo permanentes.

### 2.3. Obtenção de Mídia (Parte 2)
Utilizando os códigos adaptados, a equipe realizou a captura de fotos e vídeos. Foram testados diferentes cenários de iluminação e velocidade de movimento para observar a resposta do sensor da webcam e a eficácia da gravação no formato AVI/XVID.

## 3. Análise e Discussão: Processamento Básico

### (A) Leitura de Imagem (L__1_img.py)

In [14]:
import numpy as np
import cv2 as cv

img = cv.imread('messi5.jpg',0)
cv.imshow('image',img)
k = cv.waitKey(0)
if k == 27:         # wait for ESC key to exit
    cv.destroyAllWindows()
elif k == ord('s'): # wait for 's' key to save and exit
    cv.imwrite('messigray.png',img)
    cv.destroyAllWindows()

**Pergunta:** Por que a janela aberta não mostra a imagem colorida?

**Resposta:** A janela exibe a imagem em tons de cinza devido ao parâmetro numérico utilizado no método cv.imread('messi5.jpg', 0). Este segundo argumento, conhecido como flag, determina como o OpenCV deve interpretar os canais de cor durante a leitura do arquivo: o valor 0 instrui o programa a converter a imagem para uma matriz de apenas um canal de intensidade luminosa (escala de cinza) no momento da importação. Caso o objetivo fosse visualizar a imagem colorida, seria necessário utilizar a flag 1, que carrega os três canais de cor no padrão BGR, ou a flag -1, que mantém a imagem original incluindo possíveis canais de transparência. Assim, a exibição em preto e branco é resultado direto dessa configuração de leitura, que simplifica a matriz de pixels para facilitar determinadas operações de processamento.

### (B) Leitura de Vídeo (L__2_video.py)
**Alteração de Velocidade Código Original:**


In [15]:
import time
import numpy as np
import cv2 as cv

cap = cv.VideoCapture('big_buck_bunny.mp4')

while(cap.isOpened()):
    ret, frame = cap.read()
    
    if ret==True:
        # show the frame
        cv.imshow('frame',frame)

        #wait next frame by 40ms - 25fps
        time.sleep(1/25.0) 
        
        if cv.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break
               
cap.release()
cv.destroyAllWindows()


**Alteração de Velocidade Código Acelerado:**

In [16]:
import time
import numpy as np
import cv2 as cv

cap = cv.VideoCapture('big_buck_bunny.mp4')

while(cap.isOpened()):
    ret, frame = cap.read()
    
    if ret==True:
        # show the frame
        cv.imshow('frame',frame)
        #Alterado de 1/25 para 1/50, acelerando o vídeo
        #wait next frame by 20ms - 50fps
        time.sleep(1/50.0) 
        
        if cv.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break
               
cap.release()
cv.destroyAllWindows()

**Alteração de Velocidade Código Desacelerado:**

In [17]:
import time
import numpy as np
import cv2 as cv

cap = cv.VideoCapture('big_buck_bunny.mp4')

while(cap.isOpened()):
    ret, frame = cap.read()
    
    if ret==True:
        # show the frame
        cv.imshow('frame',frame)
        #Alterado de 1/25 para 1/10, desacelerando o vídeo
        #wait next frame by 100ms - 10fps
        time.sleep(1/10.0) 
        
        if cv.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break
               
cap.release()
cv.destroyAllWindows()

### Solução
A velocidade de exibição é controlada pelo tempo de espera entre a renderização de um frame e o próximo dentro do laço de repetição. 

No código do OpenCV, esse controle é feito principalmente pelo método cv.waitKey(delay), onde o parâmetro numérico define quantos milissegundos o programa deve aguardar antes de prosseguir para a próxima iteração. Para aumentar a velocidade do vídeo, diminuímos esse valor, fazendo com que os frames sejam processados de forma quase instantânea, enquanto para tornar a exibição mais lenta, aumentamos o valor do parâmetro, forçando o programa a pausar por mais tempo entre cada imagem.

Embora métodos como o time.sleep() também possam ser utilizados para pausar a execução em segundos, o cv.waitKey() é a ferramenta técnica ideal em processamento de imagens, pois além de controlar o tempo, ele é o responsável por atualizar a interface gráfica da janela e garantir que o sistema operacional não considere o programa travado durante a exibição da sequência de frames que compõe o vídeo.

### (C) Captura de Webcam (L__3_webcam.py)

In [10]:
import numpy as np
import cv2 as cv

cap = cv.VideoCapture(0)

if not cap.isOpened():
    print("Cannot open camera")
    exit()

while True:
    # Capture frame-by-frame
    ret, frame = cap.read()
    # if frame is read correctly ret is True
    if not ret:
        print("Can't receive frame (stream end?). Exiting ...")
        break
    
    # Display the resulting frame
    cv.imshow('frame', frame)
    

    # Alteração feita para que o código tire a foto com 'x'
    if cv.waitKey(1) == ord('x'):
        cv.imwrite("foto1.png", frame)
        break
    

# When everything done, release the capture
cap.release()
cv.destroyAllWindows()

### Solução
Para capturar a imagem da webcam, instanciamos o objeto cv.VideoCapture(0). A leitura é feita dentro de um laço de repetição (while), permitindo a atualização constante dos frames.

Em cada iteração, utilizamos o método cap.read(), que nos retorna dois valores: um booleano (ret), que confirma se o hardware enviou o dado com sucesso, e a matriz de pixels do frame atual (frame).

A exibição em tempo real é feita por cv.imshow(). Para capturar a foto, implementamos uma estrutura condicional utilizando cv.waitKey(1). Esta função é essencial, pois ela aguarda por 1 milissegundo a entrada de uma tecla.

Ao detectarmos que a tecla pressionada foi o 'x' (verificado via ord('x')), o programa interrompe o fluxo normal e executa o método cv.imwrite("foto1.png", frame). Este comando codifica a matriz frame presente na memória RAM e a grava no armazenamento persistente (disco rígido) com o nome e extensão especificados.

### (D) Gravação de Vídeo (L__4_webcap.py)

In [23]:
import numpy as np
import cv2 as cv
cap = cv.VideoCapture(0)

# Get current width of frame
width = cap.get(cv.CAP_PROP_FRAME_WIDTH)   # float
# Get current height of frame
height = cap.get(cv.CAP_PROP_FRAME_HEIGHT) # float
# Define Video Frame Rate in fps
fps = 30.0

# Define the codec and create VideoWriter object
fourcc = cv.VideoWriter_fourcc(*'XVID')
out = cv.VideoWriter('objeto-rapido.avi', fourcc, fps, (int(width),int(height)) )

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        print("Can't receive frame (stream end?). Exiting ...")
        break
    #Essa linha de código abaixo foi responsável pela inversão da imagem
    #frame = cv.flip(frame,qcx 0)
    # write the flipped frame
    out.write(frame)
    cv.imshow('frame', frame)
    if cv.waitKey(1) == ord('q'):
        break

# Release everything if job is finished
cap.release()
out.release()
cv.destroyAllWindows()

### Solução
A gravação do vídeo é realizada através da criação de um objeto cv.VideoWriter, que atua como o codificador responsável por consolidar os frames capturados em um arquivo final. 

Para configurar este objeto, primeiramente extraímos as dimensões nativas da câmera (largura e altura) utilizando o método cap.get(), garantindo que o arquivo de saída tenha a mesma resolução do sensor. Definimos o parâmetro fps em 30.0 para estabelecer a taxa de quadros por segundo e utilizamos o FourCC com o código 'XVID' para especificar o formato de compressão AVI. 

Dentro do laço de repetição, cada matriz de pixels capturada pela webcam é enviada para o método out.write(frame), que grava o quadro atual no arquivo de forma sequencial. Para garantir que a imagem não fosse salva de cabeça para baixo ou espelhada, comentamos a função cv.flip(), mantendo a orientação original dos dados. 

Ao final, o método out.release() é fundamental para encerrar o processo de escrita e fechar o arquivo corretamente, assegurando que o vídeo não seja corrompido e possa ser reproduzido normalmente por qualquer player de mídia.

**Pergunta:** Se for necessário alterar a imagem, ou seja realizando alguma operação de procesamento nela, em que 
ponto dos quatro programas estudados isso deve ser realizado?

**Resposta:** Para realizar qualquer operação de processamento de imagem nos programas estudados, a alteração deve ser feita dentro do laço de repetição (while), especificamente após a captura do frame e antes de sua exibição ou gravação.

Nos quatro programas, esse é o ponto crítico onde a imagem existe na memória RAM como uma matriz de pixels disponível para manipulação. Se o processamento for feito antes de cv.imshow(), o usuário verá o efeito em tempo real na tela; se for feito antes de cv.imwrite() ou out.write(), o resultado processado será o que ficará salvo no arquivo final.

Realizar a operação fora desse ponto tornaria o processamento ineficaz: se feita antes do cap.read(), não haveria dados para processar; se feita após o fechamento do laço, o processamento ocorreria apenas no último frame capturado ou após o encerramento da transmissão. Portanto, o fluxo ideal de PDI nesses scripts segue a ordem: Captura -> Processamento -> Exibição -> Gravação.

## 4. Parte 2: Obtenção de Fotos e Vídeos
Nesta etapa, utilizamos os scripts desenvolvidos e corrigidos na Fase 1 para capturar mídias reais da equipe. O foco foi aplicar os conceitos de captura de frame (`cap.read`), codificação de vídeo (`VideoWriter`) e salvamento de imagem (`imwrite`).

### 4.1. Foto Geral da Equipe e Montagem Avatar
Conforme solicitado, capturamos uma imagem da equipe e realizamos uma composição com nossos respectivos avatares.

**Integrantes e Cores:**
* Gabriel (Batman): Camisa Preta
* Eduardo (Luffy): Camisa Azul
* Lucas (Spiderman): Camisa Branca

#### Foto Geral

In [None]:
import numpy as np
import cv2 as cv

img_equipe = cv.imread('foto-geral.png')

if img_equipe is None:
    print("Erro: Arquivo 'foto-geral.png' não encontrado.")
else:
    cv.imshow('Foto Geral da Equipe', img_equipe)
    
    k = cv.waitKey(0) & 0xFF
    
    if k == 27:
        cv.destroyAllWindows()
    elif k == ord('s'): 
        cv.imwrite('foto_geral_copia.png', img_equipe)
        cv.destroyAllWindows()

#### Foto Composta

In [None]:
import numpy as np
import cv2 as cv

img_avatar = cv.imread('foto_avatar.png')

if img_avatar is None:
    print("Erro: Arquivo 'foto_avatar.png' não encontrado.")
else:
    cv.imshow('Montagem Avatar', img_avatar)
    
    k = cv.waitKey(0) & 0xFF
    
    if k == 27:
        cv.destroyAllWindows()
    elif k == ord('s'): 
        cv.imwrite('foto_avatar_copia.png', img_avatar)
        cv.destroyAllWindows()

### 4.2. Galeria de Vídeos (Pessoas e Objetos)
Abaixo, apresentamos os códigos de reprodução baseados no script `L__2_video.py`. Cada vídeo foi gravado com uma taxa de 30 FPS e a velocidade de reprodução foi ajustada no `cv.waitKey()` para garantir fidelidade ao movimento original.

#### Video 1 - Movimento Rápido (Pessoa)

In [None]:
import time
import numpy as np
import cv2 as cv

cap = cv.VideoCapture('movimento-rapido.avi')

while(cap.isOpened()):
    ret, frame = cap.read()
    
    if ret==True:
        cv.imshow('Movimento Rapido - Pessoa', frame)
        time.sleep(1/30.0) 
        
        if cv.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break
               
cap.release()
cv.destroyAllWindows()

#### Vídeo 2 - Movimento Lento (Pessoa)

In [None]:
import time
import numpy as np
import cv2 as cv

cap = cv.VideoCapture('movimento-lento.avi')

while(cap.isOpened()):
    ret, frame = cap.read()
    
    if ret==True:
        cv.imshow('Movimento Lento - Pessoa', frame)
        time.sleep(1/30.0) 
        
        if cv.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break
               
cap.release()
cv.destroyAllWindows()

#### Vídeo 3 - Objeto Lento

In [1]:
import time
import numpy as np
import cv2 as cv

cap = cv.VideoCapture('objeto-lento.avi')

while(cap.isOpened()):
    ret, frame = cap.read()
    
    if ret==True:
        cv.imshow('Objeto - Lento', frame)
        time.sleep(1/30.0) 
        
        if cv.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break
               
cap.release()
cv.destroyAllWindows()

#### Vídeo 4 - Objeto Rápido

In [None]:
import time
import numpy as np
import cv2 as cv

cap = cv.VideoCapture('objeto-rapido.avi')

while(cap.isOpened()):
    ret, frame = cap.read()
    
    if ret==True:
        cv.imshow('Objeto - Rapido', frame)
        time.sleep(1/30.0) 
        
        if cv.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break
               
cap.release()
cv.destroyAllWindows()

# 5. Conclusão

## 5. Conclusão

A realização deste laboratório permitiu a compreensão prática de como a biblioteca OpenCV gerencia a entrada e saída de dados visuais. Através da execução e adaptação dos scripts propostos, foi possível observar que uma imagem digital, no contexto de processamento, é tratada tecnicamente como uma matriz multidimensional de pixels (NumPy Array), e que o vídeo nada mais é do que uma sucessão temporal rápida dessas matrizes.

Os experimentos evidenciaram pontos fundamentais para o desenvolvimento de sistemas de visão computacional:

* **Controle de Fluxo e Temporização:** A importância do uso correto de funções como `cv.waitKey()` e `time.sleep()` para sincronizar a taxa de quadros (FPS). Observou-se que pequenas alterações nesses parâmetros impactam diretamente na percepção de velocidade do movimento capturado.
* **Interatividade e Gatilhos:** A implementação bem-sucedida de comandos de teclado (como a tecla 'x' para salvar fotos e 'q' para encerrar processos) demonstrou como criar interfaces funcionais que integram o hardware da câmera com a lógica do software.
* **Gestão de Recursos:** A necessidade rigorosa de liberar os dispositivos de captura (`cap.release()`) e destruir as janelas de exibição ao final da execução, prática essencial para evitar o travamento do Kernel no ambiente Jupyter.
* **Pipeline de Processamento:** A identificação do ponto crítico dentro do laço `while` para a inserção de algoritmos de manipulação, garantindo que qualquer processamento ocorra entre a captura do dado bruto e a sua saída final (exibição ou gravação).



Em suma, as atividades da **Parte 1** forneceram a base técnica necessária, enquanto a **Parte 2** consolidou o aprendizado através da produção de mídia própria. O material gerado pela equipe — as fotos com destaque cromático (RGB), a montagem dos avatares e os vídeos de movimentos lentos e rápidos — constitui uma base de dados real que será fundamental para a aplicação de técnicas avançadas de filtragem e análise nas próximas etapas da disciplina.