# ***Laboratório 3 - Captura de Imagem e Vídeo***

## **Integrantes:**
- Matheus Foresto Moselli
- Marcos Vinicius Medeiros da Silva
- Karl Eloy Marques Henrique

**Data do experimento:** 20/02/2026 <br/>
**Data de publicação do relatório:** 27/02/2026

## Introdução
Este relatório documenta os resultados das atividades realizadas Laboratório 3 da disciplina Processamento Digital de Imagens, focado na manipulação de entradas e saídas de imagem e vídeo usando Python e OpenCV. O experimento teve por objetivo explorar conceitos fundamentais como leitura, exibição e armazenamento de arquivos e controle de temporização via software.

A estrutura do experimento foi dividida em duas frentes principais: primeiramente, o estudo de funções da biblioteca OpenCV como cv.imread, cv.VideoCapture e o controle de temporização via software, essencial para ajustar a velocidade de reprodução de vídeos. Na sequência, aplicamos esses conceitos para a captura de dados reais através da webcam, explorando a interação entre o código e o hardware para salvar fotos e vídeos em formatos específicos (PNG e AVI).

##  Procedimentos Experimentais
Nessa sessão, vamos resolver os exercícios propostos no laboratório utilizando os arquivos fornecidos pelo professor (localizados na pasta *arquivos_base*)

In [4]:
# Código do programa L__1_img

import cv2 as cv

img = cv.imread('arquivos_base/messi5.jpg',0) # IMPORTANTE!
cv.imshow('image',img)
k = cv.waitKey(0)
if k == 27:         # wait for ESC key to exit
    cv.destroyAllWindows()
elif k == ord('s'): # wait for 's' key to save and exit
    cv.imwrite('messigray.png',img)
    cv.destroyAllWindows()

**Pergunta:** Por que a janela aberta não mostra a imagem colorida?

**Resposta:** Ao analisar o código e a documentação da biblioteca openCV (utilizada para leitura de imagens), podemos observar que, na linha 6, estamos lendo a imagem da seguinte forma:

`img = cv.imread('arquivos_base/messi5.jpg',0)`.

Após verificar a [documentação oficial da biblioteca](https://docs.opencv.org/4.x/d4/da8/group__imgcodecs.html), na sessão *cv::imread*, vemos que o primeiro parâmetro corresponde ao caminho do arquivo a ser carregado em memória e o segundo (que passamos o valor 0), corresponde a *flag* da imagem, um inteiro do tipo *IMREAD_COLOR_BGR* (portanto, esse parâmetro é o responsável em dizer qual deve ser as cores carregadas da imagem). Ao entrar na [documentação do *IMREAD_COLOR_BGR*](https://docs.opencv.org/4.x/d8/d6a/group__imgcodecs__flags.html#gga61d9b0126a3e57d9277ac48327799c80a27f321425cc2e42ab85f2f46d4e0fc31), VEMOS QUE o *cv::IMREAD_GRAYSCALE*=0. Portanto, a imagem foi carregada em escala de cinza pois passamos 0 no segundo parametro da função `cv.imread()`



In [7]:
# Código do programa L__2_video

import time
import cv2 as cv

cap = cv.VideoCapture('arquivos_base/big_buck_bunny.mp4')

while(cap.isOpened()):
    ret, frame = cap.read()

    if ret==True:
        # show the frame
        cv.imshow('frame',frame)

        #wait next frame by 40ms - 25fps
        time.sleep(1/10.0)

        if cv.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break

cap.release()
cv.destroyAllWindows()

**Instruções:** Modifique o programa para que as imagens sejam exibidas mais rápidamente e depois
para que sejam exibidas mais lentamente.

**Pergunta:** Qual a explicação de alteração de velocidade de exibição? Apresente suas soluções detalhadamente.

In [8]:
# Código sem sleep

import time
import cv2 as cv

cap = cv.VideoCapture('arquivos_base/big_buck_bunny.mp4')

while(cap.isOpened()):
    ret, frame = cap.read()

    if ret==True:
        # show the frame
        cv.imshow('frame',frame)

        #wait next frame by 40ms - 25fps
        #time.sleep(1/10.0)

        if cv.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break

cap.release()
cv.destroyAllWindows()

Podemos observar que, ao remover a linha `time.sleep()`, o vídeo passou a ser exibido extremamente rápido. Com isso, podemos concluir que a velocidade do vídeo depende diretamente dessa pausa (sem ela ele irá processar o mais rapido possível).

Através da [documentação oficial](https://docs.python.org/pt-br/3/library/time.html#time.sleep), vemos que a função recebe um parâmetro que representa os segundos que a *thread* em que o programa está executando deve ficar congelada.

Assim, analisando o código original `time.sleep(1/10.0)`, temos que o programa irá realizar uma pausa de 40ms a cada loop dentro do while (ou seja, cada frame vai ser exibido durante 40ms).

Sabemos que fps = frames per second, ou, matematicamente, frames/segundos. Com isso, podemos controlar quantos fps o video tem, pois, como a função `time.sleep()` recebe segundos no parâmetro, e frames é uma unidade sem dimensão (como graus), basta passar 1/fps nos parâmetros que iremos obter o valor desejado.

Agora, vamos verificar se nossa análise está correta:

In [9]:
# Video exibido rapidamente (60 fps)

import time
import cv2 as cv

cap = cv.VideoCapture('arquivos_base/big_buck_bunny.mp4')

while(cap.isOpened()):
    ret, frame = cap.read()

    if ret==True:
        # show the frame
        cv.imshow('frame',frame)

        #wait next frame by 17ms - 60fps
        time.sleep(1/60.0)

        if cv.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break

cap.release()
cv.destroyAllWindows()

In [10]:
# Video exibido lentamente (10 fps)

import time
import cv2 as cv

cap = cv.VideoCapture('arquivos_base/big_buck_bunny.mp4')

while(cap.isOpened()):
    ret, frame = cap.read()

    if ret==True:
        # show the frame
        cv.imshow('frame',frame)

        #wait next frame by 100ms - 60fps
        time.sleep(1/10.0)

        if cv.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break

cap.release()
cv.destroyAllWindows()

Portanto, concluimos que a análise realizada estava correta.

In [3]:
# programa para realizar a gravação dos vídeos do item 3) c) (adaptado do exercício 4):

import cv2 as cv
cap = cv.VideoCapture(0)

width = cap.get(cv.CAP_PROP_FRAME_WIDTH)
height = cap.get(cv.CAP_PROP_FRAME_HEIGHT)

fps = 10.0 # alterar pra um valor alto pra capturar os videos rápidos

fourcc = cv.VideoWriter_fourcc(*'XVID')
out = cv.VideoWriter('videos_coletados/saida.avi', fourcc, fps, (int(width),int(height)) )

while cap.isOpened():
    ret, frame = cap.read()

    if not ret:
        print("Can't receive frame (stream end?). Exiting ...")
        break

    out.write(frame)
    cv.imshow('frame', frame)

    if cv.waitKey(1) == ord('q'):
        break

cap.release()
out.release()
cv.destroyAllWindows()

### Análise e discussão dos estudos realizados
A realização dos exercícios propostos durante esse laboratório possibilitou compreender como o fluxo de captura, processamento e armazenamento de imagem e vídeo funciona em um ambiente computacional. O estudo da documentação técnica das bibliotecas utilizadas colocou-se como um ponto chave para compreender os conceitos necessários para realizar determinadas operações nos programas. Tal compreensão possibilitou a observação de que a ausência de cores na imagem exibida pelo primeiro programa ocorreu devido a passagem do valor inteiro "0" como parâmetro na função cv.imread(), interpretado pela biblioteca OpenCV como um comando para exibir a imagem na escala de cinza.

A utilização da webcam como meio de captura de imagem e vídeo demonstrou a relevância da captura síncrona, na qual o software precisa ser capaz de amostrar a sequência de imagens e, ao mesmo tempo, acompanhar os comandos de teclado. A implementação da função de salvamento de fotos ao pressionar a tecla 'x' demonstrou como eventos de interrupção podem ser usados para obter dados específicos sem interromper a execução do algorítmo. De maneira semelhante, para garantir que o vídeo final exibisse uma velocidade compatível com o movimento real capturado, foi necessário ajustar a taxa de quadros ao gravar arquivos no formato AVI.

Por fim, foi possível constatar que qualquer operação de processamento digital, seja ela destinada a filtragem ou a alteração de brilho e contraste, deve ser inserida no ponto do código imediatamente após a captura do quadro e antes da exibição ou gravação do mesmo. Essa lógica garante que todas as saídas reflitam as modificações aplicadas pelo programa.

### Conclusões
TBD

In [None]:
# Ex3:

import numpy as np
import cv2 as cv

cap = cv.VideoCapture(0)

if not cap.isOpened():
    print("Cannot open camera")
    exit()

while True:
    # Capture frame-by-frame
    ret, frame = cap.read()
    # if frame is read correctly ret is True
    if not ret:
        print("Can't receive frame (stream end?). Exiting ...")
        break

    # Display the resulting frame
    cv.imshow('frame', frame)

    if cv.waitKey(1) == ord('q'):
        break
    if cv.waitKey(1) == ord('x'):
        cv.imwrite("foto1.png", frame)
        break

# When everything done, release the capture
cap.release()
cv.destroyAllWindows()

In [None]:
# Ex4:

import numpy as np
import cv2 as cv
cap = cv.VideoCapture(0)

# Get current width of frame
width = cap.get(cv.CAP_PROP_FRAME_WIDTH)   # float
# Get current height of frame
height = cap.get(cv.CAP_PROP_FRAME_HEIGHT) # float
# Define Video Frame Rate in fps
fps = 60.0

# Define the codec and create VideoWriter object
fourcc = cv.VideoWriter_fourcc(*'XVID')
out = cv.VideoWriter('saida.avi', fourcc, fps, (int(width),int(height)) )

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        print("Can't receive frame (stream end?). Exiting ...")
        break
    #frame = cv.flip(frame, 0)
    # write the flipped frame
    out.write(frame)
    cv.imshow('frame', frame)
    if cv.waitKey(1) == ord('q'):
        break

# Release everything if job is finished
cap.release()
out.release()
cv.destroyAllWindows()

## **Parte 2**

In [2]:
#Ex1
import matplotlib.pyplot as plt

# 1. Referenciando o caminho (igual ao que você fez)
caminho = 'img/final.png'
img = cv.imread(caminho)

# 3. Converter de BGR (OpenCV) para RGB (Matplotlib)
img_rgb = cv.cvtColor(img, cv.COLOR_BGR2RGB)

# 4. Exibir a imagem dentro do Notebook
plt.imshow(img_rgb)
plt.axis('off') # Opcional: esconde as réguas com números nos eixos
plt.show()
# Converter de BGR para RGB
img_rgb = cv.cvtColor(img, cv.COLOR_BGR2RGB)

# Exibir dentro do notebook
plt.imshow(img_rgb)
plt.axis('off') # Remove os eixos com números
plt.show()


A module that was compiled using NumPy 1.x cannot be run in
NumPy 2.4.2 as it may crash. To support both 1.x and 2.x
versions of NumPy, modules must be compiled with NumPy 2.0.
Some module may need to rebuild instead e.g. with 'pybind11>=2.12'.

If you are a user of the module, the easiest solution will be to
downgrade to 'numpy<2' or try to upgrade the affected module.
We expect that some modules will need time to support NumPy 2.

Traceback (most recent call last):  File "<frozen runpy>", line 198, in _run_module_as_main
  File "<frozen runpy>", line 88, in _run_code
  File "C:\Users\MICRO\AppData\Roaming\Python\Python311\site-packages\ipykernel_launcher.py", line 18, in <module>
    app.launch_new_instance()
  File "C:\Users\MICRO\AppData\Roaming\Python\Python311\site-packages\traitlets\config\application.py", line 1075, in launch_instance
    app.start()
  File "C:\Users\MICRO\AppData\Roaming\Python\Python311\site-packages\ipykernel\kernelapp.py", line 758, in start
    self.io_lo

AttributeError: _ARRAY_API not found

ImportError: numpy.core.multiarray failed to import

## Referências:
OPENCV. Flags used for image file reading and writing. Versão 3.4.20-dev. Disponível em: https://docs.opencv.org/3.4/d8/d6a/group__imgcodecs__flags.html. Acesso em: 20.fev. 2026