# O que são arquivos de vídeo?

Arquivos de vídeo, na realidade, combinam áudio e vídeo em um único formato comprimido.

Quando temos diversas imagens passando rapidamente pelos nossos olhos, temos a impressão de movimento:

![](./resources/horse.jpg)

Se unirmos isso a uma trilha sonora, temos um vídeo!

## Taxa de quadros (frame rate)

Para uma impressão fluida de movimento, diversas imagens precisam ser reproduzidas a cada segundo.

O número de imagens a cada segundo determina a **taxa de quadros**, também conhecida por *frame rate* ou FPS (*frames per second*).

![](./resources/fps.png)

Quanto maior o FPS, maior a "fluidez" do vídeo, mas também maior a quantidade de informação armazenada e processada.

No cinema, o padrão é 24 FPS.

Na televisão, esse valor pode ser de 30 FPS, 50 FPS, ou até mesmo 60 FPS (algumas TVs mais modernas inclusive fazem o "preenchimento" de frames, por isso os filmes podem parecer mais "fluídos" do que deveriam).

## Compressão e formatos

Se cada imagem do vídeo for gravada de forma independente, seria necessário um grande volume para armazenar e processar cada imagem. No lugar disso, arquivos de vídeo em geral armazenam apenas a **diferença** entre frames, o que reduz bastante a sobrecarga no processamento:

![](./resources/codecs.png)

Um algoritmo capaz de fazer esse processamento (também para a trilha sonora) é chamado de **codec** (encoder-decoder). Para criarmos um vídeo em determinado formato, e também para conseguir rodá-lo depois, é preciso ter o codec específico instalado.

![](./resources/av.png)

Com os codecs, os vídeos se tornam arquivos muito mais leves que as suas imagens individuais!

## Trabalhando com arquivos de vídeo

Vamos acessar um arquivo de vídeo da internet, baixá-lo e extrair seus frames para uma pasta:

https://videos.pexels.com/video-files/15921892/15921892-uhd_3840_2160_50fps.mp4

In [3]:
from pathlib import Path

caminho = Path('videos')
caminho.mkdir(parents=True, exist_ok=True)

In [4]:
import requests

url = "https://videos.pexels.com/video-files/15921892/15921892-uhd_3840_2160_50fps.mp4"
video_data = requests.get(url, stream=True)

caminho_video = caminho / 'video.mp4'
with open(caminho_video, 'wb') as f:
    for chunk in video_data.iter_content(chunk_size=1024**2):
        f.write(chunk)
        print('.', end='')

print('\nFinalizado!')

................................................
Finalizado!


Agora vamos usar a biblioteca OpenCV para extrair os frames individuais desse vídeo:

In [5]:
caminho_frames = caminho / 'frames'
caminho_frames.mkdir(parents=True, exist_ok=True)

In [6]:
import cv2

captura = cv2.VideoCapture(str(caminho_video))
sucesso, frame = captura.read()
count = 0

while sucesso:
    nome_frame = f"frame{count:03d}.jpg"
    cv2.imwrite(str(caminho_frames / nome_frame), frame)
    print('.', end='')
    sucesso, frame = captura.read()
    count += 1

print('\nFinalizado!')

.............................................

KeyboardInterrupt: 

## O que isso significa para IAs?

Existem IAs que operam sobre um vídeo inteiro. Mas mesmo quando não temos uma disponível, podemos usar as IAs de imagem e passar frames individuais para serem processados!

Como vimos, os frames mudam muito pouco. Portanto podemos usar uma lógica para extrair um frame a cada N frames, ou então a cada X segundos: 

In [8]:
captura = cv2.VideoCapture(str(caminho_video))
sucesso, frame = captura.read()
fps = int(captura.get(cv2.CAP_PROP_FPS))
fps

50

In [9]:
count = 0
while sucesso:
    if count % fps == 0:
        nome_frame = f"frame{count:03d}.jpg"
        cv2.imwrite(str(caminho_frames / nome_frame), frame)
        print('.', end='')
    sucesso, frame = captura.read()
    count += 1

print('\nFinalizado!')

................
Finalizado!
