<a href="https://colab.research.google.com/github/DouglasDiasEng/Action-Recognition-/blob/main/Guia_passo_a_passo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Instalação das Bibliotecas

Para começar, instalamos duas bibliotecas essenciais: **OpenCV** e **TensorFlow Hub**, que serão usadas para processar os vídeos e carregar o modelo pré-treinado de reconhecimento de ações.



In [16]:
!pip install -q opencv-python tensorflow_hub

## Importação das Bibliotecas

Neste trecho, importamos todas as bibliotecas necessárias para processamento de vídeo, carregamento do modelo, manipulação de arquivos temporários e exibição de resultados no notebook.
O print exibi a versão atual do TensorFlow instalada no ambiente, garantindo que é compatível com o modelo a ser carregado.

In [17]:
import tensorflow as tf
import tensorflow_hub as hub
from google.colab.patches import cv2_imshow
import re
import os
import tempfile
import ssl
import cv2
import numpy as np
from urllib import request
from IPython.display import HTML
from base64 import b64encode

print("TensorFlow version: ", tf.__version__)

TensorFlow version:  2.19.0


## Carregando os Rótulos do Kinetics-400

O modelo I3D utiliza a lista de ações do dataset **Kinetics-400**, que contém 400 classes diferentes.  
Neste trecho, fazemos o download dessa lista diretamente do repositório oficial e a carregamos em uma lista Python.


In [18]:
url_classes = 'https://raw.githubusercontent.com/deepmind/kinetics-i3d/master/data/label_map.txt'
with request.urlopen(url_classes) as file:
  label = [row.decode('utf-8').strip() for row in file.readlines()]

print("Total de classes: ", len(label))
print("Algumas classes: ", label[:10])

Total de classes:  400
Algumas classes:  ['abseiling', 'air drumming', 'answering questions', 'applauding', 'applying cream', 'archery', 'arm wrestling', 'arranging flowers', 'assembling computer', 'auctioning']


## Configuração Inicial para Download dos Vídeos

Antes de processar qualquer vídeo, precisamos definir onde eles serão buscados e onde serão armazenados temporariamente no ambiente.  
Neste trecho, criamos essas configurações e definimos uma função para listar vídeos conhecidos.

In [19]:
root_folder = 'https://www.crcv.ucf.edu/THUMOS14/UCF101/UCF101/'
context = ssl._create_unverified_context()
cache_videos = tempfile.mkdtemp()
print("Pasta temporária para vídeos:", cache_videos)

def list_videos():
  known_videos = [
    'v_PizzaTossing_g23_c03.avi',
    'v_ApplyEyeMakeup_g01_c01.avi',
    'v_Archery_g01_c01.avi'
]
  return known_videos

print("Lista de vídeos conhecidos:", list_videos())

Pasta temporária para vídeos: /tmp/tmpulyhkzxp
Lista de vídeos conhecidos: ['v_PizzaTossing_g23_c03.avi', 'v_ApplyEyeMakeup_g01_c01.avi', 'v_Archery_g01_c01.avi']


## Função para Baixar e Armazenar o Vídeo Localmente

Esta função é responsável por fazer o download de um vídeo da internet e salvar em uma pasta temporária.  
Caso o vídeo já tenha sido baixado antes, ela evita o download repetido.

In [20]:
def save_video(video_name):
  cache_path = os.path.join(cache_videos, video_name)
  if not os.path.exists(cache_path):
    url_path = request.urljoin(root_folder, video_name)
    print("Baixando de:", url_path)
    data = request.urlopen(url_path, context=context).read()
    with open(cache_path, 'wb') as f:
      f.write(data)
    print("Video salvo em:", cache_path)
  else:
    print("Vídeo já existe em cache:", cache_path)
  return cache_path

video_name = 'v_PizzaTossing_g23_c03.avi'
video_path = save_video(video_name)

print("Caminho final do vídeo:", video_path)
print("Arquivo existe?", os.path.exists(video_path))

Baixando de: https://www.crcv.ucf.edu/THUMOS14/UCF101/UCF101/v_PizzaTossing_g23_c03.avi
Video salvo em: /tmp/tmpulyhkzxp/v_PizzaTossing_g23_c03.avi
Caminho final do vídeo: /tmp/tmpulyhkzxp/v_PizzaTossing_g23_c03.avi
Arquivo existe? True


## Função para Carregar o Vídeo com OpenCV

Esta função lê um vídeo salvo em disco, extrai os frames, redimensiona para o tamanho esperado pelo modelo e converte tudo em um array NumPy normalizado entre 0 e 1.

In [24]:
def load_video(path, visualize=False):
  cap = cv2.VideoCapture(path)
  frames = []

  if not cap.isOpened():
    print("Não foi possível abrir o vídeo:", path)
    return np.array([])

  while True:
    connected, frame = cap.read()
    if not connected:
      break


    frame = cv2.resize(frame, (224, 224))
    frames.append(frame)

  cap.release()

  if not frames:
    print("Nenhum frame foi lido do vídeo.")
    return np.array([])

  frames = np.array(frames, dtype=np.float32)

  if visualize and frames.size > 0:
    cv2_imshow(frames[0].astype(np.uint8))

  return frames / 255.0

video_frames = load_video(video_path, visualize=False)
print("Formato do array de frames:", video_frames.shape)

Formato do array de frames: (148, 224, 224, 3)
