<a href="https://colab.research.google.com/github/guilherme-argentino/fiap-ia4devs-techchallenge-fase4/blob/main/Fase4_Tech_Challenge.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [50]:
# Instalar dependências necessárias
!pip install google-generativeai opencv-python opencv-python-headless matplotlib gdown



In [51]:
# Importar bibliotecas
import gdown
import os
import cv2
import numpy as np
import google.generativeai as gemini
import time
import base64

In [52]:
# Configurar a API Key do Gemini
API_KEY = "..."  # Substitua pela sua chave de API Gemini
gemini.configure(api_key=API_KEY)
model = gemini.GenerativeModel('gemini-1.5-flash')

In [53]:
# Baixar o vídeo diretamente do Google Drive
VIDEO_ID = "1B5PbZdUDi-r7Ac7BK3a3WdNppfQqM_Ne"  # ID do arquivo no Google Drive
VIDEO_PATH = "/content/video.mp4"
gdown.download(f"https://drive.google.com/uc?id={VIDEO_ID}", VIDEO_PATH, quiet=False)

Downloading...
From: https://drive.google.com/uc?id=1B5PbZdUDi-r7Ac7BK3a3WdNppfQqM_Ne
To: /content/video.mp4
100%|██████████| 38.3M/38.3M [00:00<00:00, 86.6MB/s]


'/content/video.mp4'

In [54]:
# Função para capturar frames do vídeo
def extract_frames(video_path, frame_interval=30):
    cap = cv2.VideoCapture(video_path)
    frames = []
    frame_ids = []
    frame_index = 0

    while cap.isOpened():
        ret, frame = cap.read()
        if not ret:
            break

        if frame_index % frame_interval == 0:
            frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            frames.append(frame_rgb)
            frame_ids.append(frame_index)

        frame_index += 1

    cap.release()
    return frames, frame_ids

# Função para analisar um frame usando Gemini
def analyze_frame_with_gemini(frame_id, image):
    # Converter o frame para string base64
    _, buffer = cv2.imencode('.jpg', image)
    encoded_image = base64.b64encode(buffer).decode('utf-8')  # Correct encoding

    # Criar a descrição do pedido
    prompt = f"""
    Este é o frame {frame_id} de um vídeo.

    Analise as seguintes informações:
        1. Identifique rostos presentes e descreva emoções (alegria, tristeza, etc.).
        2. Detecte atividades humanas visíveis no frame.
        3. Identifique quaisquer movimentos ou padrões anômalos no frame.
        Retorne o resumo detalhado das observações.
    """

    # Enviar prompt para o modelo Gemini
    response = model.generate_content([{'mime_type':'image/jpeg', 'data': encoded_image}, prompt])

    return response.text # Access the generated text using .text

In [55]:
# Processar vídeo
frames, frame_ids = extract_frames(VIDEO_PATH, frame_interval=360)
print(f"{len(frames)} frames extraídos para análise.")

# Variáveis para relatório
total_anomalies = 0
emotion_summary = []
activity_summary = []

KeyboardInterrupt: 

In [None]:
# Analisar frames
print("Processando frames com o Gemini...")

for frame_id, frame in zip(frame_ids, frames):
    try:
        result = analyze_frame_with_gemini(frame_id, frame)
        if result:
            print(f"Frame {frame_id} analisado.")
            emotion_summary.append(result)  # Adicionar as emoções detectadas
            # Exemplo de detecção de "anomalia" baseada no conteúdo textual
            if "anomalia" in result.lower():
                total_anomalies += 1
    except Exception as e:  # Catch any exception
        print(f"Erro durante a análise do frame {frame_id}: {e}")
        break  # Exit the loop immediately

# Relatório Final
print("\n--- Relatório ---")
print(f"Total de frames analisados: {len(frames)}")
print(f"Número de anomalias detectadas: {total_anomalies}")
print("Resumo de emoções e atividades:")
for summary in emotion_summary:
    print(summary)
