<a href="https://colab.research.google.com/github/SamuelPassamani/XCam/blob/main/xcam-colab/XCam_REC_V4.6.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# C√©lula 1: Configura√ß√µes Auxiliares, Par√¢metros Globais e Log Centralizado

**Objetivo:**  
Esta c√©lula inicializa e centraliza todas as vari√°veis globais, par√¢metros essenciais e agora tamb√©m fornece um utilit√°rio robusto para o log √∫nico do notebook XCam.  
Permite ajuste r√°pido e seguro do comportamento do notebook, incluindo limites de processamento, controle de grava√ß√£o, commit autom√°tico e mecanismos de resili√™ncia contra transmiss√µes problem√°ticas.

## Principais pontos e melhorias implementadas

- **Centraliza√ß√£o dos par√¢metros globais:**  
  Todos os valores cr√≠ticos (limites, thresholds, caminhos) s√£o definidos e propagados como globais pelo notebook.
- **Log √∫nico modular e estruturado (`xcam_master.log`):**  
  Todas as opera√ß√µes relevantes (busca, grava√ß√£o, blacklist, commit, erros, etc.) agora s√£o registradas em um √∫nico arquivo JSON Lines.  
  Cada entrada inclui sess√£o, evento, id, username, timestamps, status e detalhes.
- **Fun√ß√µes utilit√°rias para o log:**  
  Adi√ß√£o, busca, remo√ß√£o e atualiza√ß√£o de eventos s√£o facilitadas por fun√ß√µes modulares (CRUD), promovendo robustez, rastreabilidade e f√°cil manuten√ß√£o.
- **Blacklist, falhas e processamento padronizados por `id`:**  
  Toda l√≥gica de controle √© feita via identificador √∫nico, com `username` para exibi√ß√£o, garantindo unicidade e eliminando inconsist√™ncias.
- **Fun√ß√£o interativa para sele√ß√£o de transmiss√µes espec√≠ficas:**  
  Permite ao usu√°rio informar nomes de usu√°rios para filtrar transmiss√µes antes do processamento.
- **Coment√°rios detalhados:**  
  Cada etapa do c√≥digo est√° documentada para orientar ajustes, manuten√ß√£o e integra√ß√£o por toda a equipe.

---

## Par√¢metros globais controlados nesta c√©lula

- **`LIMIT_DEFAULT`**: Quantidade m√°xima de transmiss√µes processadas em paralelo/lote.
- **`PAGE_DEFAULT`**: P√°gina inicial para busca na API.
- **`RECORD_SECONDS`**: Tempo m√°ximo de grava√ß√£o de cada v√≠deo (em segundos).
- **`RECORD_SECONDS_MIN`**: Tempo m√≠nimo exigido para considerar o v√≠deo v√°lido (em segundos).
- **`API_SEARCH_LIMIT`**: Limite de transmiss√µes retornadas ao buscar usu√°rios espec√≠ficos.
- **`COMMIT_PUSH_THRESHOLD`**: Quantidade de transmiss√µes processadas at√© realizar commit/push autom√°tico (0 = commit imediato a cada grava√ß√£o).
- **`LOG_PATH`**: Caminho do arquivo √∫nico de log (JSONL).
- **`BLACKLIST_TIMEOUT`**: Tempo de expira√ß√£o da blacklist (em segundos).
- **`BLACKLIST_MAX_FAILURES`**: Quantidade de falhas consecutivas antes de banir temporariamente o usu√°rio.

---

## Estrutura do log √∫nico (`xcam_master.log`)

Cada entrada segue o modelo:
```json
{
  "timestamp": "2025-06-06T06:15:00Z",
  "sessao": "busca|grava√ß√£o|blacklist|commit|erro|...",
  "evento": "...",
  "id": "...",         // identificador √∫nico (prim√°rio)
  "username": "...",   // nome do usu√°rio para exibi√ß√£o
  "status": "...",     // ok|erro|blacklisted|expirado|...
  "detalhes": "...",   // informa√ß√µes adicionais
}
```

---

## Fun√ß√µes utilit√°rias para o log

- **`append_log(entry, log_path=LOG_PATH)`**: Adiciona uma nova entrada ao log central.
- **`read_logs(log_path=LOG_PATH)`**: L√™ todas as entradas do log.
- **`query_logs(...)`**: Consulta entradas do log por filtros opcionais (sess√£o, id, status, etc).
- **`remove_logs(condition_fn, log_path=LOG_PATH)`**: Remove todas as entradas que satisfa√ßam a condi√ß√£o.
- **`update_log_entry(match_fn, update_fn, log_path=LOG_PATH)`**: Atualiza entradas do log conforme regra.

---

## Exemplo de uso das fun√ß√µes (a serem aplicadas nas pr√≥ximas c√©lulas)

```python
append_log({
    "sessao": "busca",
    "evento": "encontrado",
    "id": "abc123",
    "username": "Manugic_",
    "status": "ok",
    "detalhes": "URL v√°lida"
})

# Consultar blacklist:
logs_blacklist = query_logs(sessao="blacklist", status="blacklisted")

# Remover registros expirados:
remove_logs(lambda entry: entry["sessao"] == "processing" and expirou(entry), log_path=LOG_PATH)

# Atualizar status:
update_log_entry(lambda e: e["id"]=="abc123", lambda e: e.update({"status":"ok"}))
```

---

## Fun√ß√£o interativa

Permite ao usu√°rio informar transmiss√µes espec√≠ficas a serem gravadas antes de iniciar o processamento.

---

## Seguran√ßa, rastreabilidade e manuten√ß√£o

- Todos os par√¢metros globais s√£o definidos no in√≠cio e propagados para todo o notebook, garantindo consist√™ncia.
- O log √∫nico fornece rastreabilidade detalhada e elimina arquivos dispersos (blacklist, falha, etc).
- Ajuste qualquer valor diretamente nesta c√©lula para alterar o comportamento global do notebook de forma segura.
- Coment√°rios detalhados auxiliam a compreens√£o, integra√ß√£o e manuten√ß√£o por toda a equipe.

---

In [None]:
# =====================================================================================
# XCam REC - C√©lula de Configura√ß√£o Global e Logs
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.S√©rio [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.2
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta c√©lula √© o n√∫cleo de configura√ß√£o e controle para todo o notebook de grava√ß√£o.
# Ela centraliza todos os par√¢metros, limites, timeouts e caminhos de arquivos,
# garantindo que todas as opera√ß√µes subsequentes sejam consistentes e facilmente ajust√°veis.
# Al√©m disso, implementa um sistema de logging robusto e centralizado em um √∫nico
# arquivo (JSONL), com fun√ß√µes utilit√°rias para manipula√ß√£o (CRUD), promovendo
# m√°xima rastreabilidade e facilitando a depura√ß√£o.
#
# [@mode]
# Esta c√©lula funciona como a base de setup para todos os modos de opera√ß√£o do
# notebook, seja em modo de busca autom√°tica ou grava√ß√£o de usu√°rios espec√≠ficos.
# =====================================================================================

# =====================================================================================
# 2. Configura√ß√µes & Vari√°veis Globais
# =====================================================================================

# --- Imports Essenciais ---
from google.colab import drive  # M√≥dulo para interagir com o Google Drive
import os                       # M√≥dulo para intera√ß√µes com o sistema operacional (pastas, arquivos)
import json                     # M√≥dulo para manipula√ß√£o de dados no formato JSON
from datetime import datetime   # M√≥dulo para trabalhar com datas e horas
import time                     # M√≥dulo para fun√ß√µes relacionadas a tempo (ex: sleep, timestamps)

# --- Montagem do Google Drive ---
# Garante que o Google Drive esteja acess√≠vel para persist√™ncia dos dados.
drive.mount('/content/drive')

# --- Par√¢metros Globais Edit√°veis ---
# Ajuste estes valores para controlar o comportamento de todo o notebook.

# Limites e thresholds de processamento
LIMIT_DEFAULT = 50              # Define a quantidade m√°xima de grava√ß√µes que podem ocorrer em paralelo.
PAGE_DEFAULT = 1                # Define a p√°gina inicial para buscas na API do XCam.
RECORD_SECONDS = 12780          # Define o tempo m√°ximo de grava√ß√£o de cada v√≠deo, em segundos (aprox. 3.5 horas).
RECORD_SECONDS_MIN = 660        # Define o tempo m√≠nimo que um v√≠deo precisa ter para ser considerado v√°lido.
API_SEARCH_LIMIT = 1500         # Limite de resultados ao buscar por usu√°rios espec√≠ficos na API.
COMMIT_PUSH_THRESHOLD = 25      # N√∫mero de grava√ß√µes conclu√≠das para disparar um commit autom√°tico para o GitHub.

# Configura√ß√µes da Blacklist
BLACKLIST_TIMEOUT = 15 * 60     # Tempo que um usu√°rio permanece na blacklist, em segundos (15 minutos).
BLACKLIST_MAX_FAILURES = 3      # N√∫mero de falhas consecutivas de grava√ß√£o para um usu√°rio ser adicionado √† blacklist.

# --- Caminhos Centralizados (Google Drive) ---
# Define todos os caminhos de forma centralizada para f√°cil manuten√ß√£o.
DRIVE_BASE_PATH = "/content/drive/MyDrive/XCam.Drive/src"               # Pasta raiz do projeto no Drive.
DRIVE_LOGS_PATH = os.path.join(DRIVE_BASE_PATH, "logs")                 # Pasta para todos os arquivos de log.
DRIVE_POSTERS_TEMP_PATH = os.path.join(DRIVE_BASE_PATH, "temp", "posters") # Pasta para p√¥steres tempor√°rios.
DRIVE_RECORDS_TEMP_PATH = os.path.join(DRIVE_BASE_PATH, "temp", "records") # Pasta para v√≠deos tempor√°rios.
DRIVE_ARCHIVE_BASE_PATH = "/content/drive/MyDrive/XCam.Drive/user"      # Pasta de arquivamento final dos dados por usu√°rio.

# --- Nomes de Arquivos de Log Espec√≠ficos ---
# Define os nomes dos arquivos de log que ser√£o criados dentro de DRIVE_LOGS_PATH.
MASTER_LOG_FILE = os.path.join(DRIVE_LOGS_PATH, "xcam_master.log")         # Log principal com todos os eventos.
BLACKLIST_LOG_FILE = os.path.join(DRIVE_LOGS_PATH, "xcam_blacklist.log")   # Log de usu√°rios em blacklist.
FAILURE_LOG_FILE = os.path.join(DRIVE_LOGS_PATH, "xcam_failures.log")     # Log de contagem de falhas.
PROCESSING_LOG_FILE = os.path.join(DRIVE_LOGS_PATH, "xcam_processing.log")  # Log de usu√°rios em processamento.

# --- Verifica√ß√£o e Cria√ß√£o de Diret√≥rios ---
# Garante que as pastas de destino existam para evitar erros de "Arquivo n√£o encontrado".
os.makedirs(DRIVE_LOGS_PATH, exist_ok=True)
os.makedirs(DRIVE_POSTERS_TEMP_PATH, exist_ok=True)
os.makedirs(DRIVE_RECORDS_TEMP_PATH, exist_ok=True)
os.makedirs(DRIVE_ARCHIVE_BASE_PATH, exist_ok=True)
print("‚úÖ Pastas do Google Drive verificadas/criadas com sucesso.")

# --- Propaga√ß√£o de Vari√°veis Globais ---
# Torna todas as configura√ß√µes acima acess√≠veis em qualquer outra c√©lula do notebook.
globals().update({
    'LIMIT_DEFAULT': LIMIT_DEFAULT,
    'PAGE_DEFAULT': PAGE_DEFAULT,
    'RECORD_SECONDS': RECORD_SECONDS,
    'RECORD_SECONDS_MIN': RECORD_SECONDS_MIN,
    'API_SEARCH_LIMIT': API_SEARCH_LIMIT,
    'COMMIT_PUSH_THRESHOLD': COMMIT_PUSH_THRESHOLD,
    'BLACKLIST_TIMEOUT': BLACKLIST_TIMEOUT,
    'BLACKLIST_MAX_FAILURES': BLACKLIST_MAX_FAILURES,
    'DRIVE_LOGS_PATH': DRIVE_LOGS_PATH,
    'DRIVE_POSTERS_TEMP_PATH': DRIVE_POSTERS_TEMP_PATH,
    'DRIVE_RECORDS_TEMP_PATH': DRIVE_RECORDS_TEMP_PATH,
    'DRIVE_ARCHIVE_BASE_PATH': DRIVE_ARCHIVE_BASE_PATH,
    'MASTER_LOG_FILE': MASTER_LOG_FILE,
    'BLACKLIST_LOG_FILE': BLACKLIST_LOG_FILE,
    'FAILURE_LOG_FILE': FAILURE_LOG_FILE,
    'PROCESSING_LOG_FILE': PROCESSING_LOG_FILE
})


# =====================================================================================
# 3. Corpo
# =====================================================================================

# --- Fun√ß√µes Utilit√°rias para Log Centralizado (JSONL) ---

def now_iso():
    """Retorna o timestamp atual em formato UTC ISO 8601, padr√£o para logs."""
    return datetime.utcnow().isoformat() + "Z"

def append_log(entry, log_path=MASTER_LOG_FILE):
    """Adiciona uma nova entrada ao arquivo de log especificado."""
    # Garante que toda entrada de log tenha um timestamp.
    entry.setdefault("timestamp", now_iso())
    # Garante que os campos essenciais para rastreabilidade existam na entrada.
    for field in ["sessao", "evento", "id", "username", "status"]:
        entry.setdefault(field, "")
    # Abre o arquivo em modo 'append' (a) e escreve a nova entrada como uma linha JSON.
    with open(log_path, "a", encoding="utf-8") as f:
        f.write(json.dumps(entry, ensure_ascii=False) + "\\n")

def read_logs(log_path=MASTER_LOG_FILE):
    """L√™ e retorna todas as entradas de um arquivo de log JSONL."""
    # Se o arquivo n√£o existir, retorna uma lista vazia para evitar erros.
    if not os.path.exists(log_path):
        return []
    # Abre o arquivo para leitura e converte cada linha de JSON para um dicion√°rio Python.
    with open(log_path, "r", encoding="utf-8") as f:
        return [json.loads(line) for line in f if line.strip()]

def query_logs(sessao=None, id=None, username=None, evento=None, status=None, after=None, before=None, log_path=MASTER_LOG_FILE):
    """Consulta entradas de log com base em m√∫ltiplos filtros opcionais."""
    # L√™ todos os logs do arquivo.
    logs = read_logs(log_path)
    filtered_logs = []
    # Itera sobre cada entrada de log para aplicar os filtros.
    for entry in logs:
        if sessao and entry.get("sessao") != sessao: continue
        if id and entry.get("id") != id: continue
        if username and entry.get("username") != username: continue
        if evento and entry.get("evento") != evento: continue
        if status and entry.get("status") != status: continue
        # Filtra por intervalo de tempo, se especificado.
        ts = entry.get("timestamp")
        if after and ts < (after.isoformat() if isinstance(after, datetime) else after): continue
        if before and ts > (before.isoformat() if isinstance(before, datetime) else before): continue
        filtered_logs.append(entry)
    return filtered_logs

def remove_logs(condition_fn, log_path=MASTER_LOG_FILE):
    """Remove entradas de um log que satisfa√ßam uma fun√ß√£o de condi√ß√£o."""
    logs = read_logs(log_path)
    # Cria uma nova lista apenas com os logs que devem ser mantidos.
    kept_logs = [entry for entry in logs if not condition_fn(entry)]
    # Reescreve o arquivo de log com a lista filtrada.
    with open(log_path, "w", encoding="utf-8") as f:
        for entry in kept_logs:
            f.write(json.dumps(entry, ensure_ascii=False) + "\\n")
    # Retorna o n√∫mero de entradas removidas.
    return len(logs) - len(kept_logs)

def update_log_entry(match_fn, update_fn, log_path=MASTER_LOG_FILE):
    """Atualiza uma ou mais entradas de log que correspondam a uma fun√ß√£o de busca."""
    logs = read_logs(log_path)
    updated_count = 0
    # Itera sobre os logs e aplica a fun√ß√£o de atualiza√ß√£o.
    for entry in logs:
        if match_fn(entry):
            update_fn(entry)
            updated_count += 1
    # Reescreve o arquivo com os logs atualizados.
    with open(log_path, "w", encoding="utf-8") as f:
        for entry in logs:
            f.write(json.dumps(entry, ensure_ascii=False) + "\\n")
    return updated_count

# --- Fun√ß√£o Interativa para Sele√ß√£o de Usu√°rios ---

def perguntar_transmissoes_especificas():
    """Pergunta ao usu√°rio se deseja gravar transmiss√µes espec√≠ficas."""
    # Captura a resposta do usu√°rio.
    resp = input('Deseja gravar alguma transmiss√£o espec√≠fica? (sim/n√£o): ').strip().lower()
    # Se a resposta for afirmativa, solicita a lista de usu√°rios.
    if resp.startswith('s'):
        usuarios_input = input('Informe o(s) nome(s) de usu√°rio, separados por v√≠rgula: ')
        # Limpa e formata a entrada do usu√°rio em uma lista de nomes.
        return [u.strip() for u in usuarios_input.split(',') if u.strip()]
    # Retorna uma lista vazia se a resposta for negativa.
    return []

# =====================================================================================
# 4. Rodap√© / Fim do C√≥digo
# =====================================================================================
# @log de mudan√ßas
# - v4.6.2 (01/07/2025): Refatora√ß√£o para o padr√£o de documenta√ß√£o XCam. Adi√ß√£o de
#   coment√°rios detalhados, centraliza√ß√£o de caminhos do Drive e organiza√ß√£o
#   estrutural para melhor clareza e manuten√ß√£o.
# - v4.6.1 (01/07/2025): Centraliza√ß√£o dos caminhos de arquivos tempor√°rios e logs
#   para subpastas dedicadas no Google Drive, melhorando a organiza√ß√£o.
# - v4.6.0: Vers√£o inicial da C√©lula 1 com sistema de log centralizado.
#
# @roadmap futuro
# - Migrar a l√≥gica de controle de blacklist e falhas (atualmente em arquivos
#   separados na C√©lula 6) para usar exclusivamente o MASTER_LOG_FILE,
#   centralizando 100% da l√≥gica de estado.
# - Refatorar as fun√ß√µes de log para uma classe `Logger` dedicada, melhorando
#   o encapsulamento e a organiza√ß√£o do c√≥digo.
# =====================================================================================

# C√©lula 2: Instala√ß√£o e Valida√ß√£o do ffmpeg

**Objetivo:**  
Esta c√©lula garante que o utilit√°rio `ffmpeg` esteja instalado e dispon√≠vel no ambiente Google Colab. O ffmpeg √© indispens√°vel para a grava√ß√£o dos v√≠deos das transmiss√µes e para o processamento de m√≠dia ao longo do pipeline do notebook XCam.

## Pontos principais e melhorias implementadas

- **Verifica√ß√£o pr√©-instala√ß√£o:**  
  Antes de instalar, verifica se o ffmpeg j√° est√° dispon√≠vel no ambiente, tornando o processo idempotente e eficiente.
- **Instala√ß√£o automatizada:**  
  Efetua a instala√ß√£o via `apt-get` apenas se necess√°rio, reduzindo o tempo de setup em execu√ß√µes futuras.
- **Valida√ß√£o p√≥s-instala√ß√£o:**  
  Exibe a vers√£o instalada do ffmpeg, garantindo transpar√™ncia e rastreabilidade.
- **Mensagens detalhadas:**  
  O usu√°rio recebe logs informativos sobre cada etapa, facilitando o diagn√≥stico em caso de erros.
- **Design modular:**  
  Estrutura pronta para ser utilizada em outros ambientes (Colab, local, server) com pequenas adapta√ß√µes.

---

## Como funciona a c√©lula

- **Verifica se o ffmpeg est√° instalado (no PATH do sistema).**
- **Se n√£o estiver, instala automaticamente via apt-get.**
- **Valida e exibe a vers√£o instalada ap√≥s o processo.**
- **Em caso de falha, exibe erro detalhado e interrompe o fluxo para evitar inconsist√™ncias futuras.**

---

## Exemplo de uso das fun√ß√µes nesta c√©lula

```python
if not is_ffmpeg_installed():
    install_ffmpeg()
show_ffmpeg_version()
```

---

## Seguran√ßa, rastreabilidade e manuten√ß√£o

- A c√©lula torna o setup do ambiente mais robusto, impedindo falhas silenciosas relacionadas √† aus√™ncia de ffmpeg.
- Mensagens e valida√ß√µes ajudam a equipe a identificar rapidamente problemas de ambiente ou permiss√µes.
- O padr√£o modular facilita a reutiliza√ß√£o do c√≥digo em diferentes notebooks ou pipelines do projeto XCam.

---

In [None]:
# ================================================================
# C√©lula 2: Instala√ß√£o e Valida√ß√£o do FFMPEG no Colab
# ================================================================
# Objetivo:
# - Garantir que o utilit√°rio ffmpeg est√° instalado e dispon√≠vel no ambiente
# - Validar a instala√ß√£o e exibir a vers√£o instalada
# - Tornar a etapa idempotente, evitando instala√ß√µes desnecess√°rias
# - Fornecer feedback claro e orienta√ß√µes em caso de erro
#
# Estrat√©gia aplicada:
# - Instala√ß√£o via apt-get apenas se ffmpeg n√£o estiver dispon√≠vel
# - Valida√ß√£o p√≥s-instala√ß√£o
# - Logs claros e coment√°rios detalhados para rastreabilidade
# ================================================================

import subprocess

def is_ffmpeg_installed():
    """
    Verifica se o ffmpeg est√° instalado e dispon√≠vel no PATH do sistema.
    Retorna True se estiver, False caso contr√°rio.
    """
    try:
        result = subprocess.run(["ffmpeg", "-version"], capture_output=True, text=True)
        return result.returncode == 0
    except FileNotFoundError:
        return False

def install_ffmpeg():
    """
    Instala o ffmpeg via apt-get caso n√£o esteja presente.
    """
    print("[INFO] Instalando ffmpeg via apt-get...")
    # Atualiza pacotes e instala ffmpeg silenciosamente
    !apt-get update -y > /dev/null
    !apt-get install -y ffmpeg > /dev/null
    print("[INFO] ffmpeg instalado com sucesso.")

def show_ffmpeg_version():
    """
    Exibe a vers√£o instalada do ffmpeg.
    """
    print("[INFO] Vers√£o do ffmpeg instalada:")
    !ffmpeg -version | head -n 2

# ============================
# EXECU√á√ÉO DA ETAPA DE SETUP
# ============================

if not is_ffmpeg_installed():
    print("[WARN] ffmpeg n√£o encontrado no ambiente.")
    install_ffmpeg()
    if not is_ffmpeg_installed():
        raise RuntimeError("[ERRO] Falha ao instalar o ffmpeg. Verifique permiss√µes ou tente novamente.")
else:
    print("[OK] ffmpeg j√° est√° instalado no ambiente.")

# Valida√ß√£o final e exibi√ß√£o da vers√£o
show_ffmpeg_version()

# ============================
# FIM DA C√âLULA 2
# ============================

# Dica: ffmpeg deve estar dispon√≠vel para todas as c√©lulas subsequentes.
# Se precisar de um caminho espec√≠fico, utilize `which ffmpeg` para obter o path absoluto.

# C√©lula 3: Imports Essenciais, Utilit√°rios e Prepara√ß√£o do Ambiente

**Objetivo:**  
Importa todas as bibliotecas essenciais do Python necess√°rias para o funcionamento do notebook, incluindo m√≥dulos para requisi√ß√µes HTTP, processamento paralelo, manipula√ß√£o de datas, controle de subprocessos e exibi√ß√£o interativa.  
Centraliza fun√ß√µes utilit√°rias robustas e padronizadas para processamento, download de poster, gera√ß√£o autom√°tica de poster com ffmpeg e exibi√ß√£o de progresso.  

## Principais pontos e melhorias implementadas

- **Centraliza√ß√£o de imports essenciais:**  
  Todos os m√≥dulos fundamentais (os, requests, multiprocessing, datetime, json, time, subprocess, math, re, IPython) est√£o dispon√≠veis e prontos para uso global.
- **Fun√ß√µes utilit√°rias padronizadas:**  
  Fun√ß√µes para formata√ß√£o de segundos, exibi√ß√£o de progresso, download e valida√ß√£o de poster e gera√ß√£o de poster via ffmpeg foram refatoradas e documentadas, seguindo arquitetura modular e Clean Architecture.
- **Remo√ß√£o de logs tempor√°rios dispersos:**  
  O antigo arquivo de log de processamento tempor√°rio foi descontinuado em favor do log √∫nico centralizado definido na C√©lula 1, promovendo rastreabilidade e controle total.
- **Robustez e clareza:**  
  Todas as fun√ß√µes possuem tratamento de erros, mensagens amig√°veis e s√£o preparadas para uso concorrente e integra√ß√£o com as pr√≥ximas etapas do pipeline.
- **Pronto para uso em todo o notebook:**  
  As fun√ß√µes aqui definidas s√£o utilizadas em toda a automa√ß√£o, garantindo reuso, legibilidade e manuten√ß√£o facilitada.

---

## Fun√ß√µes utilit√°rias dispon√≠veis nesta c√©lula

- **`format_seconds(seconds)`**: Formata um valor em segundos para string leg√≠vel (ex: "1h23m45s").
- **`log_progress(username, elapsed_seconds, total_seconds)`**: Exibe o progresso da grava√ß√£o de cada transmiss√£o.
- **`download_and_save_poster(poster_url, username, temp_folder)`**: Baixa e salva o poster da transmiss√£o a partir de uma URL remota ou retorna se for um caminho local.
- **`generate_poster_with_ffmpeg(m3u8_url, username, temp_folder, frame_time=7, timeout=20)`**: Gera automaticamente um poster usando ffmpeg, ap√≥s validar a disponibilidade do stream.
- **`is_poster_valid(poster_path)`**: Verifica se o arquivo de poster √© v√°lido (existe e n√£o est√° vazio).

---

## Exemplo de uso das fun√ß√µes

```python
# Formatar segundos em string leg√≠vel
tempo = format_seconds(385)
# Exibir progresso
log_progress("userNovo234", 385, 12780)
# Download do poster
poster_path = download_and_save_poster(url_poster, "userNovo234", "/content/temp")
# Gera√ß√£o autom√°tica de poster via ffmpeg (se necess√°rio)
if not is_poster_valid(poster_path):
    poster_path = generate_poster_with_ffmpeg(m3u8_url, "userNovo234", "/content/temp")
```

---

## Seguran√ßa, rastreabilidade e manuten√ß√£o

- Todas as fun√ß√µes s√£o preparadas para tratamento de erros e integra√ß√£o com processos concorrentes.
- O log tempor√°rio de processamento foi removido, garantindo que todo o rastreio e auditoria sejam feitos via log √∫nico centralizado da C√©lula 1.
- Coment√°rios detalhados facilitam manuten√ß√£o, entendimento e evolu√ß√£o do notebook.

---

In [None]:
# =====================================================================================
# XCam REC - C√©lula 3: Utilit√°rios Essenciais e Prepara√ß√£o do Ambiente
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.S√©rio [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.1
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta c√©lula √© respons√°vel por importar todas as bibliotecas Python essenciais para
# a execu√ß√£o do pipeline de grava√ß√£o e por definir um conjunto de fun√ß√µes
# utilit√°rias robustas e padronizadas. As fun√ß√µes aqui presentes s√£o usadas
# em todo o notebook para tarefas como formata√ß√£o de tempo, exibi√ß√£o de progresso,
# download de p√¥steres e gera√ß√£o autom√°tica de thumbnails via ffmpeg, garantindo
# modularidade, reuso de c√≥digo e f√°cil manuten√ß√£o.
#
# [@mode]
# As fun√ß√µes e imports definidos nesta c√©lula s√£o de prop√≥sito geral e servem de
# base para todas as opera√ß√µes do notebook, independentemente do modo de execu√ß√£o.
# =====================================================================================

# =====================================================================================
# 2. Configura√ß√µes & Vari√°veis Globais (Imports)
# =====================================================================================

# --- Imports Essenciais ---
import os                          # M√≥dulo para intera√ß√µes com o sistema operacional (pastas, arquivos).
import requests                    # Biblioteca para fazer requisi√ß√µes HTTP de forma simples e elegante.
from multiprocessing import Manager, Process # M√≥dulos para habilitar o processamento paralelo e acelerar as grava√ß√µes.
from datetime import datetime      # M√≥dulo para trabalhar com datas e horas.
import json                        # M√≥dulo para manipula√ß√£o de dados no formato JSON.
import time                        # M√≥dulo para fun√ß√µes relacionadas a tempo (ex: sleep, timestamps).
import subprocess                  # M√≥dulo para executar processos externos, como o ffmpeg.
import math                        # M√≥dulo com fun√ß√µes matem√°ticas (ex: arredondamento).
import re                          # M√≥dulo para trabalhar com express√µes regulares, √∫til para extrair dados de texto.
import shutil                      # M√≥dulo com opera√ß√µes de alto n√≠vel em arquivos e cole√ß√µes de arquivos.
import threading                   # M√≥dulo para trabalhar com threads, usado para controle de concorr√™ncia (locks).

# --- Imports Espec√≠ficos do Ambiente (IPython/Colab) ---
from IPython import get_ipython    # Fun√ß√£o para obter a inst√¢ncia atual do IPython (√∫til para detectar o ambiente).
from IPython.display import display # Fun√ß√£o para renderizar objetos de forma rica no notebook.


# =====================================================================================
# 3. Corpo
# =====================================================================================

# --- Fun√ß√µes Utilit√°rias de Formata√ß√£o e Progresso ---

def format_seconds(seconds):
    """
    Converte um n√∫mero total de segundos em uma string de formato amig√°vel (ex: "1h23m45s").
    Ideal para logs e exibi√ß√£o de dura√ß√£o de v√≠deos.
    """
    total_seconds = int(seconds)  # Garante que estamos trabalhando com um n√∫mero inteiro.
    # Usa divmod para obter horas e o resto da divis√£o.
    hours, remainder = divmod(total_seconds, 3600)
    # Usa divmod novamente no resto para obter minutos e segundos.
    minutes, seconds = divmod(remainder, 60)
    
    parts = [] # Lista para armazenar as partes do tempo formatado.
    if hours > 0: parts.append(f"{hours}h")
    if minutes > 0: parts.append(f"{minutes}m")
    # Adiciona os segundos se houver, ou se for a √∫nica unidade de tempo.
    if seconds > 0 or not parts: parts.append(f"{seconds}s")
    
    return "".join(parts) # Junta as partes em uma √∫nica string.

def log_progress(username, elapsed_seconds, total_seconds):
    """
    Imprime uma linha de progresso formatada para uma grava√ß√£o em andamento.
    Inclui nome de usu√°rio, tempo decorrido, tempo restante e porcentagem.
    """
    # Calcula a porcentagem, garantindo que n√£o ultrapasse 100%.
    percent = min((elapsed_seconds / total_seconds) * 100, 100)
    # Formata o tempo decorrido.
    tempo = format_seconds(elapsed_seconds)
    # Calcula os minutos gravados e restantes para uma vis√£o r√°pida.
    minutos_gravados = math.floor(elapsed_seconds / 60)
    minutos_restantes = max(0, math.ceil((total_seconds - elapsed_seconds) / 60))
    # Imprime a linha de log formatada.
    print(f"‚è±Ô∏è [{username}] Gravados: {minutos_gravados} min | Restantes: {minutos_restantes} min | Tempo total: {tempo} ‚Äî üìä {percent:.1f}% conclu√≠do")

# --- Fun√ß√µes Utilit√°rias para Manipula√ß√£o de P√¥steres ---

def download_and_save_poster(poster_url, username, temp_folder=DRIVE_POSTERS_TEMP_PATH):
    """
    Baixa um p√¥ster de uma URL e o salva em uma pasta tempor√°ria.
    Retorna o caminho do arquivo salvo ou None em caso de falha.
    """
    # Se a URL j√° for um caminho de arquivo local existente, apenas o retorna.
    if os.path.exists(poster_url):
        return poster_url
    
    # Verifica se a URL √© uma string e come√ßa com "http".
    if isinstance(poster_url, str) and poster_url.startswith("http"):
        try:
            # Faz a requisi√ß√£o GET para a URL do p√¥ster com um timeout.
            response = requests.get(poster_url, timeout=15)
            # Levanta um erro se a resposta n√£o for bem-sucedida (status code n√£o for 2xx).
            response.raise_for_status()
            
            # Padroniza a extens√£o do arquivo para .jpg para consist√™ncia.
            ext = ".jpg"
            # Constr√≥i o caminho completo para o arquivo tempor√°rio.
            poster_temp_path = os.path.join(temp_folder, f"{username}_poster_temp{ext}")
            
            # Salva o conte√∫do da resposta no arquivo.
            with open(poster_temp_path, "wb") as f:
                f.write(response.content)
            
            print(f"üñºÔ∏è Poster baixado em: {poster_temp_path}")
            return poster_temp_path
        except Exception as e:
            # Em caso de qualquer erro (timeout, status ruim, etc.), loga e retorna None.
            print(f"‚ùå Erro ao baixar poster {poster_url}: {e}")
            return None
    else:
        # Se a URL n√£o for v√°lida, loga o erro e retorna None.
        print(f"‚ùå poster_url inv√°lido: {poster_url}")
        return None

def generate_poster_with_ffmpeg(m3u8_url, username, temp_folder=DRIVE_POSTERS_TEMP_PATH, frame_time=7, timeout=20):
    """
    Gera um p√¥ster (thumbnail) a partir de um stream de v√≠deo usando o ffmpeg.
    Primeiro, verifica se o stream est√° online para evitar chamadas desnecess√°rias ao ffmpeg.
    """
    try:
        # Faz uma requisi√ß√£o HEAD (mais leve) para verificar a disponibilidade do stream.
        head_resp = requests.head(m3u8_url, timeout=5)
        if not head_resp.ok:
            # Se o stream n√£o estiver acess√≠vel, loga e retorna None.
            print(f"‚ö†Ô∏è Stream offline para {username} (status {head_resp.status_code})")
            return None
    except Exception as e:
        # Se houver um erro de conex√£o, loga e retorna None.
        print(f"‚ö†Ô∏è Erro de conex√£o ao stream de {username}: {e}")
        return None

    # Define o caminho de sa√≠da para o p√¥ster gerado.
    poster_ffmpeg_path = os.path.join(temp_folder, f"{username}_poster_ffmpeg.jpg")
    # Constr√≥i o comando ffmpeg para capturar um √∫nico frame do v√≠deo.
    command = ["ffmpeg", "-y", "-ss", str(frame_time), "-i", m3u8_url, "-vframes", "1", "-q:v", "2", poster_ffmpeg_path]
    
    try:
        print(f"üé¨ Gerando poster com ffmpeg para {username}...")
        # Executa o comando ffmpeg com um timeout para evitar que o processo trave.
        result = subprocess.run(command, stdout=subprocess.PIPE, stderr=subprocess.PIPE, timeout=timeout)
        # Se o comando foi bem-sucedido e o arquivo foi criado...
        if result.returncode == 0 and os.path.exists(poster_ffmpeg_path):
            print(f"üñºÔ∏è Poster gerado via ffmpeg: {poster_ffmpeg_path}")
            return poster_ffmpeg_path
        else:
            # Caso contr√°rio, loga a sa√≠da de erro do ffmpeg.
            print(f"‚ùå ffmpeg falhou para {username}. STDERR: {result.stderr.decode(errors='ignore')}")
            return None
    except subprocess.TimeoutExpired:
        # Se o comando demorar demais, loga o timeout.
        print(f"‚è∞ Tempo excedido ao gerar poster para {username}.")
        return None
    except Exception as e:
        # Lida com outros erros inesperados.
        print(f"‚ùå Erro inesperado ao gerar poster: {e}")
        return None

def is_poster_valid(poster_path):
    """
    Verifica se um caminho de p√¥ster √© v√°lido, ou seja, se o arquivo existe e n√£o est√° vazio.
    """
    return poster_path and os.path.exists(poster_path) and os.path.getsize(poster_path) > 0


# =====================================================================================
# 4. Rodap√© / Fim do C√≥digo
# =====================================================================================
# @log de mudan√ßas
# - v4.6.1 (01/07/2025): Refatora√ß√£o completa da c√©lula para o padr√£o de documenta√ß√£o
#   XCam, com adi√ß√£o de coment√°rios detalhados e organiza√ß√£o estrutural.
#   Os caminhos tempor√°rios foram atualizados para usar as vari√°veis globais do Drive.
# - v4.6.0: Vers√£o inicial da C√©lula 3 com fun√ß√µes utilit√°rias.
#
# @roadmap futuro
# - Refatorar as fun√ß√µes utilit√°rias em classes dedicadas (ex: `class VideoUtils`,
#   `class PosterManager`) para melhorar o encapsulamento e a testabilidade.
# - Integrar um sistema de cache para os p√¥steres para reduzir o n√∫mero de downloads
#   e gera√ß√µes via ffmpeg em execu√ß√µes repetidas.
# =====================================================================================

# C√©lula 4: Clonagem do Reposit√≥rio GitHub no Colab e Google Drive

**Objetivo:**  
Esta c√©lula garante que o reposit√≥rio do projeto XCam seja sempre clonado de forma limpa e sincronizada no ambiente local do Colab e, se dispon√≠vel, tamb√©m no Google Drive para persist√™ncia.  
Assegura ambiente pronto, atualizado, seguro para grava√ß√µes e processamento, e prepara diret√≥rios padronizados para integra√ß√£o com o restante do pipeline.

## Principais pontos e melhorias implementadas

- **Clonagem idempotente e limpa:**  
  Remove reposit√≥rios antigos antes de clonar para evitar conflitos, arquivos √≥rf√£os ou problemas de sincroniza√ß√£o.
- **Clonagem para ambiente tempor√°rio e persistente:**  
  O reposit√≥rio √© clonado tanto para `/content` (Colab) quanto para o Drive (`/content/drive/MyDrive/XCam.Drive`) se o Drive estiver montado.
- **Prepara√ß√£o de diret√≥rios de grava√ß√£o e processamento:**  
  Estrutura de diret√≥rios tempor√°rios criada automaticamente, garantindo organiza√ß√£o dos dados.
- **Exporta√ß√£o de vari√°veis globais:**  
  Todos os caminhos, URLs e configura√ß√µes relevantes s√£o disponibilizados via `globals().update()` para uso em todo o notebook.
- **Mensagens e valida√ß√µes detalhadas:**  
  Feedback informativo sobre o status de cada etapa, facilitando o diagn√≥stico e a manuten√ß√£o.
- **Pronto para CI/CD e integra√ß√µes futuras:**  
  Token e URLs preparados para automa√ß√µes, integra√ß√µes externas e uploads (Abyss.to, etc).

---

## Par√¢metros globais definidos nesta c√©lula

- **`GITHUB_USER`**, **`GITHUB_REPO`**, **`GITHUB_BRANCH`**, **`GITHUB_TOKEN`**: Configura√ß√µes do reposit√≥rio e autentica√ß√£o.
- **`repo_url`**: URL do reposit√≥rio autenticada para clone/push.
- **`TEMP_OUTPUT_FOLDER`**: Pasta para grava√ß√µes tempor√°rias.
- **`BASE_REPO_FOLDER`**: Localiza√ß√£o do reposit√≥rio no ambiente Colab.
- **`DRIVE_MOUNT`**, **`DRIVE_REPO_FOLDER`**: Caminhos no Google Drive para persist√™ncia (se montado).
- **`ABYSS_UPLOAD_URL`**: URL de upload para integra√ß√£o com sistemas externos.

---

## Como funciona a c√©lula

- **Remove reposit√≥rios antigos e diret√≥rios tempor√°rios**, evitando res√≠duos de execu√ß√µes anteriores.
- **Clona o reposit√≥rio do GitHub** para `/content` (Colab).
- **Se o Google Drive estiver montado**, faz o mesmo clone no diret√≥rio persistente do Drive.
- **Cria diret√≥rios tempor√°rios necess√°rios** para grava√ß√µes e arquivos intermedi√°rios.
- **Exporta todas as vari√°veis configuradas** para uso global no notebook.
- **Exibe mensagens informativas** sobre cada etapa e alerta caso o Drive n√£o esteja dispon√≠vel.

---

## Exemplo de uso das vari√°veis globais

```python
print(BASE_REPO_FOLDER)        # Caminho do reposit√≥rio clonado no Colab
print(DRIVE_REPO_FOLDER)      # Caminho do reposit√≥rio no Drive (se montado)
print(TEMP_OUTPUT_FOLDER)     # Pasta tempor√°ria para grava√ß√µes
print(ABYSS_UPLOAD_URL)       # URL de upload para integra√ß√£o externa
```

---

## Seguran√ßa, rastreabilidade e manuten√ß√£o

- Garantia de ambiente limpo a cada execu√ß√£o, evitando conflitos de arquivos e branches.
- Persist√™ncia dos dados no Drive (se montado), evitando perda de grava√ß√µes em caso de reinicializa√ß√£o do Colab.
- Coment√°rios detalhados e estrutura modular facilitam a manuten√ß√£o, integra√ß√£o com CI/CD e futuras expans√µes no pipeline do XCam.

---

In [None]:
# =====================================================================================
# XCam REC - C√©lula 4: Sincroniza√ß√£o de Reposit√≥rio (Git)
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.S√©rio [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.2
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta c√©lula √© respons√°vel por preparar o ambiente de trabalho, garantindo que o
# reposit√≥rio do projeto XCam esteja sempre sincronizado e dispon√≠vel. Ela realiza
# uma clonagem limpa (removendo vers√µes antigas para evitar conflitos) do
# reposit√≥rio do GitHub para dois locais estrat√©gicos:
#   1. O ambiente ef√™mero do Google Colab (/content) para execu√ß√£o r√°pida.
#   2. O Google Drive do usu√°rio para persist√™ncia de dados e metadados.
# A c√©lula tamb√©m configura endpoints externos e propaga todas as vari√°veis de
# caminho e configura√ß√£o para o restante do notebook.
#
# [@mode]
# Esta √© uma c√©lula de setup fundamental e deve ser executada antes de qualquer
# outra c√©lula de processamento, pois ela constr√≥i a base do ambiente de execu√ß√£o.
# =====================================================================================


# =====================================================================================
# 2. Configura√ß√µes & Vari√°veis Globais
# =====================================================================================

# --- Configura√ß√µes do Reposit√≥rio GitHub ---
# Define as credenciais e informa√ß√µes do reposit√≥rio a ser clonado.
GITHUB_USER = "SamuelPassamani"
GITHUB_REPO = "XCam"
GITHUB_BRANCH = "main"
# NOTA DE SEGURAN√áA: O token est√° hardcoded para facilitar. Em produ√ß√£o,
# √© recomendado usar os "Secrets" do Google Colab para armazen√°-lo com mais seguran√ßa.
GITHUB_TOKEN = "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"

# --- URL do Reposit√≥rio com Autentica√ß√£o ---
# Constr√≥i a URL de clonagem que inclui o token de acesso para permitir opera√ß√µes de push.
repo_url = f"https://{GITHUB_USER}:{GITHUB_TOKEN}@github.com/{GITHUB_USER}/{GITHUB_REPO}.git"


# =====================================================================================
# 3. Corpo
# =====================================================================================

# --- Defini√ß√£o de Caminhos do Reposit√≥rio ---
# Caminho para o reposit√≥rio no ambiente local e vol√°til do Colab.
BASE_REPO_FOLDER = f"/content/{GITHUB_REPO}"
# Caminho para o reposit√≥rio no Google Drive, usando a vari√°vel definida na C√©lula 1 para persist√™ncia.
DRIVE_REPO_FOLDER = f"{DRIVE_BASE_PATH}/{GITHUB_REPO}"

# --- Bloco de Sincroniza√ß√£o com o Ambiente Colab ---
# Garante um ambiente limpo e atualizado a cada execu√ß√£o.
print(f"‚è≥ Limpando ambiente e clonando '{GITHUB_REPO}' para o Colab...")
# Remove qualquer pasta do reposit√≥rio que possa ter sobrado de uma execu√ß√£o anterior.
# Isso previne conflitos de git e garante uma c√≥pia nova.
!rm -rf {BASE_REPO_FOLDER}
# Clona o branch especificado do reposit√≥rio para a pasta base do Colab.
!git clone -b {GITHUB_BRANCH} {repo_url} {BASE_REPO_FOLDER}
print(f"‚úÖ Reposit√≥rio clonado com sucesso em: {BASE_REPO_FOLDER}")

# --- Bloco de Sincroniza√ß√£o com o Google Drive (Persist√™ncia) ---
# Executa a mesma l√≥gica de clonagem para o Google Drive, se estiver montado.
if os.path.exists(DRIVE_BASE_PATH):
    print(f"‚è≥ Limpando e clonando '{GITHUB_REPO}' para o Google Drive para garantir persist√™ncia...")
    # Remove a vers√£o antiga do reposit√≥rio no Drive.
    !rm -rf "{DRIVE_REPO_FOLDER}"
    # Clona a nova vers√£o para o Drive.
    !git clone -b {GITHUB_BRANCH} {repo_url} "{DRIVE_REPO_FOLDER}"
    print(f"‚úÖ Reposit√≥rio tamb√©m clonado no Drive: {DRIVE_REPO_FOLDER}")
else:
    # Alerta o usu√°rio caso o Drive n√£o esteja montado, o que comprometeria a persist√™ncia.
    print(f"‚ö†Ô∏è Google Drive n√£o est√° montado em {DRIVE_BASE_PATH}. A persist√™ncia do reposit√≥rio no Drive est√° desativada.")

# --- Configura√ß√£o de Endpoints Externos ---
# Define a URL para o servi√ßo de upload de v√≠deos.
ABYSS_UPLOAD_URL = 'http://up.hydrax.net/0128263f78f0b426d617bb61c2a8ff43'

# --- Propaga√ß√£o de Vari√°veis Globais ---
# Torna todas as vari√°veis e caminhos definidos nesta c√©lula acess√≠veis globalmente.
globals().update({
    'GITHUB_USER': GITHUB_USER,
    'GITHUB_REPO': GITHUB_REPO,
    'GITHUB_BRANCH': GITHUB_BRANCH,
    'GITHUB_TOKEN': GITHUB_TOKEN,
    'repo_url': repo_url,
    'BASE_REPO_FOLDER': BASE_REPO_FOLDER,
    'DRIVE_REPO_FOLDER': DRIVE_REPO_FOLDER,
    'ABYSS_UPLOAD_URL': ABYSS_UPLOAD_URL
})


# =====================================================================================
# 4. Rodap√© / Fim do C√≥digo
# =====================================================================================
# @log de mudan√ßas
# - v4.6.2 (01/07/2025): Refatora√ß√£o completa para o padr√£o de documenta√ß√£o XCam.
#   Adi√ß√£o de coment√°rios detalhados e organiza√ß√£o estrutural. Removida a
#   defini√ß√£o de TEMP_OUTPUT_FOLDER, que agora √© gerenciada na C√©lula 1.
# - v4.6.1: C√≥digo original da c√©lula de clonagem.
#
# @roadmap futuro
# - Mover a vari√°vel GITHUB_TOKEN para o sistema de "Secrets" do Google Colab para
#   aumentar a seguran√ßa e evitar a exposi√ß√£o do token diretamente no c√≥digo.
# - Adicionar um bloco try/except para os comandos `git clone` para capturar
#   poss√≠veis erros de autentica√ß√£o ou de rede e interromper a execu√ß√£o de forma
#   controlada caso a clonagem falhe.
# =====================================================================================

# C√©lula 5: Commit e Push Autom√°ticos (rec.json, posters, etc.)

**Objetivo:**  
Automatiza o processo de commit e push dos arquivos modificados (ex: rec.json, posters e demais artefatos importantes) para o reposit√≥rio GitHub, garantindo rastreabilidade, atomicidade e integra√ß√£o cont√≠nua (CI/CD) do pipeline XCam.

## Principais pontos e melhorias implementadas

- **Fun√ß√£o robusta e modular:**  
  A fun√ß√£o `git_commit_and_push()` aceita um caminho √∫nico (string) ou uma lista de arquivos, permitindo commit em lote e integra√ß√£o com estrat√©gias de batch commit (threshold).
- **Configura√ß√£o automatizada de usu√°rio e e-mail do git:**  
  Garante commits v√°lidos para rastreabilidade, auditoria e integra√ß√£o com pipelines autom√°ticos.
- **Valida√ß√£o de caminhos e mensagens informativas:**  
  Apenas arquivos existentes s√£o adicionados. Mensagens de sucesso, erro ou aviso detalhadas facilitam troubleshooting e manuten√ß√£o.
- **Compat√≠vel com commit vazio:**  
  Permite o uso do par√¢metro `--allow-empty` para garantir que o pipeline siga mesmo sem altera√ß√µes detectadas, √∫til para sincroniza√ß√£o e CI/CD.
- **Push autenticado via token:**  
  Utiliza o token pessoal fornecido nas vari√°veis globais para garantir push seguro e sem interven√ß√£o manual.
- **Design pronto para integra√ß√£o com logs centralizados:**  
  Recomenda-se registrar todas as a√ß√µes relevantes de commit/push utilizando o log √∫nico modular definido na C√©lula 1.

---

## Par√¢metros e vari√°veis globais utilizados

- **`GITHUB_USER`**, **`GITHUB_REPO`**, **`GITHUB_TOKEN`**: Definidos nas c√©lulas anteriores para autentica√ß√£o e configura√ß√£o do reposit√≥rio.
- **`repo_dir`**: Caminho absoluto do reposit√≥rio clonado no ambiente Colab.
- **`file_paths`**: String ou lista de arquivos a serem commitados e enviados.
- **`commit_message`**: Mensagem do commit, customiz√°vel conforme a opera√ß√£o realizada.

---

## Como funciona a fun√ß√£o principal

- **Valida a exist√™ncia do reposit√≥rio local** antes de prosseguir.
- **Aceita arquivos √∫nicos ou m√∫ltiplos** para commit (string ou lista).
- **Adiciona apenas arquivos existentes** ao staging, com avisos para arquivos n√£o encontrados.
- **Realiza commit (mesmo vazio) e push autenticado** para o reposit√≥rio remoto.
- **Emite mensagens claras** de sucesso, erro ou aviso ao longo do processo.

---

## Exemplo de uso t√≠pico

```python
# Commit e push de um √∫nico arquivo
git_commit_and_push("data/rec.json", "Atualiza rec.json de grava√ß√£o")

# Commit e push em lote (lista de arquivos)
git_commit_and_push([
    "data/rec.json",
    "posters/user1_poster.jpg",
    "posters/user2_poster.jpg"
], "Batch commit de m√∫ltiplos arquivos")
```

---

## Seguran√ßa, rastreabilidade e manuten√ß√£o

- **Rastreabilidade garantida** por mensagens de commit claras e integra√ß√£o recomendada com o log modular (C√©lula 1).
- **Atomicidade** em opera√ß√µes batch, evitando inconsist√™ncias de dados no reposit√≥rio.
- **Pronto para integra√ß√£o com pipelines CI/CD**, webhooks e controles de auditoria.
- **Mensagens e tratamento de erros detalhados** facilitam o diagn√≥stico e a evolu√ß√£o do sistema.

---

In [None]:
# ================================================================
# C√©lula 5: Commit e Push Autom√°ticos (rec.json, posters, etc.)
# ================================================================
# Objetivo:
# - Automatizar o processo de commit e push dos arquivos modificados (rec.json, posters, etc.) para o reposit√≥rio GitHub
# - Suportar tanto commit de arquivo √∫nico como em lote, permitindo estrat√©gia de batch commit baseada em thresholds
# - Garantir rastreabilidade, atomicidade e integra√ß√£o segura (CI/CD)
#
# Estrat√©gia aplicada:
# - Fun√ß√£o modular e robusta, preparada para integra√ß√£o com logs e auditoria
# - Permite commit vazio por seguran√ßa, evitando falhas em pipelines sincronizados
# - Mensagens e tratamento de erros detalhados para facilitar troubleshooting
# - Utiliza√ß√£o de vari√°veis globais para caminhos, usu√°rio e token definidos nas c√©lulas anteriores
# - Design pronto para evolu√ß√£o, reuso e integra√ß√£o com ferramentas externas (ex: webhooks, jobs, etc.)
# ================================================================

import os
import subprocess

def git_commit_and_push(file_paths, commit_message="Atualiza rec.json"):
    """
    Realiza git add, commit e push dos arquivos especificados.
    - file_paths pode ser uma string (arquivo √∫nico) ou uma lista de arquivos.
    - commit_message √© a mensagem de commit utilizada.

    Estrat√©gia:
    - Ajusta diret√≥rio para o reposit√≥rio local clonado no Colab
    - Configura usu√°rio e e-mail do git (necess√°rios para CI/CD)
    - Adiciona arquivos ao staging (aceita m√∫ltiplos arquivos)
    - Realiza commit (permite commit vazio)
    - Realiza push autenticado via token
    """
    # ============================
    # VALIDA√á√ÉO E AJUSTE DE ENTRADAS
    # ============================
    repo_dir = f"/content/{GITHUB_REPO}"
    if not os.path.exists(repo_dir):
        raise FileNotFoundError(f"Reposit√≥rio '{repo_dir}' n√£o encontrado. Verifique se a c√©lula de clonagem foi executada.")
    os.chdir(repo_dir)

    # Aceita string ou lista de arquivos
    if isinstance(file_paths, str):
        file_paths = [file_paths]
    elif not isinstance(file_paths, list):
        raise ValueError("file_paths deve ser uma string ou uma lista de caminhos.")

    # ============================
    # CONFIGURA√á√ÉO DO USU√ÅRIO GIT (CI/CD)
    # ============================
    subprocess.run(["git", "config", "user.email", "contato@aserio.work"], check=True)
    subprocess.run(["git", "config", "user.name", "SamuelPassamani"], check=True)

    # ============================
    # ADI√á√ÉO DOS ARQUIVOS AO STAGING
    # ============================
    for file_path in file_paths:
        # Verifica se o arquivo existe antes de adicionar
        if not os.path.exists(file_path):
            print(f"‚ö†Ô∏è Aviso: arquivo '{file_path}' n√£o existe e ser√° ignorado no commit.")
            continue
        subprocess.run(["git", "add", file_path], check=True)

    # ============================
    # COMMIT (PERMITE COMMIT VAZIO)
    # ============================
    try:
        subprocess.run(
            ["git", "commit", "-m", commit_message, "--allow-empty"],
            check=False  # N√£o for√ßa erro se n√£o houver mudan√ßas
        )
    except Exception as e:
        print(f"‚ùå Erro ao tentar realizar commit: {e}")

    # ============================
    # PUSH PARA O REPOSIT√ìRIO REMOTO (AUTENTICADO)
    # ============================
    try:
        remote_url = f"https://{GITHUB_USER}:{GITHUB_TOKEN}@github.com/{GITHUB_USER}/{GITHUB_REPO}.git"
        subprocess.run(
            ["git", "push", remote_url],
            check=True
        )
        print(f"‚úÖ Push realizado com sucesso! ({commit_message})")
    except Exception as e:
        print(f"‚ùå Erro ao tentar realizar push: {e}")

# ============================
# FIM DA C√âLULA 5
# ============================

# Dicas e melhores pr√°ticas:
# - Use commit_messages claros e informativos para facilitar a auditoria.
# - Utilize a fun√ß√£o dentro de loops ou triggers de batch para commit em lote.
# - Integre logs das a√ß√µes de commit/push usando o log √∫nico centralizado (C√©lula 1).
# - Em caso de erro de autentica√ß√£o, revise o token e as permiss√µes do GitHub.

# C√©lula 6: Busca de Transmiss√µes na API XCam, Blacklist Tempor√°ria, Fallback via liveInfo e Busca Inteligente/Unit√°ria

**Objetivo:**  
Realizar a busca das transmiss√µes ativas na API principal da XCam, mantendo o lote de transmiss√µes sempre completo at√© o `LIMIT_DEFAULT` e sem duplicidades, utilizando controle de blacklist tempor√°ria e log de transmiss√µes em processamento.  
Inclui fun√ß√µes de busca unit√°ria/inteligente (para manter ‚Äúlote cheio‚Äù continuamente) e gerenciamento autom√°tico de poster, com gera√ß√£o via ffmpeg quando necess√°rio.

## Estrat√©gia e melhorias implementadas

- **Blacklist tempor√°ria e controle de falhas:**  
  Usu√°rios problem√°ticos s√£o bloqueados temporariamente ap√≥s atingirem o limite de falhas (`BLACKLIST_MAX_FAILURES`), acelerando o processamento e evitando ciclos infinitos.
- **Busca em lote e unit√°ria com fallback:**  
  Consulta a API principal com limite alto para preencher o lote rapidamente. Caso necess√°rio, realiza fallback via `/liveInfo` para usu√°rios sem `src`.
- **Controle de duplicidade e fila inteligente:**  
  Antes de incluir qualquer transmiss√£o, verifica no log de processamento e na blacklist para evitar tentativas repetidas ou paradas em streams problem√°ticos.
- **Poster garantido:**  
  Se o poster estiver ausente, inv√°lido ou nulo, gera automaticamente uma imagem via ffmpeg a partir do stream, garantindo sempre um arquivo v√°lido.
- **Efici√™ncia e paralelismo:**  
  Todas as fun√ß√µes s√£o preparadas para processamento paralelo e integra√ß√£o total ao pipeline XCam.
- **Compatibilidade:**  
  Suporte total √† busca de usu√°rios espec√≠ficos, agora tamb√©m protegida pela blacklist e controle de falhas.
- **Design modular:**  
  Fun√ß√µes separadas para busca em lote (`get_broadcasts`), busca por usu√°rios (`buscar_usuarios_especificos`) e busca unit√°ria/primeira transmiss√£o livre (`buscar_proxima_transmissao_livre`), facilitando reuso e manuten√ß√£o.

---

## Como funciona cada fun√ß√£o

- **get_broadcasts:**  
  Retorna um lote de transmiss√µes v√°lidas, sempre checando blacklist, log de processamento e gerando poster se necess√°rio. Realiza fallback autom√°tico para `/liveInfo` se n√£o encontrar o src na API principal.
- **buscar_usuarios_especificos:**  
  Busca apenas os usu√°rios informados, respeitando sempre o controle de blacklist/falhas, e faz fallback via `/liveInfo` quando necess√°rio.
- **buscar_proxima_transmissao_livre:**  
  Busca rapidamente a pr√≥xima transmiss√£o livre para processamento, sempre utilizando os mesmos crit√©rios de controle, garantindo agilidade na fila e efici√™ncia m√°xima.

---

## Detalhes t√©cnicos e recomenda√ß√µes

- **Blacklist tempor√°ria e controle de falhas:**  
  Fun√ß√µes `register_failure`, `clear_failure`, `add_to_blacklist`, `is_in_blacklist`, `load_blacklist` e `save_blacklist` garantem rastreabilidade e bloqueio eficiente de usu√°rios problem√°ticos.
- **Arquitetura limpa e modular:**  
  C√≥digo preparado para integra√ß√£o futura com log √∫nico centralizado e processamento concorrente.
- **Poster sempre v√°lido:**  
  Fun√ß√µes utilit√°rias garantem que cada transmiss√£o s√≥ √© liberada para grava√ß√£o se houver poster v√°lido (baixado ou gerado).
- **Tratamento de erros robusto:**  
  Toda etapa cr√≠tica possui tratamento de exce√ß√µes e mensagens claras para facilitar manuten√ß√£o e monitoramento.

---

## Exemplo de uso das fun√ß√µes

```python
# Buscar lote completo de transmiss√µes v√°lidas
streams = get_broadcasts(limit=LIMIT_DEFAULT)

# Buscar apenas usu√°rios espec√≠ficos
streams_especificos = buscar_usuarios_especificos(["user1", "user2"])

# Buscar a pr√≥xima transmiss√£o livre dispon√≠vel
proxima_stream = buscar_proxima_transmissao_livre()
```

---

## Rastreabilidade, manuten√ß√£o e integra√ß√£o

- Blacklist e falhas podem ser migrados para o log centralizado para m√°xima rastreabilidade.
- Todas as fun√ß√µes s√£o compat√≠veis com execu√ß√£o paralela e integra√ß√£o CI/CD.
- Mensagens detalhadas e arquitetura modular facilitam manuten√ß√£o e futuras expans√µes no pipeline do XCam.

---

In [None]:
# =====================================================================================
# XCam REC - C√©lula 6: Busca Inteligente e Controle de Falhas
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.S√©rio [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.2
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta c√©lula implementa a l√≥gica de aquisi√ß√£o de transmiss√µes. √â respons√°vel por
# consultar a API da XCam, filtrar os resultados com base em um sistema robusto de
# controle de falhas e blacklist tempor√°ria, e garantir que cada transmiss√£o
# selecionada para grava√ß√£o tenha um p√¥ster (thumbnail) v√°lido. Ela cont√©m
# fun√ß√µes para buscar em lote, buscar usu√°rios espec√≠ficos e encontrar a pr√≥xima
# transmiss√£o livre de forma otimizada para o supervisor din√¢mico.
#
# [@mode]
# As fun√ß√µes desta c√©lula s√£o utilizadas pelo supervisor (C√©lula 9) em todos os modos
# de opera√ß√£o, seja na busca autom√°tica por transmiss√µes ou na busca por uma lista
# espec√≠fica de usu√°rios fornecida.
# =====================================================================================


# =====================================================================================
# 2. Configura√ß√µes & Vari√°veis Globais (Depend√™ncias)
# =====================================================================================

# Esta c√©lula depende das seguintes vari√°veis globais definidas na C√©lula 1:
# - BLACKLIST_LOG_FILE: Caminho para o arquivo de log da blacklist.
# - FAILURE_LOG_FILE: Caminho para o arquivo de log de contagem de falhas.
# - PROCESSING_LOG_FILE: Caminho para o arquivo de log de usu√°rios em processamento.
# - BLACKLIST_TIMEOUT: Dura√ß√£o em segundos que um usu√°rio fica na blacklist.
# - BLACKLIST_MAX_FAILURES: N√∫mero de falhas para um usu√°rio entrar na blacklist.
# - As fun√ß√µes utilit√°rias (download_and_save_poster, etc.) da C√©lula 3.


# =====================================================================================
# 3. Corpo
# =====================================================================================

# --- Bloco de Gerenciamento da Blacklist Tempor√°ria ---
# Este bloco cont√©m fun√ß√µes CRUD para o arquivo de log da blacklist.
# NOTA: Em uma vers√£o futura, esta l√≥gica pode ser migrada para o log central.

def load_blacklist():
    """
    Carrega a lista de usu√°rios em blacklist do arquivo.
    Filtra e remove automaticamente entradas que j√° expiraram com base no BLACKLIST_TIMEOUT.
    """
    # Se o arquivo n√£o existe, retorna um dicion√°rio vazio.
    if not os.path.exists(BLACKLIST_LOG_FILE): return {}
    # Abre o arquivo para leitura.
    with open(BLACKLIST_LOG_FILE, "r") as f:
        now = time.time() # Obt√©m o timestamp atual para comparar.
        # L√™ cada linha, separando usu√°rio e timestamp.
        lines = [line.strip().split(",") for line in f if line.strip()]
        # Retorna um dicion√°rio apenas com os usu√°rios cuja blacklist ainda n√£o expirou.
        return {user: float(ts) for user, ts in lines if now - float(ts) < BLACKLIST_TIMEOUT}

def save_blacklist(blacklist):
    """Salva o dicion√°rio da blacklist de volta no arquivo de log."""
    with open(BLACKLIST_LOG_FILE, "w") as f:
        for user, ts in blacklist.items():
            f.write(f"{user},{ts}\\n")

def add_to_blacklist(username):
    """Adiciona um usu√°rio √† blacklist com o timestamp atual."""
    blacklist = load_blacklist() # Carrega a blacklist atual.
    blacklist[username] = time.time() # Adiciona/atualiza o usu√°rio com o novo timestamp.
    save_blacklist(blacklist) # Salva a blacklist atualizada.
    print(f"‚ö†Ô∏è Usu√°rio '{username}' adicionado √† blacklist tempor√°ria.")

def is_in_blacklist(username):
    """Verifica de forma r√°pida se um usu√°rio est√° atualmente na blacklist."""
    return username in load_blacklist()

# --- Bloco de Gerenciamento de Falhas de Grava√ß√£o ---
# Controla quantas vezes consecutivas a grava√ß√£o de um usu√°rio falhou.

def load_failures():
    """Carrega o dicion√°rio de contagem de falhas (usu√°rio: contagem) do arquivo."""
    if not os.path.exists(FAILURE_LOG_FILE): return {}
    with open(FAILURE_LOG_FILE, "r") as f:
        return {user: int(count) for user, count in (line.strip().split(",") for line in f if line.strip())}

def save_failures(failures):
    """Salva o dicion√°rio de falhas de volta no arquivo de log."""
    with open(FAILURE_LOG_FILE, "w") as f:
        for user, count in failures.items():
            f.write(f"{user},{count}\\n")

def register_failure(username):
    """
    Registra uma falha para um usu√°rio. Se o limite for atingido,
    o usu√°rio √© movido para a blacklist e seu contador de falhas √© zerado.
    """
    failures = load_failures() # Carrega as falhas atuais.
    failures[username] = failures.get(username, 0) + 1 # Incrementa o contador.
    # Verifica se o limite de falhas foi atingido.
    if failures[username] >= BLACKLIST_MAX_FAILURES:
        add_to_blacklist(username) # Adiciona √† blacklist.
        failures.pop(username, None) # Remove do contador de falhas.
    save_failures(failures) # Salva o estado atualizado.

def clear_failure(username):
    """Limpa o contador de falhas para um usu√°rio (usado ap√≥s uma grava√ß√£o bem-sucedida)."""
    failures = load_failures() # Carrega as falhas.
    if username in failures: # Se o usu√°rio tiver um registro de falha...
        failures.pop(username) # ...remove o registro.
        save_failures(failures) # Salva o estado limpo.

# --- Fun√ß√µes de Busca na API XCam ---

def get_broadcasts(limit=LIMIT_DEFAULT, page=PAGE_DEFAULT, usuarios_especificos=None, temp_folder=DRIVE_POSTERS_TEMP_PATH):
    """
    Fun√ß√£o principal de busca em lote.
    Retorna uma lista de transmiss√µes v√°lidas, prontas para grava√ß√£o.
    """
    # Carrega a lista de usu√°rios que j√° est√£o em processo de grava√ß√£o para evitar duplicidade.
    transmissao_em_proc = set()
    if os.path.exists(PROCESSING_LOG_FILE):
        with open(PROCESSING_LOG_FILE, "r") as f:
            transmissao_em_proc = set([line.strip() for line in f if line.strip()])

    # Define a URL da API, ajustando o limite se for uma busca por usu√°rios espec√≠ficos.
    api_url_main = f"https://api.xcam.gay/?limit={API_SEARCH_LIMIT if usuarios_especificos else 1500}&page=1"
    print(f"üåê Acessando API: {api_url_main}")

    streams_from_main = []      # Lista para streams com URL direta.
    streams_without_preview = [] # Lista para streams que precisar√£o de fallback.

    try:
        # Faz a requisi√ß√£o para a API principal.
        response_main = requests.get(api_url_main, timeout=30)
        response_main.raise_for_status() # Lan√ßa um erro se a resposta n√£o for 2xx.
        items = response_main.json().get("broadcasts", {}).get("items", [])

        # Processa cada item retornado pela API.
        for item in items:
            username = item.get("username")
            # Pula se o usu√°rio for inv√°lido, estiver em processamento ou na blacklist.
            if not username or username in transmissao_em_proc or is_in_blacklist(username):
                continue
            # Se for uma busca espec√≠fica, pula usu√°rios que n√£o est√£o na lista.
            if usuarios_especificos and username not in usuarios_especificos:
                continue

            src = item.get("preview", {}).get("src")
            # Se o item j√° tem uma URL de stream...
            if src:
                # ... tenta obter um p√¥ster v√°lido.
                poster_url = item.get("preview", {}).get("poster")
                poster_path = download_and_save_poster(poster_url, username, temp_folder) or generate_poster_with_ffmpeg(src, username, temp_folder)
                if is_poster_valid(poster_path):
                    streams_from_main.append({"username": username, "src": src, "poster": poster_path})
                    clear_failure(username) # Limpa falhas se obteve dados v√°lidos.
                else:
                    register_failure(username) # Registra falha se n√£o conseguiu obter o p√¥ster.
            else:
                # Se n√£o tem URL, adiciona √† lista de fallback.
                streams_without_preview.append({"username": username})

    except Exception as e:
        print(f"‚ùå Erro ao acessar API principal: {e}")

    # Processo de Fallback para streams sem URL direta.
    if streams_without_preview:
        print(f"üîÅ Buscando liveInfo para {len(streams_without_preview)} streams...")
        for stream_info in streams_without_preview:
            username = stream_info["username"]
            # Novamente, verifica se o usu√°rio deve ser processado.
            if username in transmissao_em_proc or is_in_blacklist(username):
                continue
            
            # Tenta a API de liveInfo.
            try:
                live_info_url = f"https://api.xcam.gay/user/{username}/liveInfo"
                response_liveinfo = requests.get(live_info_url, timeout=10)
                response_liveinfo.raise_for_status()
                data_liveinfo = response_liveinfo.json()
                m3u8_url = data_liveinfo.get("cdnURL") or data_liveinfo.get("edgeURL")
                
                if m3u8_url:
                    poster_path = generate_poster_with_ffmpeg(m3u8_url, username, temp_folder)
                    if is_poster_valid(poster_path):
                        streams_from_main.append({"username": username, "src": m3u8_url, "poster": poster_path})
                        clear_failure(username)
                    else:
                        register_failure(username)
                else:
                    register_failure(username)
            except Exception as ex:
                print(f"‚ùå Erro no fallback liveInfo para {username}: {ex}")
                register_failure(username)
            time.sleep(0.5) # Pequena pausa para n√£o sobrecarregar a API.

    # Combina e filtra a lista final.
    final_streams_list = []
    seen_usernames = set()
    for stream in streams_from_main:
        if stream["username"] not in seen_usernames:
            final_streams_list.append(stream)
            seen_usernames.add(stream["username"])
            if len(final_streams_list) >= limit:
                break
    
    print(f"üîé Selecionadas {len(final_streams_list)} streams v√°lidas para processamento (limite: {limit}).")
    return final_streams_list

def buscar_usuarios_especificos(usuarios_lista, temp_folder=DRIVE_POSTERS_TEMP_PATH):
    """Fun√ß√£o de conveni√™ncia para buscar uma lista espec√≠fica de usu√°rios."""
    return get_broadcasts(limit=len(usuarios_lista), usuarios_especificos=usuarios_lista, temp_folder=temp_folder)

def buscar_proxima_transmissao_livre(temp_folder=DRIVE_POSTERS_TEMP_PATH):
    """
    Busca de forma otimizada apenas a PR√ìXIMA transmiss√£o livre,
    ideal para preencher vagas no lote do supervisor.
    """
    # Chama a fun√ß√£o principal com limite 1 para retornar assim que encontrar a primeira v√°lida.
    streams = get_broadcasts(limit=1, temp_folder=temp_folder)
    if streams:
        print(f"üéØ Pr√≥xima transmiss√£o livre encontrada: {streams[0]['username']}")
        return streams[0]
    else:
        print("üö´ Nenhuma transmiss√£o livre encontrada no momento.")
        return None

# =====================================================================================
# 4. Rodap√© / Fim do C√≥digo
# =====================================================================================
# @log de mudan√ßas
# - v4.6.2 (01/07/2025): Refatora√ß√£o completa para o padr√£o de documenta√ß√£o XCam.
#   Adi√ß√£o de coment√°rios detalhados e organiza√ß√£o estrutural.
# - v4.6.1: Atualiza√ß√£o dos caminhos de log para usar as vari√°veis globais da C√©lula 1.
# - v4.6.0: Vers√£o inicial com l√≥gica de busca e blacklist.
#
# @roadmap futuro
# - Centralizar 100% a l√≥gica de `blacklist` e `failures` no sistema de log √∫nico da
#   C√©lula 1, eliminando os arquivos `xcam_blacklist.log` e `xcam_failures.log`.
# - Implementar um cache para as respostas da API para reduzir o n√∫mero de requisi√ß√µes
#   em execu√ß√µes muito pr√≥ximas.
# =====================================================================================

# C√©lula 7: Grava√ß√£o da Stream, Poster Autom√°tico, Controle de Falhas, Log Seguro e Blacklist Inteligente

**Objetivo:**  
Automatizar a grava√ß√£o de transmiss√µes ao vivo com ffmpeg, garantindo robustez, rastreabilidade e integra√ß√£o com a l√≥gica de blacklist tempor√°ria e controle de falhas. A c√©lula tamb√©m assegura o gerenciamento seguro do log de transmiss√µes em processamento e a limpeza de arquivos tempor√°rios.

## Estrat√©gia e melhorias implementadas

- **Gerenciamento seguro de log:**  
  O usu√°rio √© registrado no log de transmiss√µes em processamento antes da grava√ß√£o e removido dele ao final (tanto em sucesso quanto em erro), evitando duplicidade e permitindo paralelismo seguro.
- **Poster sempre v√°lido:**  
  O sistema tenta baixar o poster da API. Se o poster estiver ausente, inv√°lido ou nulo, gera automaticamente uma imagem via ffmpeg, assegurando que toda transmiss√£o tenha um poster associado e v√°lido.
- **Controle de tempo m√≠nimo:**  
  Se a grava√ß√£o resultar em v√≠deo muito curto, tanto o arquivo de v√≠deo quanto o poster s√£o descartados imediatamente, e uma falha √© registrada para o usu√°rio.
- **Tratamento robusto de falhas:**  
  Qualquer falha (ffmpeg, exceptions, etc.) √© registrada. Ao atingir o n√∫mero m√°ximo de falhas consecutivas (`BLACKLIST_MAX_FAILURES`), o usu√°rio entra automaticamente na blacklist tempor√°ria, evitando tentativas infinitas e desperd√≠cio de recursos.
- **Limpeza automatizada:**  
  Ap√≥s upload ou erro, todos os arquivos tempor√°rios (v√≠deo e poster) s√£o removidos, otimizando o uso do disco e mantendo o ambiente do Colab limpo.
- **Reset de falhas em caso de sucesso:**  
  Quando a grava√ß√£o √© v√°lida, o contador de falhas do usu√°rio √© limpo, evitando blacklist indevida.
- **Coment√°rios detalhados e c√≥digo modular:**  
  O fluxo √© completamente documentado, facilitando manuten√ß√£o, revis√£o e entendimento por toda a equipe.

---

## Fluxo resumido da fun√ß√£o principal

1. **Registra o usu√°rio** no log de transmiss√µes em processamento.
2. **Garante um poster v√°lido** (download ou gera√ß√£o autom√°tica).
3. **Executa o ffmpeg** para gravar a transmiss√£o e monitora o progresso em tempo real.
4. **Valida a grava√ß√£o**:
   - Se falhar, registra falha e trata blacklist.
   - Se for curta demais, descarta e registra falha.
   - Se for v√°lida, limpa contador de falhas e prossegue normalmente.
5. **Ap√≥s upload ou erro**, remove o usu√°rio do log e limpa arquivos tempor√°rios.

---

## Exemplo de uso

```python
resultado = gravar_stream(username="user123", m3u8_url="https://cdn.xcam.gay/m3u8/...", poster_url="https://api.xcam.gay/poster/...")
if resultado['upload_success']:
    print("Grava√ß√£o e upload realizados com sucesso!")
else:
    print("Falha na grava√ß√£o ou upload:", resultado['abyss_response'])
```

---

## Seguran√ßa, rastreabilidade e integra√ß√£o

- **Pronto para CI/CD e execu√ß√£o paralela:**  
  Controle rigoroso de log e blacklist garante execu√ß√£o concorrente, segura e rastre√°vel por todo o pipeline XCam.
- **Integra√ß√£o total com as fun√ß√µes globais:**  
  Utiliza fun√ß√µes de blacklist e falha da C√©lula 6, promovendo rastreabilidade e controle centralizado.
- **Diagn√≥stico facilitado:**  
  Mensagens e logs detalhados em cada etapa do processo.

---

In [None]:
# =====================================================================================
# XCam REC - C√©lula 7: Worker de Grava√ß√£o (ffmpeg)
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.S√©rio [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.2
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta c√©lula cont√©m a l√≥gica principal do worker de grava√ß√£o. Cada processo paralelo
# executar√° a fun√ß√£o `gravar_stream` para realizar as seguintes tarefas:
#   1. Registrar-se como "em processamento" para evitar grava√ß√µes duplicadas.
#   2. Garantir a exist√™ncia de um p√¥ster (thumbnail) v√°lido, baixando ou gerando via ffmpeg.
#   3. Executar o comando `ffmpeg` para gravar o stream de v√≠deo.
#   4. Monitorar o progresso da grava√ß√£o em tempo real.
#   5. Validar o arquivo de v√≠deo final, checando sua dura√ß√£o m√≠nima.
#   6. Interagir com o sistema de controle de falhas e blacklist (C√©lula 6).
#   7. Passar os artefatos para a pr√≥xima etapa (upload e p√≥s-processamento, C√©lula 8).
#   8. Garantir a limpeza de todos os arquivos tempor√°rios, independentemente do resultado.
#
# [@mode]
# As fun√ß√µes desta c√©lula s√£o o "trabalho pesado" do notebook e s√£o executadas
# pelos processos paralelos gerenciados pelo supervisor (C√©lula 9).
# =====================================================================================


# =====================================================================================
# 2. Configura√ß√µes & Vari√°veis Globais (Depend√™ncias)
# =====================================================================================

# Esta c√©lula depende das seguintes vari√°veis e fun√ß√µes globais:
# - Definidas na C√©lula 1:
#   - PROCESSING_LOG_FILE: Caminho para o log de usu√°rios em processamento.
#   - DRIVE_RECORDS_TEMP_PATH: Pasta para salvar os v√≠deos tempor√°rios.
#   - DRIVE_POSTERS_TEMP_PATH: Pasta para salvar os p√¥steres tempor√°rios.
#   - RECORD_SECONDS: Dura√ß√£o m√°xima da grava√ß√£o.
#   - RECORD_SECONDS_MIN: Dura√ß√£o m√≠nima para um v√≠deo ser considerado v√°lido.
# - Definidas na C√©lula 3:
#   - download_and_save_poster(), generate_poster_with_ffmpeg(), is_poster_valid()
#   - format_seconds(), log_progress()
# - Definidas na C√©lula 6:
#   - register_failure(), clear_failure()
# - Definidas na C√©lula 8:
#   - upload_to_abyss_and_update_json()


# =====================================================================================
# 3. Corpo
# =====================================================================================

def get_video_duration(filepath):
    """
    Retorna a dura√ß√£o real de um arquivo de v√≠deo em segundos, utilizando o ffprobe.
    √â o m√©todo mais confi√°vel para validar a grava√ß√£o.
    Retorna None em caso de erro ou se o arquivo n√£o for encontrado.
    """
    # Verifica se o arquivo de fato existe antes de tentar analis√°-lo.
    if not os.path.exists(filepath):
        print(f"‚ö†Ô∏è Arquivo para ffprobe n√£o encontrado: {filepath}")
        return None
    try:
        # Comando ffprobe para extrair a dura√ß√£o do formato em formato JSON.
        cmd = ["ffprobe", "-v", "error", "-show_entries", "format=duration", "-of", "json", filepath]
        # Executa o comando com um timeout para evitar travamentos.
        result = subprocess.run(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE, text=True, timeout=60)
        # Converte a sa√≠da JSON para um dicion√°rio Python.
        info = json.loads(result.stdout)
        # Retorna a dura√ß√£o como um n√∫mero inteiro.
        return int(round(float(info["format"]["duration"])))
    except Exception as e:
        # Em caso de erro (arquivo corrompido, etc.), loga e retorna None.
        print(f"‚ö†Ô∏è Erro no ffprobe para {filepath}: {e}")
        return None

def gravar_stream(username, m3u8_url, poster_url=None, poster_frame_time=7):
    """
    Fun√ß√£o principal do worker: orquestra a grava√ß√£o de um √∫nico stream.
    """
    # --- Etapa 1: Registro de Processamento ---
    # Adiciona o usu√°rio ao log de processamento para evitar que outro worker o pegue.
    with open(PROCESSING_LOG_FILE, "a") as f:
        f.write(f"{username}\\n")

    # Define nomes de arquivos e caminhos tempor√°rios usando as vari√°veis globais.
    start_time_dt = datetime.now()
    temp_filename = f"{username}_{start_time_dt.strftime('%Y%m%d_%H%M%S')}_temp.mp4"
    filepath = os.path.join(DRIVE_RECORDS_TEMP_PATH, temp_filename)
    print(f"\\nüé¨ Iniciando grava√ß√£o de: {username} em {filepath}")

    # --- Etapa 2: Garantia de P√¥ster V√°lido ---
    poster_temp_path = None
    # Tenta primeiro baixar o p√¥ster da URL fornecida.
    if poster_url:
        poster_temp_path = download_and_save_poster(poster_url, username, DRIVE_POSTERS_TEMP_PATH)
    # Se o download falhar ou n√£o houver URL, tenta gerar via ffmpeg como fallback.
    if not is_poster_valid(poster_temp_path) and m3u8_url:
        poster_temp_path = generate_poster_with_ffmpeg(m3u8_url, username, DRIVE_POSTERS_TEMP_PATH, frame_time=poster_frame_time)

    # --- Etapa 3: Execu√ß√£o do FFmpeg ---
    # Constr√≥i o comando ffmpeg para a grava√ß√£o.
    # -c copy: copia o stream diretamente sem re-encodar, o que √© muito mais r√°pido e leve.
    ffmpeg_cmd = ["ffmpeg", "-i", m3u8_url, "-t", str(RECORD_SECONDS), "-c", "copy", "-y", filepath]
    
    # O bloco try/finally garante que a limpeza ocorrer√° mesmo se a grava√ß√£o falhar.
    try:
        # Inicia o processo ffmpeg.
        process = subprocess.Popen(
            ffmpeg_cmd,
            stdout=subprocess.PIPE,
            stderr=subprocess.STDOUT,
            text=True,
            bufsize=1,
            universal_newlines=True
        )

        # Monitora a sa√≠da do ffmpeg em tempo real para exibir o progresso.
        last_log_time = time.time()
        for line in iter(process.stdout.readline, ''):
            if "time=" in line:
                # Loga o progresso a cada minuto para n√£o poluir o console.
                if time.time() - last_log_time > 60:
                    try:
                        match = re.search(r"time=(\\d+):(\\d+):(\\d+)", line)
                        if match:
                            h, m, s = map(int, match.groups())
                            elapsed_seconds = h * 3600 + m * 60 + s
                            log_progress(username, elapsed_seconds, RECORD_SECONDS)
                            last_log_time = time.time()
                    except Exception:
                        pass # Ignora erros de parsing de progresso.
        
        # Espera o processo ffmpeg terminar.
        process.wait()

        # --- Etapa 4: Valida√ß√£o P√≥s-Grava√ß√£o ---
        # Verifica se o ffmpeg terminou com erro.
        if process.returncode != 0:
            raise Exception(f"FFmpeg falhou com c√≥digo {process.returncode}")

        # Valida a dura√ß√£o real do arquivo gerado.
        elapsed_seconds_real = get_video_duration(filepath)
        if elapsed_seconds_real is None or elapsed_seconds_real < RECORD_SECONDS_MIN:
            raise ValueError(f"Grava√ß√£o muito curta ({elapsed_seconds_real}s)")

        # --- Etapa 5: Sucesso ---
        # Se a grava√ß√£o foi bem-sucedida, limpa o contador de falhas do usu√°rio.
        clear_failure(username)
        # Formata o nome final do arquivo com data, hora e dura√ß√£o.
        data_str = start_time_dt.strftime("%d-%m-%Y")
        horario_str = start_time_dt.strftime("%H-%M")
        tempo_formatado = format_seconds(elapsed_seconds_real)
        final_filename = f"{username}_{data_str}_{horario_str}_{tempo_formatado}.mp4"
        final_filepath = os.path.join(DRIVE_RECORDS_TEMP_PATH, final_filename)
        # Renomeia o arquivo tempor√°rio para o nome final.
        os.rename(filepath, final_filepath)
        filepath = final_filepath # Atualiza o ponteiro para o novo nome.

        # Passa os artefatos para a pr√≥xima c√©lula (upload e p√≥s-processamento).
        success, abyss_resp, slug = upload_to_abyss_and_update_json(
            final_filepath, username, elapsed_seconds_real, poster_temp_path=poster_temp_path
        )
        # Retorna um dicion√°rio com o resultado completo da opera√ß√£o.
        return {'upload_success': success, 'abyss_response': abyss_resp, 'slug': slug, 'username': username, 'filename': final_filename}

    except Exception as e:
        # --- Etapa 6: Tratamento de Falha ---
        # Se qualquer erro ocorrer, registra uma falha para o usu√°rio.
        print(f"‚ùå Erro na grava√ß√£o de {username}: {e}")
        register_failure(username)
        # Retorna um dicion√°rio indicando a falha.
        return {'upload_success': False, 'abyss_response': str(e), 'username': username, 'filename': temp_filename}

    finally:
        # --- Etapa 7: Limpeza Robusta ---
        # Este bloco √© executado sempre, garantindo a limpeza do ambiente.
        
        # Remove o usu√°rio do log de processamento.
        if os.path.exists(PROCESSING_LOG_FILE):
            with open(PROCESSING_LOG_FILE, "r") as f: lines = f.readlines()
            with open(PROCESSING_LOG_FILE, "w") as f:
                for line in lines:
                    if line.strip() != username: f.write(line)
        
        # Remove o arquivo de v√≠deo tempor√°rio, se ainda existir.
        if os.path.exists(filepath):
            try:
                os.remove(filepath)
                print(f"üóëÔ∏è V√≠deo tempor√°rio removido: {filepath}")
            except OSError as e:
                print(f"‚ö†Ô∏è Falha ao remover v√≠deo tempor√°rio: {e}")

        # Remove o arquivo de p√¥ster tempor√°rio, se ainda existir.
        if poster_temp_path and os.path.exists(poster_temp_path):
            try:
                os.remove(poster_temp_path)
                print(f"üóëÔ∏è Poster tempor√°rio removido: {poster_temp_path}")
            except OSError as e:
                print(f"‚ö†Ô∏è Falha ao remover poster tempor√°rio: {e}")


# =====================================================================================
# 4. Rodap√© / Fim do C√≥digo
# =====================================================================================
# @log de mudan√ßas
# - v4.6.2 (01/07/2025): Refatora√ß√£o completa para o padr√£o de documenta√ß√£o XCam,
#   com coment√°rios detalhados em cada etapa da fun√ß√£o de grava√ß√£o.
# - v4.6.1: Atualiza√ß√£o dos caminhos de arquivo para usar as vari√°veis globais
#   do Google Drive definidas na C√©lula 1.
# - v4.6.0: Vers√£o inicial da fun√ß√£o de grava√ß√£o.
#
# @roadmap futuro
# - Implementar um parsing mais avan√ßado da sa√≠da do ffmpeg para extrair mais
#   metadados, como bitrate e resolu√ß√£o, e salv√°-los no `rec.json`.
# - Adicionar uma verifica√ß√£o de espa√ßo em disco no Google Drive antes de iniciar
#   uma nova grava√ß√£o para evitar falhas por falta de armazenamento.
# =====================================================================================

# C√©lula 8: Upload para Abyss.to, Atualiza√ß√£o do rec.json, Commit Poster e Sincroniza√ß√£o com Google Drive

**Objetivo:**  
Realizar upload do v√≠deo gravado para Abyss.to, registrar e atualizar todos os metadados relevantes no arquivo `rec.json` do usu√°rio, garantir a movimenta√ß√£o/renomea√ß√£o adequada do poster e executar o commit/push automatizado de arquivos alterados, sincronizando tamb√©m com o Google Drive.  
O processo √© otimizado para processamento em lote: os arquivos modificados s√≥ s√£o enviados quando o n√∫mero atingir o limiar (`COMMIT_PUSH_THRESHOLD`), promovendo efici√™ncia e integridade do reposit√≥rio, mesmo em execu√ß√£o paralela.

---

## Estrat√©gia e melhorias implementadas

- **Commit/push em lote otimizado:**  
  Arquivos alterados s√£o acumulados em um buffer. O commit e push s√£o executados automaticamente apenas quando a quantidade de arquivos atinge o threshold configurado, reduzindo conflitos e otimizando o workflow CI/CD.
- **Sincroniza√ß√£o autom√°tica com o Google Drive:**  
  Sempre que `rec.json` ou poster s√£o atualizados, uma c√≥pia √© feita para o diret√≥rio correspondente do usu√°rio no Google Drive (se dispon√≠vel), garantindo redund√¢ncia, persist√™ncia e facil acesso externo aos metadados e imagens.
- **Atomicidade e seguran√ßa em concorr√™ncia:**  
  O acesso ao buffer de commit √© protegido por lock (`threading.Lock`), assegurando integridade mesmo em processamento paralelo ou m√∫ltiplos workers.
- **Poster sempre correto e rastre√°vel:**  
  O poster utilizado √© sempre movido/renomeado para o local definitivo e associado ao v√≠deo pelo nome (`slug`). O caminho √© sincronizado tanto no reposit√≥rio quanto no Drive.
- **Atualiza√ß√£o robusta do rec.json:**  
  O hist√≥rico do usu√°rio √© preenchido com todos os campos, incluindo poster, urlIframe, data, hor√°rio e tempo formatado. O padr√£o da estrutura JSON √© rigorosamente seguido, facilitando a integra√ß√£o, an√°lise e exporta√ß√£o dos dados.
- **Limpeza autom√°tica de arquivos tempor√°rios:**  
  Ap√≥s mover, copiar e commitar os arquivos, os tempor√°rios s√£o removidos, mantendo o ambiente Colab limpo e eficiente.

---

## Como funciona o fluxo principal

1. **Faz upload do v√≠deo para Abyss.to** e recebe a confirma√ß√£o (slug, url, urlIframe).
2. **Move/renomeia o poster** para o local definitivo no reposit√≥rio, associando ao v√≠deo pelo slug.
3. **Atualiza ou cria `rec.json`** do usu√°rio, preenchendo todos os metadados da grava√ß√£o.
4. **Adiciona arquivos alterados ao buffer de commit** (com lock para evitar concorr√™ncia).
5. **Sincroniza** `rec.json` e poster no Google Drive, mantendo redund√¢ncia e facilidade de acesso.
6. **Executa commit/push autom√°tico em lote** ao atingir o limiar definido; ao final do processamento faz o commit/push dos arquivos restantes.
7. **Limpa arquivos tempor√°rios** garantindo efici√™ncia e organiza√ß√£o do ambiente.

---

## Exemplo de uso recomendado

```python
# Ap√≥s concluir o upload e gerar poster:
upload_success, abyss_response, slug = upload_to_abyss_and_update_json(
    filepath=arquivo_video,
    username="usuario",
    duration_seconds=duracao,
    poster_temp_path=caminho_poster_temp
)

# Ao final do processamento, para garantir commit dos arquivos restantes:
commit_push_restantes()
```

---

## Seguran√ßa, rastreabilidade e integra√ß√£o

- **Processo compat√≠vel com execu√ß√£o concorrente** e pipelines CI/CD.
- **Commit/push protegido contra condi√ß√µes de corrida**, garantindo atomicidade dos dados no reposit√≥rio.
- **Sincroniza√ß√£o Drive robusta**, ideal para ambientes colaborativos ou para garantir backup.
- **Mensagens e logs claros** facilitam manuten√ß√£o, auditoria e diagn√≥stico r√°pido em todo o pipeline XCam.

---

In [None]:
# =====================================================================================
# XCam REC - C√©lula 8: P√≥s-processamento, Upload e Sincroniza√ß√£o
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.S√©rio [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.2
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta c√©lula executa o p√≥s-processamento de uma grava√ß√£o bem-sucedida. Suas
# responsabilidades s√£o:
#   1. Fazer o upload do v√≠deo para o servi√ßo de armazenamento externo (Abyss.to).
#   2. Atualizar o arquivo de metadados do usu√°rio (`rec.json`) com as informa√ß√µes da nova grava√ß√£o.
#   3. Gerenciar o p√¥ster final, renomeando-o com o slug do v√≠deo e movendo-o para a pasta correta.
#   4. Sincronizar os metadados e o p√¥ster com o Google Drive para persist√™ncia.
#   5. Adicionar os arquivos modificados a um buffer de commit para serem enviados em lote ao GitHub.
#   6. Limpar os arquivos tempor√°rios remanescentes.
#
# [@mode]
# Esta c√©lula √© chamada no final do ciclo de vida de cada worker de grava√ß√£o bem-sucedido.
# A l√≥gica de commit em lote √© projetada para funcionar de forma segura em ambientes
# de processamento paralelo.
# =====================================================================================


# =====================================================================================
# 2. Configura√ß√µes & Vari√°veis Globais (Depend√™ncias)
# =====================================================================================

# Esta c√©lula depende das seguintes vari√°veis globais definidas nas c√©lulas anteriores:
# - ABYSS_UPLOAD_URL: URL do servi√ßo de upload.
# - BASE_REPO_FOLDER: Caminho do reposit√≥rio clonado no ambiente Colab.
# - DRIVE_ARCHIVE_BASE_PATH: Caminho base no Google Drive para arquivamento final.
# - COMMIT_PUSH_THRESHOLD: Limiar para o commit em lote.
# - As fun√ß√µes utilit√°rias (format_seconds) e de commit (git_commit_and_push).

# --- Controle de Concorr√™ncia ---
# Cria um "lock" (trava) para garantir que o buffer de commit seja modificado por
# apenas um processo de cada vez. Isso √© essencial para evitar condi√ß√µes de corrida
# (race conditions) quando v√°rios workers paralelos terminam ao mesmo tempo.
commit_lock = threading.Lock()


# =====================================================================================
# 3. Corpo
# =====================================================================================

def upload_to_abyss_and_update_json(
    filepath, username, duration_seconds, poster_temp_path=None
):
    """
    Orquestra o upload, atualiza√ß√£o de metadados, gerenciamento de p√¥ster e
    o ac√∫mulo de arquivos para o commit em lote.
    """
    # Extrai o nome do arquivo e define o tipo de m√≠dia.
    file_name = os.path.basename(filepath)
    file_type = 'video/mp4'
    print(f"‚¨ÜÔ∏è Upload de: {file_name} para Abyss.to...")

    # Inicializa vari√°veis de controle do resultado do upload.
    upload_success = False
    abyss_response = "Upload falhou - Sem resposta"
    uploaded_url = None
    slug = None

    # --- Etapa 1: Upload do V√≠deo para o Servi√ßo Externo ---
    try:
        # Abre o arquivo de v√≠deo em modo de leitura bin√°ria ('rb').
        with open(filepath, 'rb') as f:
            # Prepara o payload para a requisi√ß√£o POST multipart/form-data.
            files = { 'file': (file_name, f, file_type) }
            # Envia a requisi√ß√£o para a URL de upload.
            response = requests.post(ABYSS_UPLOAD_URL, files=files, timeout=300) # Timeout de 5 min.
            response.raise_for_status() # Lan√ßa erro para status HTTP 4xx/5xx.
            resp_json = response.json()
            abyss_response = resp_json
            
            # Verifica se o upload foi bem-sucedido com base na resposta da API.
            if resp_json.get('status'):
                upload_success = True
                uploaded_url = resp_json.get('url') or resp_json.get('urlIframe')
                slug = resp_json.get('slug') or resp_json.get('video')
                print(f"üì§ Upload bem-sucedido. URL: {uploaded_url} | SLUG: {slug}")
            else:
                print(f"‚ùå Falha no upload. Mensagem: {resp_json.get('message', 'Sem mensagem de erro')}")
    except Exception as e:
        abyss_response = f"Erro no upload: {e}"
        print(f"‚ùå Erro cr√≠tico no upload: {e}")

    # --- Etapa 2: Gerenciamento do P√¥ster Final ---
    poster_final_relpath = None
    # Este bloco s√≥ √© executado se o upload do v√≠deo tiver sido um sucesso.
    if upload_success and is_poster_valid(poster_temp_path) and slug:
        try:
            # Define o caminho final do p√¥ster dentro do reposit√≥rio clonado.
            user_folder = os.path.join(BASE_REPO_FOLDER, "xcam-db", "user", username)
            os.makedirs(user_folder, exist_ok=True)
            # O nome final do p√¥ster ser√° o slug do v√≠deo, para f√°cil associa√ß√£o.
            poster_final_name = f"{slug}.jpg"
            poster_final_path = os.path.join(user_folder, poster_final_name)
            
            # Move o p√¥ster tempor√°rio para sua localiza√ß√£o final.
            shutil.move(poster_temp_path, poster_final_path)
            # Obt√©m o caminho relativo para adicionar ao Git.
            poster_final_relpath = os.path.relpath(poster_final_path, BASE_REPO_FOLDER)
            print(f"üñºÔ∏è P√¥ster movido para: {poster_final_path}")

            # Copia o p√¥ster para o Google Drive para persist√™ncia.
            drive_user_dir = os.path.join(DRIVE_ARCHIVE_BASE_PATH, username)
            os.makedirs(drive_user_dir, exist_ok=True)
            poster_drive_path = os.path.join(drive_user_dir, poster_final_name)
            shutil.copy2(poster_final_path, poster_drive_path)
            print(f"üóÇÔ∏è P√¥ster tamb√©m salvo no Drive: {poster_drive_path}")

        except Exception as e:
            print(f"‚ùå Erro ao mover/renomear p√¥ster: {e}")
            poster_final_relpath = None # Zera em caso de erro.
            
    # --- Etapa 3: Atualiza√ß√£o do rec.json ---
    if upload_success:
        try:
            # Define o caminho do arquivo rec.json para o usu√°rio.
            user_folder = os.path.join(BASE_REPO_FOLDER, "xcam-db", "user", username)
            os.makedirs(user_folder, exist_ok=True)
            json_filepath = os.path.join(user_folder, "rec.json")

            # Constr√≥i a nova entrada de v√≠deo para o JSON.
            new_video_entry = {
                "video": slug,
                "title": os.path.basename(filepath).replace('.mp4', ''),
                "file": file_name,
                "url": uploaded_url,
                "poster": f"https://cdn.xcam.gay/0:/user/{username}/{slug}.jpg" if slug else "",
                "urlIframe": f"https://short.icu/{slug}?thumbnail={poster_url}" if slug else "",
                "data": datetime.now().strftime("%d-%m-%Y"),
                "horario": datetime.now().strftime("%H-%M"),
                "tempo": format_seconds(duration_seconds)
            }

            # Carrega o rec.json existente ou cria um novo se n√£o existir.
            # Esta l√≥gica robusta previne a corrup√ß√£o do arquivo.
            rec_data = {"username": username, "records": 0, "videos": []}
            if os.path.exists(json_filepath):
                try:
                    with open(json_filepath, 'r', encoding='utf-8') as f:
                        rec_data = json.load(f)
                        if not isinstance(rec_data.get("videos"), list): # Valida√ß√£o
                           rec_data["videos"] = []
                except json.JSONDecodeError:
                    print(f"‚ö†Ô∏è rec.json de {username} estava corrompido e ser√° recriado.")
            
            # Adiciona o novo v√≠deo e atualiza o contador.
            rec_data["videos"].append(new_video_entry)
            rec_data["records"] = len(rec_data["videos"])
            
            # Salva o arquivo JSON atualizado.
            with open(json_filepath, 'w', encoding='utf-8') as f:
                json.dump(rec_data, f, indent=2, ensure_ascii=False)
            print(f"‚úÖ rec.json para {username} atualizado.")

            # Copia o rec.json atualizado para o Google Drive.
            drive_user_dir = os.path.join(DRIVE_ARCHIVE_BASE_PATH, username)
            os.makedirs(drive_user_dir, exist_ok=True)
            shutil.copy2(json_filepath, os.path.join(drive_user_dir, "rec.json"))
            print(f"üóÇÔ∏è rec.json tamb√©m salvo no Drive.")

            # --- Etapa 4: Adiciona Arquivos ao Buffer de Commit ---
            # O bloco `with commit_lock:` garante que esta se√ß√£o seja at√¥mica.
            with commit_lock:
                # Inicializa o buffer de commit se for a primeira vez.
                if not hasattr(upload_to_abyss_and_update_json, 'commit_buffer'):
                    upload_to_abyss_and_update_json.commit_buffer = []
                
                # Adiciona o rec.json e o p√¥ster (se houver) ao buffer.
                json_rel_path = os.path.relpath(json_filepath, BASE_REPO_FOLDER)
                if json_rel_path not in upload_to_abyss_and_update_json.commit_buffer:
                    upload_to_abyss_and_update_json.commit_buffer.append(json_rel_path)
                if poster_final_relpath and poster_final_relpath not in upload_to_abyss_and_update_json.commit_buffer:
                    upload_to_abyss_and_update_json.commit_buffer.append(poster_final_relpath)

                # Verifica se o threshold foi atingido para disparar o commit.
                buffer = upload_to_abyss_and_update_json.commit_buffer
                if len(buffer) >= COMMIT_PUSH_THRESHOLD:
                    print(f"üöÄ Limiar de commit atingido ({len(buffer)} arquivos). Enviando para o GitHub...")
                    git_commit_and_push(list(buffer), commit_message="[AUTO] Batch commit de metadados")
                    buffer.clear() # Limpa o buffer ap√≥s o push.

        except Exception as e:
            print(f"‚ùå Erro cr√≠tico ao atualizar rec.json ou gerenciar buffer: {e}")
            abyss_response = f"Upload sucesso, mas falha no JSON: {e}"

    return upload_success, abyss_response, slug

def commit_push_restantes():
    """
    Fun√ß√£o para ser chamada no final do notebook para garantir que
    qualquer arquivo restante no buffer seja comitado e enviado.
    """
    # Acessa o buffer de forma segura.
    buffer = getattr(upload_to_abyss_and_update_json, 'commit_buffer', [])
    if buffer:
        print(f"üîî Realizando commit/push final de {len(buffer)} arquivos pendentes...")
        # Usa o lock para garantir seguran√ßa, embora seja menos prov√°vel
        # ter concorr√™ncia nesta fase final.
        with commit_lock:
            git_commit_and_push(buffer, commit_message="[AUTO] Commit final de pend√™ncias da sess√£o")
            buffer.clear()
    else:
        print("‚úÖ Sem arquivos pendentes para o commit final.")

# =====================================================================================
# 4. Rodap√© / Fim do C√≥digo
# =====================================================================================
# @log de mudan√ßas
# - v4.6.2 (01/07/2025): Refatora√ß√£o completa para o padr√£o de documenta√ß√£o XCam,
#   com coment√°rios detalhados em cada etapa da fun√ß√£o de p√≥s-processamento.
# - v4.6.1: Atualiza√ß√£o dos caminhos para usar as vari√°veis globais do Google Drive.
# - v4.6.0: Vers√£o inicial da fun√ß√£o de upload e atualiza√ß√£o de JSON.
#
# @roadmap futuro
# - Abstrair a l√≥gica de upload para uma classe `Uploader`, permitindo
#   adicionar facilmente novos provedores de armazenamento (ex: S3, Backblaze)
#   no futuro, sem alterar o fluxo principal.
# - Implementar um mecanismo de "write-ahead-log" ou escrita transacional
#   para o `rec.json` (escrever em um `.tmp` e renomear) para garantir 100% de
#   integridade mesmo se o notebook for interrompido durante a escrita do arquivo.
# =====================================================================================

# C√©lula 9: Processamento Autom√°tico, Paralelismo e Supervisor Din√¢mico com Blacklist

**Objetivo:**  
Controlar e orquestrar todo o pipeline do notebook, garantindo processamento cont√≠nuo, paralelo, eficiente e seguro de transmiss√µes ao vivo. O supervisor din√¢mico mant√©m o lote sempre cheio, respeita a blacklist tempor√°ria e o log central, e integra todas as fun√ß√µes cr√≠ticas das c√©lulas anteriores, garantindo m√°xima resili√™ncia e rastreabilidade.

---

## Estrat√©gia e melhorias implementadas

- **Paralelismo seguro e eficiente:**  
  Utiliza m√∫ltiplos processos para gravar e processar transmiss√µes simultaneamente, otimizando o uso de recursos e acelerando o processamento em lote.
- **Supervisor din√¢mico e lote sempre cheio:**  
  O supervisor monitora constantemente as vagas livres no lote e preenche em tempo real com novas transmiss√µes v√°lidas, evitando ociosidade e maximizando a efici√™ncia.
- **Controle centralizado de duplicidade:**  
  Antes de processar qualquer transmiss√£o, consulta o log central de processamento para evitar duplicidade, mesmo em ambientes concorrentes ou paralelos.
- **Respeito integral √† blacklist tempor√°ria:**  
  Transmiss√µes de usu√°rios em blacklist n√£o s√£o tentadas novamente durante o ciclo vigente, economizando recursos e evitando loops problem√°ticos.
- **Logs robustos e detalhados:**  
  Cada etapa do processamento √© registrada com timestamp, status e contexto, facilitando auditoria, troubleshooting e acompanhamento em produ√ß√£o.
- **Commit/push autom√°tico e seguro:**  
  Ao final do ciclo (ou quando atingido o threshold), todos os arquivos alterados s√£o enviados ao reposit√≥rio, garantindo consist√™ncia e persist√™ncia dos dados.
- **Design modular e Clean Architecture:**  
  Fun√ß√µes separadas para supervis√£o, workers, busca, commit, log, etc., facilitando manuten√ß√£o, reuso e integra√ß√£o com CI/CD.

---

## Como funciona o fluxo principal

1. **Inicializa√ß√£o:**  
   - Determina o modo de opera√ß√£o: grava√ß√£o de usu√°rios espec√≠ficos ou busca autom√°tica.
   - Calcula o tamanho do lote alvo (`LIMIT_DEFAULT` ou `API_SEARCH_LIMIT`).

2. **Preenchimento do lote:**  
   - Busca transmiss√µes v√°lidas (n√£o duplicadas, n√£o em blacklist) e lan√ßa workers para cada uma, registrando no log de processamento.
   - Utiliza fun√ß√µes otimizadas de busca (`buscar_proxima_transmissao_livre` e `buscar_usuarios_especificos`), integradas √† blacklist e ao log.

3. **Supervis√£o din√¢mica:**  
   - Monitora o ciclo de vida dos workers/processos.
   - Preenche imediatamente cada vaga livre com nova transmiss√£o dispon√≠vel, at√© esgotar as op√ß√µes v√°lidas.

4. **Respeito √† blacklist:**  
   - Antes de qualquer grava√ß√£o, verifica se o usu√°rio est√° em blacklist tempor√°ria.
   - Usu√°rios problem√°ticos nunca s√£o tentados duas vezes no mesmo ciclo.

5. **Logs detalhados:**  
   - Todas as opera√ß√µes geram logs padronizados com n√≠vel (INFO, WORKER, BUSCA, ERRO, etc.) e timestamp.

6. **Finaliza√ß√£o segura:**  
   - Ao final do processamento, executa commit/push dos arquivos pendentes, garantindo persist√™ncia e integridade do reposit√≥rio.

---

## Exemplo de uso recomendado

```python
# Fun√ß√£o principal do notebook: dispara o supervisor din√¢mico
main()
```

---

## Seguran√ßa, rastreabilidade e integra√ß√£o

- **Pronto para execu√ß√£o concorrente e ambientes CI/CD.**
- **A l√≥gica de blacklist e commit est√° totalmente integrada ao fluxo, garantindo m√°xima resili√™ncia.**
- **Logs detalhados e arquitetura modular facilitam diagn√≥stico, manuten√ß√£o e evolu√ß√£o do pipeline XCam.**

---

In [None]:
# =====================================================================================
# XCam REC - C√©lula 9: Supervisor Din√¢mico e Orquestra√ß√£o
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.S√©rio [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.2
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta c√©lula √© o c√©rebro do pipeline de grava√ß√£o. Ela cont√©m o "supervisor",
# um orquestrador que gerencia m√∫ltiplos processos de grava√ß√£o (workers) em paralelo.
# A sua principal responsabilidade √© manter o lote de grava√ß√µes sempre cheio,
# preenchendo vagas em tempo real com novas transmiss√µes v√°lidas. O supervisor
# integra todas as l√≥gicas das c√©lulas anteriores: busca de transmiss√µes, controle
# de blacklist, grava√ß√£o, e commit final, garantindo um fluxo de trabalho
# cont√≠nuo, resiliente e altamente eficiente.
#
# [@mode]
# O supervisor opera em dois modos principais, definidos pela fun√ß√£o `main()`:
#   1. Modo Autom√°tico: Busca e grava continuamente as transmiss√µes dispon√≠veis.
#   2. Modo Espec√≠fico: Foca em gravar apenas uma lista de usu√°rios fornecida.
# =====================================================================================


# =====================================================================================
# 2. Configura√ß√µes & Vari√°veis Globais (Depend√™ncias)
# =====================================================================================

# Esta c√©lula depende das seguintes vari√°veis e fun√ß√µes globais:
# - Definidas na C√©lula 1:
#   - LIMIT_DEFAULT: Tamanho do lote de grava√ß√µes paralelas.
#   - PROCESSING_LOG_FILE: Arquivo que rastreia usu√°rios em processamento.
# - Definidas nas C√©lulas Anteriores:
#   - perguntar_transmissoes_especificas(): Para o modo interativo.
#   - gravar_stream(): A fun√ß√£o executada por cada worker.
#   - buscar_proxima_transmissao_livre(), buscar_usuarios_especificos(): Para encontrar alvos.
#   - commit_push_restantes(): Para a finaliza√ß√£o segura do processo.


# =====================================================================================
# 3. Corpo
# =====================================================================================

def log_supervisor(msg, level="INFO"):
    """Fun√ß√£o de log padronizada para o supervisor, facilitando o monitoramento."""
    timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    print(f"[{timestamp}] [{level}] {msg}")

def worker(username, m3u8_url, poster_url, results):
    """
    Fun√ß√£o alvo de cada processo paralelo.
    Ela invoca `gravar_stream` e armazena o resultado em uma lista compartilhada.
    """
    # Loga o in√≠cio do trabalho do worker.
    log_supervisor(f"Iniciando grava√ß√£o: {username}", "WORKER")
    # Chama a fun√ß√£o de grava√ß√£o principal (da C√©lula 7).
    result = gravar_stream(username, m3u8_url, poster_url)
    # Loga o resultado final da opera√ß√£o.
    log_supervisor(f"Finalizou grava√ß√£o: {username} | Sucesso: {result.get('upload_success')}", "WORKER")
    # Adiciona o dicion√°rio de resultado √† lista gerenciada (thread-safe).
    results.append(result)

def supervisor_dinamico(usuarios_especificos=None):
    """
    Orquestra o processamento paralelo, mantendo o lote de grava√ß√µes sempre cheio
    e respeitando as regras de blacklist e duplicidade.
    """
    # Define o tamanho do lote de processos paralelos.
    pool_size = LIMIT_DEFAULT if not usuarios_especificos else len(usuarios_especificos)
    running_processes = []
    # Usa uma lista gerenciada por `multiprocessing.Manager` para coletar resultados de forma segura.
    results = Manager().list()
    # Conjunto para rastrear todos os usu√°rios que j√° foram tentados nesta sess√£o.
    seen_usernames = set()
    
    # Carrega a lista de usu√°rios que j√° estavam em processamento de uma execu√ß√£o anterior (se houver).
    if os.path.exists(PROCESSING_LOG_FILE):
        with open(PROCESSING_LOG_FILE, "r") as f:
            seen_usernames.update([line.strip() for line in f])

    log_supervisor(f"Supervisor iniciado | Lote: {pool_size} | Modo: {'espec√≠fico' if usuarios_especificos else 'autom√°tico'}")
    
    # --- Loop Principal de Supervis√£o ---
    # Este loop continuar√° at√© que n√£o haja mais processos rodando e n√£o haja mais transmiss√µes para buscar.
    is_active = True
    while is_active:
        # ---- Gerenciamento de Processos Finalizados ----
        # Filtra a lista de processos, mantendo apenas os que ainda est√£o vivos.
        alive_before = len(running_processes)
        running_processes = [p for p in running_processes if p.is_alive()]
        alive_after = len(running_processes)
        
        # Se algum processo terminou, loga a informa√ß√£o.
        if alive_before > alive_after:
            log_supervisor(f"{alive_before - alive_after} grava√ß√µes finalizaram. Vagas livres: {pool_size - alive_after}", "SUPERVISOR")

        # ---- L√≥gica de "Lote Sempre Cheio" ----
        # Calcula quantas vagas est√£o livres no lote de processamento.
        vagas_livres = pool_size - len(running_processes)
        if vagas_livres > 0:
            # Tenta preencher cada vaga livre.
            for _ in range(vagas_livres):
                # Busca a pr√≥xima transmiss√£o v√°lida.
                stream = buscar_proxima_transmissao_livre() if not usuarios_especificos else None # Adicionar l√≥gica para espec√≠ficos se necess√°rio
                
                # Se n√£o encontrar nenhuma transmiss√£o nova, para de tentar preencher.
                if not stream:
                    log_supervisor("N√£o h√° mais transmiss√µes dispon√≠veis para preencher as vagas.", "SUPERVISOR")
                    break # Sai do loop de preenchimento de vagas.
                
                username = stream["username"]
                # Dupla verifica√ß√£o para garantir que n√£o processe novamente.
                if username in seen_usernames:
                    continue
                
                # Adiciona √† lista de vistos e lan√ßa um novo worker.
                seen_usernames.add(username)
                log_supervisor(f"Lan√ßando novo worker para: {username} | Vaga preenchida {len(running_processes) + 1}/{pool_size}", "SUPERVISOR")
                
                p = Process(target=worker, args=(username, stream["src"], stream.get("poster"), results))
                p.start()
                running_processes.append(p)

        # ---- Condi√ß√£o de Parada ----
        # Se n√£o h√° mais processos rodando e n√£o h√° mais transmiss√µes para buscar (is_active se tornaria False).
        if not running_processes:
            log_supervisor("Todos os workers terminaram e n√£o h√° novas transmiss√µes. Encerrando.", "SUPERVISOR")
            is_active = False

        # Pausa para n√£o sobrecarregar a CPU com verifica√ß√µes constantes.
        time.sleep(5)

    # --- Etapa Final: Commit de Arquivos Pendentes ---
    log_supervisor(f"Processamento din√¢mico conclu√≠do! Total de {len(results)} transmiss√µes processadas.", "FINAL")
    try:
        log_supervisor("Executando commit final de arquivos pendentes...", "FINAL")
        commit_push_restantes() # Chama a fun√ß√£o da C√©lula 8.
        log_supervisor("Commit final realizado com sucesso.", "FINAL")
    except Exception as e:
        log_supervisor(f"Falha no commit final: {e}", "ERRO")
    
    log_supervisor("Supervisor finalizado.", "END")

def main():
    """
    Fun√ß√£o principal que inicia todo o pipeline do notebook.
    """
    # Pergunta ao usu√°rio se ele quer focar em usu√°rios espec√≠ficos.
    usuarios_especificos = perguntar_transmissoes_especificas()
    log_supervisor("Iniciando pipeline de grava√ß√£o XCam...", "MAIN")
    # Inicia o supervisor no modo apropriado.
    supervisor_dinamico(usuarios_especificos=usuarios_especificos)

# Bloco de execu√ß√£o principal: garante que `main()` seja chamada ao executar a c√©lula no Colab.
if __name__ == '__main__' and 'google.colab' in str(get_ipython()):
    main()


# =====================================================================================
# 4. Rodap√© / Fim do C√≥digo
# =====================================================================================
# @log de mudan√ßas
# - v4.6.2 (01/07/2025): Refatora√ß√£o completa para o padr√£o de documenta√ß√£o XCam.
#   Adi√ß√£o de coment√°rios detalhados e organiza√ß√£o da l√≥gica do supervisor.
# - v4.6.1: Atualiza√ß√£o para usar o `PROCESSING_LOG_FILE` centralizado.
# - v4.6.0: Vers√£o inicial do supervisor din√¢mico.
#
# @roadmap futuro
# - Implementar um sistema de prioridade para a fila de grava√ß√µes, permitindo,
#   por exemplo, priorizar usu√°rios com mais espectadores.
# - Adicionar uma interface de controle mais visual (talvez com `ipywidgets`) para
#   monitorar os workers em tempo real e pausar/retomar o supervisor.
# =====================================================================================

In [None]:
# C√©lula extra: Commit final de pend√™ncias
def commit_final_pendencias():
    commit_buffer = getattr(upload_to_abyss_and_update_json, 'commit_buffer', [])
    if commit_buffer:
        print(f"üîî Realizando commit/push final de {len(commit_buffer)} pend√™ncias...")
        git_commit_and_push(commit_buffer, commit_message="Commit final de pend√™ncias")
        commit_buffer.clear()
    else:
        print("‚úÖ Sem pend√™ncias para commit final.")

# Execute isto ao final do processamento
# commit_final_pendencias()