<a href="https://colab.research.google.com/github/SamuelPassamani/XCam/blob/main/xcam-colab/XCam_REC_V4.6.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Célula 1: Configurações Auxiliares, Parâmetros Globais e Log Centralizado

**Objetivo:**  
Esta célula inicializa e centraliza todas as variáveis globais, parâmetros essenciais e agora também fornece um utilitário robusto para o log único do notebook XCam.  
Permite ajuste rápido e seguro do comportamento do notebook, incluindo limites de processamento, controle de gravação, commit automático e mecanismos de resiliência contra transmissões problemáticas.

## Principais pontos e melhorias implementadas

- **Centralização dos parâmetros globais:**  
  Todos os valores críticos (limites, thresholds, caminhos) são definidos e propagados como globais pelo notebook.
- **Log único modular e estruturado (`xcam_master.log`):**  
  Todas as operações relevantes (busca, gravação, blacklist, commit, erros, etc.) agora são registradas em um único arquivo JSON Lines.  
  Cada entrada inclui sessão, evento, id, username, timestamps, status e detalhes.
- **Funções utilitárias para o log:**  
  Adição, busca, remoção e atualização de eventos são facilitadas por funções modulares (CRUD), promovendo robustez, rastreabilidade e fácil manutenção.
- **Blacklist, falhas e processamento padronizados por `id`:**  
  Toda lógica de controle é feita via identificador único, com `username` para exibição, garantindo unicidade e eliminando inconsistências.
- **Função interativa para seleção de transmissões específicas:**  
  Permite ao usuário informar nomes de usuários para filtrar transmissões antes do processamento.
- **Comentários detalhados:**  
  Cada etapa do código está documentada para orientar ajustes, manutenção e integração por toda a equipe.

---

## Parâmetros globais controlados nesta célula

- **`LIMIT_DEFAULT`**: Quantidade máxima de transmissões processadas em paralelo/lote.
- **`PAGE_DEFAULT`**: Página inicial para busca na API.
- **`RECORD_SECONDS`**: Tempo máximo de gravação de cada vídeo (em segundos).
- **`RECORD_SECONDS_MIN`**: Tempo mínimo exigido para considerar o vídeo válido (em segundos).
- **`API_SEARCH_LIMIT`**: Limite de transmissões retornadas ao buscar usuários específicos.
- **`COMMIT_PUSH_THRESHOLD`**: Quantidade de transmissões processadas até realizar commit/push automático (0 = commit imediato a cada gravação).
- **`LOG_PATH`**: Caminho do arquivo único de log (JSONL).
- **`BLACKLIST_TIMEOUT`**: Tempo de expiração da blacklist (em segundos).
- **`BLACKLIST_MAX_FAILURES`**: Quantidade de falhas consecutivas antes de banir temporariamente o usuário.

---

## Estrutura do log único (`xcam_master.log`)

Cada entrada segue o modelo:
```json
{
  "timestamp": "2025-06-06T06:15:00Z",
  "sessao": "busca|gravação|blacklist|commit|erro|...",
  "evento": "...",
  "id": "...",         // identificador único (primário)
  "username": "...",   // nome do usuário para exibição
  "status": "...",     // ok|erro|blacklisted|expirado|...
  "detalhes": "...",   // informações adicionais
}
```

---

## Funções utilitárias para o log

- **`append_log(entry, log_path=LOG_PATH)`**: Adiciona uma nova entrada ao log central.
- **`read_logs(log_path=LOG_PATH)`**: Lê todas as entradas do log.
- **`query_logs(...)`**: Consulta entradas do log por filtros opcionais (sessão, id, status, etc).
- **`remove_logs(condition_fn, log_path=LOG_PATH)`**: Remove todas as entradas que satisfaçam a condição.
- **`update_log_entry(match_fn, update_fn, log_path=LOG_PATH)`**: Atualiza entradas do log conforme regra.

---

## Exemplo de uso das funções (a serem aplicadas nas próximas células)

```python
append_log({
    "sessao": "busca",
    "evento": "encontrado",
    "id": "abc123",
    "username": "Manugic_",
    "status": "ok",
    "detalhes": "URL válida"
})

# Consultar blacklist:
logs_blacklist = query_logs(sessao="blacklist", status="blacklisted")

# Remover registros expirados:
remove_logs(lambda entry: entry["sessao"] == "processing" and expirou(entry), log_path=LOG_PATH)

# Atualizar status:
update_log_entry(lambda e: e["id"]=="abc123", lambda e: e.update({"status":"ok"}))
```

---

## Função interativa

Permite ao usuário informar transmissões específicas a serem gravadas antes de iniciar o processamento.

---

## Segurança, rastreabilidade e manutenção

- Todos os parâmetros globais são definidos no início e propagados para todo o notebook, garantindo consistência.
- O log único fornece rastreabilidade detalhada e elimina arquivos dispersos (blacklist, falha, etc).
- Ajuste qualquer valor diretamente nesta célula para alterar o comportamento global do notebook de forma segura.
- Comentários detalhados auxiliam a compreensão, integração e manutenção por toda a equipe.

---

In [None]:
# =====================================================================================
# XCam REC - Célula de Configuração Global e Logs
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.Sério [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.2
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta célula é o núcleo de configuração e controle para todo o notebook de gravação.
# Ela centraliza todos os parâmetros, limites, timeouts e caminhos de arquivos,
# garantindo que todas as operações subsequentes sejam consistentes e facilmente ajustáveis.
# Além disso, implementa um sistema de logging robusto e centralizado em um único
# arquivo (JSONL), com funções utilitárias para manipulação (CRUD), promovendo
# máxima rastreabilidade e facilitando a depuração.
#
# [@mode]
# Esta célula funciona como a base de setup para todos os modos de operação do
# notebook, seja em modo de busca automática ou gravação de usuários específicos.
# =====================================================================================

# =====================================================================================
# 2. Configurações & Variáveis Globais
# =====================================================================================

# --- Imports Essenciais ---
from google.colab import drive  # Módulo para interagir com o Google Drive
import os                       # Módulo para interações com o sistema operacional (pastas, arquivos)
import json                     # Módulo para manipulação de dados no formato JSON
from datetime import datetime   # Módulo para trabalhar com datas e horas
import time                     # Módulo para funções relacionadas a tempo (ex: sleep, timestamps)

# --- Montagem do Google Drive ---
# Garante que o Google Drive esteja acessível para persistência dos dados.
drive.mount('/content/drive')

# --- Parâmetros Globais Editáveis ---
# Ajuste estes valores para controlar o comportamento de todo o notebook.

# Limites e thresholds de processamento
LIMIT_DEFAULT = 50              # Define a quantidade máxima de gravações que podem ocorrer em paralelo.
PAGE_DEFAULT = 1                # Define a página inicial para buscas na API do XCam.
RECORD_SECONDS = 12780          # Define o tempo máximo de gravação de cada vídeo, em segundos (aprox. 3.5 horas).
RECORD_SECONDS_MIN = 660        # Define o tempo mínimo que um vídeo precisa ter para ser considerado válido.
API_SEARCH_LIMIT = 1500         # Limite de resultados ao buscar por usuários específicos na API.
COMMIT_PUSH_THRESHOLD = 25      # Número de gravações concluídas para disparar um commit automático para o GitHub.

# Configurações da Blacklist
BLACKLIST_TIMEOUT = 15 * 60     # Tempo que um usuário permanece na blacklist, em segundos (15 minutos).
BLACKLIST_MAX_FAILURES = 3      # Número de falhas consecutivas de gravação para um usuário ser adicionado à blacklist.

# --- Caminhos Centralizados (Google Drive) ---
# Define todos os caminhos de forma centralizada para fácil manutenção.
DRIVE_BASE_PATH = "/content/drive/MyDrive/XCam.Drive/src"               # Pasta raiz do projeto no Drive.
DRIVE_LOGS_PATH = os.path.join(DRIVE_BASE_PATH, "logs")                 # Pasta para todos os arquivos de log.
DRIVE_POSTERS_TEMP_PATH = os.path.join(DRIVE_BASE_PATH, "temp", "posters") # Pasta para pôsteres temporários.
DRIVE_RECORDS_TEMP_PATH = os.path.join(DRIVE_BASE_PATH, "temp", "records") # Pasta para vídeos temporários.
DRIVE_ARCHIVE_BASE_PATH = "/content/drive/MyDrive/XCam.Drive/user"      # Pasta de arquivamento final dos dados por usuário.

# --- Nomes de Arquivos de Log Específicos ---
# Define os nomes dos arquivos de log que serão criados dentro de DRIVE_LOGS_PATH.
MASTER_LOG_FILE = os.path.join(DRIVE_LOGS_PATH, "xcam_master.log")         # Log principal com todos os eventos.
BLACKLIST_LOG_FILE = os.path.join(DRIVE_LOGS_PATH, "xcam_blacklist.log")   # Log de usuários em blacklist.
FAILURE_LOG_FILE = os.path.join(DRIVE_LOGS_PATH, "xcam_failures.log")     # Log de contagem de falhas.
PROCESSING_LOG_FILE = os.path.join(DRIVE_LOGS_PATH, "xcam_processing.log")  # Log de usuários em processamento.

# --- Verificação e Criação de Diretórios ---
# Garante que as pastas de destino existam para evitar erros de "Arquivo não encontrado".
os.makedirs(DRIVE_LOGS_PATH, exist_ok=True)
os.makedirs(DRIVE_POSTERS_TEMP_PATH, exist_ok=True)
os.makedirs(DRIVE_RECORDS_TEMP_PATH, exist_ok=True)
os.makedirs(DRIVE_ARCHIVE_BASE_PATH, exist_ok=True)
print("✅ Pastas do Google Drive verificadas/criadas com sucesso.")

# --- Propagação de Variáveis Globais ---
# Torna todas as configurações acima acessíveis em qualquer outra célula do notebook.
globals().update({
    'LIMIT_DEFAULT': LIMIT_DEFAULT,
    'PAGE_DEFAULT': PAGE_DEFAULT,
    'RECORD_SECONDS': RECORD_SECONDS,
    'RECORD_SECONDS_MIN': RECORD_SECONDS_MIN,
    'API_SEARCH_LIMIT': API_SEARCH_LIMIT,
    'COMMIT_PUSH_THRESHOLD': COMMIT_PUSH_THRESHOLD,
    'BLACKLIST_TIMEOUT': BLACKLIST_TIMEOUT,
    'BLACKLIST_MAX_FAILURES': BLACKLIST_MAX_FAILURES,
    'DRIVE_LOGS_PATH': DRIVE_LOGS_PATH,
    'DRIVE_POSTERS_TEMP_PATH': DRIVE_POSTERS_TEMP_PATH,
    'DRIVE_RECORDS_TEMP_PATH': DRIVE_RECORDS_TEMP_PATH,
    'DRIVE_ARCHIVE_BASE_PATH': DRIVE_ARCHIVE_BASE_PATH,
    'MASTER_LOG_FILE': MASTER_LOG_FILE,
    'BLACKLIST_LOG_FILE': BLACKLIST_LOG_FILE,
    'FAILURE_LOG_FILE': FAILURE_LOG_FILE,
    'PROCESSING_LOG_FILE': PROCESSING_LOG_FILE
})


# =====================================================================================
# 3. Corpo
# =====================================================================================

# --- Funções Utilitárias para Log Centralizado (JSONL) ---

def now_iso():
    """Retorna o timestamp atual em formato UTC ISO 8601, padrão para logs."""
    return datetime.utcnow().isoformat() + "Z"

def append_log(entry, log_path=MASTER_LOG_FILE):
    """Adiciona uma nova entrada ao arquivo de log especificado."""
    # Garante que toda entrada de log tenha um timestamp.
    entry.setdefault("timestamp", now_iso())
    # Garante que os campos essenciais para rastreabilidade existam na entrada.
    for field in ["sessao", "evento", "id", "username", "status"]:
        entry.setdefault(field, "")
    # Abre o arquivo em modo 'append' (a) e escreve a nova entrada como uma linha JSON.
    with open(log_path, "a", encoding="utf-8") as f:
        f.write(json.dumps(entry, ensure_ascii=False) + "\\n")

def read_logs(log_path=MASTER_LOG_FILE):
    """Lê e retorna todas as entradas de um arquivo de log JSONL."""
    # Se o arquivo não existir, retorna uma lista vazia para evitar erros.
    if not os.path.exists(log_path):
        return []
    # Abre o arquivo para leitura e converte cada linha de JSON para um dicionário Python.
    with open(log_path, "r", encoding="utf-8") as f:
        return [json.loads(line) for line in f if line.strip()]

def query_logs(sessao=None, id=None, username=None, evento=None, status=None, after=None, before=None, log_path=MASTER_LOG_FILE):
    """Consulta entradas de log com base em múltiplos filtros opcionais."""
    # Lê todos os logs do arquivo.
    logs = read_logs(log_path)
    filtered_logs = []
    # Itera sobre cada entrada de log para aplicar os filtros.
    for entry in logs:
        if sessao and entry.get("sessao") != sessao: continue
        if id and entry.get("id") != id: continue
        if username and entry.get("username") != username: continue
        if evento and entry.get("evento") != evento: continue
        if status and entry.get("status") != status: continue
        # Filtra por intervalo de tempo, se especificado.
        ts = entry.get("timestamp")
        if after and ts < (after.isoformat() if isinstance(after, datetime) else after): continue
        if before and ts > (before.isoformat() if isinstance(before, datetime) else before): continue
        filtered_logs.append(entry)
    return filtered_logs

def remove_logs(condition_fn, log_path=MASTER_LOG_FILE):
    """Remove entradas de um log que satisfaçam uma função de condição."""
    logs = read_logs(log_path)
    # Cria uma nova lista apenas com os logs que devem ser mantidos.
    kept_logs = [entry for entry in logs if not condition_fn(entry)]
    # Reescreve o arquivo de log com a lista filtrada.
    with open(log_path, "w", encoding="utf-8") as f:
        for entry in kept_logs:
            f.write(json.dumps(entry, ensure_ascii=False) + "\\n")
    # Retorna o número de entradas removidas.
    return len(logs) - len(kept_logs)

def update_log_entry(match_fn, update_fn, log_path=MASTER_LOG_FILE):
    """Atualiza uma ou mais entradas de log que correspondam a uma função de busca."""
    logs = read_logs(log_path)
    updated_count = 0
    # Itera sobre os logs e aplica a função de atualização.
    for entry in logs:
        if match_fn(entry):
            update_fn(entry)
            updated_count += 1
    # Reescreve o arquivo com os logs atualizados.
    with open(log_path, "w", encoding="utf-8") as f:
        for entry in logs:
            f.write(json.dumps(entry, ensure_ascii=False) + "\\n")
    return updated_count

# --- Função Interativa para Seleção de Usuários ---

def perguntar_transmissoes_especificas():
    """Pergunta ao usuário se deseja gravar transmissões específicas."""
    # Captura a resposta do usuário.
    resp = input('Deseja gravar alguma transmissão específica? (sim/não): ').strip().lower()
    # Se a resposta for afirmativa, solicita a lista de usuários.
    if resp.startswith('s'):
        usuarios_input = input('Informe o(s) nome(s) de usuário, separados por vírgula: ')
        # Limpa e formata a entrada do usuário em uma lista de nomes.
        return [u.strip() for u in usuarios_input.split(',') if u.strip()]
    # Retorna uma lista vazia se a resposta for negativa.
    return []

# =====================================================================================
# 4. Rodapé / Fim do Código
# =====================================================================================
# @log de mudanças
# - v4.6.2 (01/07/2025): Refatoração para o padrão de documentação XCam. Adição de
#   comentários detalhados, centralização de caminhos do Drive e organização
#   estrutural para melhor clareza e manutenção.
# - v4.6.1 (01/07/2025): Centralização dos caminhos de arquivos temporários e logs
#   para subpastas dedicadas no Google Drive, melhorando a organização.
# - v4.6.0: Versão inicial da Célula 1 com sistema de log centralizado.
#
# @roadmap futuro
# - Migrar a lógica de controle de blacklist e falhas (atualmente em arquivos
#   separados na Célula 6) para usar exclusivamente o MASTER_LOG_FILE,
#   centralizando 100% da lógica de estado.
# - Refatorar as funções de log para uma classe `Logger` dedicada, melhorando
#   o encapsulamento e a organização do código.
# =====================================================================================

# Célula 2: Instalação e Validação do ffmpeg

**Objetivo:**  
Esta célula garante que o utilitário `ffmpeg` esteja instalado e disponível no ambiente Google Colab. O ffmpeg é indispensável para a gravação dos vídeos das transmissões e para o processamento de mídia ao longo do pipeline do notebook XCam.

## Pontos principais e melhorias implementadas

- **Verificação pré-instalação:**  
  Antes de instalar, verifica se o ffmpeg já está disponível no ambiente, tornando o processo idempotente e eficiente.
- **Instalação automatizada:**  
  Efetua a instalação via `apt-get` apenas se necessário, reduzindo o tempo de setup em execuções futuras.
- **Validação pós-instalação:**  
  Exibe a versão instalada do ffmpeg, garantindo transparência e rastreabilidade.
- **Mensagens detalhadas:**  
  O usuário recebe logs informativos sobre cada etapa, facilitando o diagnóstico em caso de erros.
- **Design modular:**  
  Estrutura pronta para ser utilizada em outros ambientes (Colab, local, server) com pequenas adaptações.

---

## Como funciona a célula

- **Verifica se o ffmpeg está instalado (no PATH do sistema).**
- **Se não estiver, instala automaticamente via apt-get.**
- **Valida e exibe a versão instalada após o processo.**
- **Em caso de falha, exibe erro detalhado e interrompe o fluxo para evitar inconsistências futuras.**

---

## Exemplo de uso das funções nesta célula

```python
if not is_ffmpeg_installed():
    install_ffmpeg()
show_ffmpeg_version()
```

---

## Segurança, rastreabilidade e manutenção

- A célula torna o setup do ambiente mais robusto, impedindo falhas silenciosas relacionadas à ausência de ffmpeg.
- Mensagens e validações ajudam a equipe a identificar rapidamente problemas de ambiente ou permissões.
- O padrão modular facilita a reutilização do código em diferentes notebooks ou pipelines do projeto XCam.

---

In [None]:
# ================================================================
# Célula 2: Instalação e Validação do FFMPEG no Colab
# ================================================================
# Objetivo:
# - Garantir que o utilitário ffmpeg está instalado e disponível no ambiente
# - Validar a instalação e exibir a versão instalada
# - Tornar a etapa idempotente, evitando instalações desnecessárias
# - Fornecer feedback claro e orientações em caso de erro
#
# Estratégia aplicada:
# - Instalação via apt-get apenas se ffmpeg não estiver disponível
# - Validação pós-instalação
# - Logs claros e comentários detalhados para rastreabilidade
# ================================================================

import subprocess

def is_ffmpeg_installed():
    """
    Verifica se o ffmpeg está instalado e disponível no PATH do sistema.
    Retorna True se estiver, False caso contrário.
    """
    try:
        result = subprocess.run(["ffmpeg", "-version"], capture_output=True, text=True)
        return result.returncode == 0
    except FileNotFoundError:
        return False

def install_ffmpeg():
    """
    Instala o ffmpeg via apt-get caso não esteja presente.
    """
    print("[INFO] Instalando ffmpeg via apt-get...")
    # Atualiza pacotes e instala ffmpeg silenciosamente
    !apt-get update -y > /dev/null
    !apt-get install -y ffmpeg > /dev/null
    print("[INFO] ffmpeg instalado com sucesso.")

def show_ffmpeg_version():
    """
    Exibe a versão instalada do ffmpeg.
    """
    print("[INFO] Versão do ffmpeg instalada:")
    !ffmpeg -version | head -n 2

# ============================
# EXECUÇÃO DA ETAPA DE SETUP
# ============================

if not is_ffmpeg_installed():
    print("[WARN] ffmpeg não encontrado no ambiente.")
    install_ffmpeg()
    if not is_ffmpeg_installed():
        raise RuntimeError("[ERRO] Falha ao instalar o ffmpeg. Verifique permissões ou tente novamente.")
else:
    print("[OK] ffmpeg já está instalado no ambiente.")

# Validação final e exibição da versão
show_ffmpeg_version()

# ============================
# FIM DA CÉLULA 2
# ============================

# Dica: ffmpeg deve estar disponível para todas as células subsequentes.
# Se precisar de um caminho específico, utilize `which ffmpeg` para obter o path absoluto.

# Célula 3: Imports Essenciais, Utilitários e Preparação do Ambiente

**Objetivo:**  
Importa todas as bibliotecas essenciais do Python necessárias para o funcionamento do notebook, incluindo módulos para requisições HTTP, processamento paralelo, manipulação de datas, controle de subprocessos e exibição interativa.  
Centraliza funções utilitárias robustas e padronizadas para processamento, download de poster, geração automática de poster com ffmpeg e exibição de progresso.  

## Principais pontos e melhorias implementadas

- **Centralização de imports essenciais:**  
  Todos os módulos fundamentais (os, requests, multiprocessing, datetime, json, time, subprocess, math, re, IPython) estão disponíveis e prontos para uso global.
- **Funções utilitárias padronizadas:**  
  Funções para formatação de segundos, exibição de progresso, download e validação de poster e geração de poster via ffmpeg foram refatoradas e documentadas, seguindo arquitetura modular e Clean Architecture.
- **Remoção de logs temporários dispersos:**  
  O antigo arquivo de log de processamento temporário foi descontinuado em favor do log único centralizado definido na Célula 1, promovendo rastreabilidade e controle total.
- **Robustez e clareza:**  
  Todas as funções possuem tratamento de erros, mensagens amigáveis e são preparadas para uso concorrente e integração com as próximas etapas do pipeline.
- **Pronto para uso em todo o notebook:**  
  As funções aqui definidas são utilizadas em toda a automação, garantindo reuso, legibilidade e manutenção facilitada.

---

## Funções utilitárias disponíveis nesta célula

- **`format_seconds(seconds)`**: Formata um valor em segundos para string legível (ex: "1h23m45s").
- **`log_progress(username, elapsed_seconds, total_seconds)`**: Exibe o progresso da gravação de cada transmissão.
- **`download_and_save_poster(poster_url, username, temp_folder)`**: Baixa e salva o poster da transmissão a partir de uma URL remota ou retorna se for um caminho local.
- **`generate_poster_with_ffmpeg(m3u8_url, username, temp_folder, frame_time=7, timeout=20)`**: Gera automaticamente um poster usando ffmpeg, após validar a disponibilidade do stream.
- **`is_poster_valid(poster_path)`**: Verifica se o arquivo de poster é válido (existe e não está vazio).

---

## Exemplo de uso das funções

```python
# Formatar segundos em string legível
tempo = format_seconds(385)
# Exibir progresso
log_progress("userNovo234", 385, 12780)
# Download do poster
poster_path = download_and_save_poster(url_poster, "userNovo234", "/content/temp")
# Geração automática de poster via ffmpeg (se necessário)
if not is_poster_valid(poster_path):
    poster_path = generate_poster_with_ffmpeg(m3u8_url, "userNovo234", "/content/temp")
```

---

## Segurança, rastreabilidade e manutenção

- Todas as funções são preparadas para tratamento de erros e integração com processos concorrentes.
- O log temporário de processamento foi removido, garantindo que todo o rastreio e auditoria sejam feitos via log único centralizado da Célula 1.
- Comentários detalhados facilitam manutenção, entendimento e evolução do notebook.

---

In [None]:
# =====================================================================================
# XCam REC - Célula 3: Utilitários Essenciais e Preparação do Ambiente
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.Sério [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.1
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta célula é responsável por importar todas as bibliotecas Python essenciais para
# a execução do pipeline de gravação e por definir um conjunto de funções
# utilitárias robustas e padronizadas. As funções aqui presentes são usadas
# em todo o notebook para tarefas como formatação de tempo, exibição de progresso,
# download de pôsteres e geração automática de thumbnails via ffmpeg, garantindo
# modularidade, reuso de código e fácil manutenção.
#
# [@mode]
# As funções e imports definidos nesta célula são de propósito geral e servem de
# base para todas as operações do notebook, independentemente do modo de execução.
# =====================================================================================

# =====================================================================================
# 2. Configurações & Variáveis Globais (Imports)
# =====================================================================================

# --- Imports Essenciais ---
import os                          # Módulo para interações com o sistema operacional (pastas, arquivos).
import requests                    # Biblioteca para fazer requisições HTTP de forma simples e elegante.
from multiprocessing import Manager, Process # Módulos para habilitar o processamento paralelo e acelerar as gravações.
from datetime import datetime      # Módulo para trabalhar com datas e horas.
import json                        # Módulo para manipulação de dados no formato JSON.
import time                        # Módulo para funções relacionadas a tempo (ex: sleep, timestamps).
import subprocess                  # Módulo para executar processos externos, como o ffmpeg.
import math                        # Módulo com funções matemáticas (ex: arredondamento).
import re                          # Módulo para trabalhar com expressões regulares, útil para extrair dados de texto.
import shutil                      # Módulo com operações de alto nível em arquivos e coleções de arquivos.
import threading                   # Módulo para trabalhar com threads, usado para controle de concorrência (locks).

# --- Imports Específicos do Ambiente (IPython/Colab) ---
from IPython import get_ipython    # Função para obter a instância atual do IPython (útil para detectar o ambiente).
from IPython.display import display # Função para renderizar objetos de forma rica no notebook.


# =====================================================================================
# 3. Corpo
# =====================================================================================

# --- Funções Utilitárias de Formatação e Progresso ---

def format_seconds(seconds):
    """
    Converte um número total de segundos em uma string de formato amigável (ex: "1h23m45s").
    Ideal para logs e exibição de duração de vídeos.
    """
    total_seconds = int(seconds)  # Garante que estamos trabalhando com um número inteiro.
    # Usa divmod para obter horas e o resto da divisão.
    hours, remainder = divmod(total_seconds, 3600)
    # Usa divmod novamente no resto para obter minutos e segundos.
    minutes, seconds = divmod(remainder, 60)
    
    parts = [] # Lista para armazenar as partes do tempo formatado.
    if hours > 0: parts.append(f"{hours}h")
    if minutes > 0: parts.append(f"{minutes}m")
    # Adiciona os segundos se houver, ou se for a única unidade de tempo.
    if seconds > 0 or not parts: parts.append(f"{seconds}s")
    
    return "".join(parts) # Junta as partes em uma única string.

def log_progress(username, elapsed_seconds, total_seconds):
    """
    Imprime uma linha de progresso formatada para uma gravação em andamento.
    Inclui nome de usuário, tempo decorrido, tempo restante e porcentagem.
    """
    # Calcula a porcentagem, garantindo que não ultrapasse 100%.
    percent = min((elapsed_seconds / total_seconds) * 100, 100)
    # Formata o tempo decorrido.
    tempo = format_seconds(elapsed_seconds)
    # Calcula os minutos gravados e restantes para uma visão rápida.
    minutos_gravados = math.floor(elapsed_seconds / 60)
    minutos_restantes = max(0, math.ceil((total_seconds - elapsed_seconds) / 60))
    # Imprime a linha de log formatada.
    print(f"⏱️ [{username}] Gravados: {minutos_gravados} min | Restantes: {minutos_restantes} min | Tempo total: {tempo} — 📊 {percent:.1f}% concluído")

# --- Funções Utilitárias para Manipulação de Pôsteres ---

def download_and_save_poster(poster_url, username, temp_folder=DRIVE_POSTERS_TEMP_PATH):
    """
    Baixa um pôster de uma URL e o salva em uma pasta temporária.
    Retorna o caminho do arquivo salvo ou None em caso de falha.
    """
    # Se a URL já for um caminho de arquivo local existente, apenas o retorna.
    if os.path.exists(poster_url):
        return poster_url
    
    # Verifica se a URL é uma string e começa com "http".
    if isinstance(poster_url, str) and poster_url.startswith("http"):
        try:
            # Faz a requisição GET para a URL do pôster com um timeout.
            response = requests.get(poster_url, timeout=15)
            # Levanta um erro se a resposta não for bem-sucedida (status code não for 2xx).
            response.raise_for_status()
            
            # Padroniza a extensão do arquivo para .jpg para consistência.
            ext = ".jpg"
            # Constrói o caminho completo para o arquivo temporário.
            poster_temp_path = os.path.join(temp_folder, f"{username}_poster_temp{ext}")
            
            # Salva o conteúdo da resposta no arquivo.
            with open(poster_temp_path, "wb") as f:
                f.write(response.content)
            
            print(f"🖼️ Poster baixado em: {poster_temp_path}")
            return poster_temp_path
        except Exception as e:
            # Em caso de qualquer erro (timeout, status ruim, etc.), loga e retorna None.
            print(f"❌ Erro ao baixar poster {poster_url}: {e}")
            return None
    else:
        # Se a URL não for válida, loga o erro e retorna None.
        print(f"❌ poster_url inválido: {poster_url}")
        return None

def generate_poster_with_ffmpeg(m3u8_url, username, temp_folder=DRIVE_POSTERS_TEMP_PATH, frame_time=7, timeout=20):
    """
    Gera um pôster (thumbnail) a partir de um stream de vídeo usando o ffmpeg.
    Primeiro, verifica se o stream está online para evitar chamadas desnecessárias ao ffmpeg.
    """
    try:
        # Faz uma requisição HEAD (mais leve) para verificar a disponibilidade do stream.
        head_resp = requests.head(m3u8_url, timeout=5)
        if not head_resp.ok:
            # Se o stream não estiver acessível, loga e retorna None.
            print(f"⚠️ Stream offline para {username} (status {head_resp.status_code})")
            return None
    except Exception as e:
        # Se houver um erro de conexão, loga e retorna None.
        print(f"⚠️ Erro de conexão ao stream de {username}: {e}")
        return None

    # Define o caminho de saída para o pôster gerado.
    poster_ffmpeg_path = os.path.join(temp_folder, f"{username}_poster_ffmpeg.jpg")
    # Constrói o comando ffmpeg para capturar um único frame do vídeo.
    command = ["ffmpeg", "-y", "-ss", str(frame_time), "-i", m3u8_url, "-vframes", "1", "-q:v", "2", poster_ffmpeg_path]
    
    try:
        print(f"🎬 Gerando poster com ffmpeg para {username}...")
        # Executa o comando ffmpeg com um timeout para evitar que o processo trave.
        result = subprocess.run(command, stdout=subprocess.PIPE, stderr=subprocess.PIPE, timeout=timeout)
        # Se o comando foi bem-sucedido e o arquivo foi criado...
        if result.returncode == 0 and os.path.exists(poster_ffmpeg_path):
            print(f"🖼️ Poster gerado via ffmpeg: {poster_ffmpeg_path}")
            return poster_ffmpeg_path
        else:
            # Caso contrário, loga a saída de erro do ffmpeg.
            print(f"❌ ffmpeg falhou para {username}. STDERR: {result.stderr.decode(errors='ignore')}")
            return None
    except subprocess.TimeoutExpired:
        # Se o comando demorar demais, loga o timeout.
        print(f"⏰ Tempo excedido ao gerar poster para {username}.")
        return None
    except Exception as e:
        # Lida com outros erros inesperados.
        print(f"❌ Erro inesperado ao gerar poster: {e}")
        return None

def is_poster_valid(poster_path):
    """
    Verifica se um caminho de pôster é válido, ou seja, se o arquivo existe e não está vazio.
    """
    return poster_path and os.path.exists(poster_path) and os.path.getsize(poster_path) > 0


# =====================================================================================
# 4. Rodapé / Fim do Código
# =====================================================================================
# @log de mudanças
# - v4.6.1 (01/07/2025): Refatoração completa da célula para o padrão de documentação
#   XCam, com adição de comentários detalhados e organização estrutural.
#   Os caminhos temporários foram atualizados para usar as variáveis globais do Drive.
# - v4.6.0: Versão inicial da Célula 3 com funções utilitárias.
#
# @roadmap futuro
# - Refatorar as funções utilitárias em classes dedicadas (ex: `class VideoUtils`,
#   `class PosterManager`) para melhorar o encapsulamento e a testabilidade.
# - Integrar um sistema de cache para os pôsteres para reduzir o número de downloads
#   e gerações via ffmpeg em execuções repetidas.
# =====================================================================================

# Célula 4: Clonagem do Repositório GitHub no Colab e Google Drive

**Objetivo:**  
Esta célula garante que o repositório do projeto XCam seja sempre clonado de forma limpa e sincronizada no ambiente local do Colab e, se disponível, também no Google Drive para persistência.  
Assegura ambiente pronto, atualizado, seguro para gravações e processamento, e prepara diretórios padronizados para integração com o restante do pipeline.

## Principais pontos e melhorias implementadas

- **Clonagem idempotente e limpa:**  
  Remove repositórios antigos antes de clonar para evitar conflitos, arquivos órfãos ou problemas de sincronização.
- **Clonagem para ambiente temporário e persistente:**  
  O repositório é clonado tanto para `/content` (Colab) quanto para o Drive (`/content/drive/MyDrive/XCam.Drive`) se o Drive estiver montado.
- **Preparação de diretórios de gravação e processamento:**  
  Estrutura de diretórios temporários criada automaticamente, garantindo organização dos dados.
- **Exportação de variáveis globais:**  
  Todos os caminhos, URLs e configurações relevantes são disponibilizados via `globals().update()` para uso em todo o notebook.
- **Mensagens e validações detalhadas:**  
  Feedback informativo sobre o status de cada etapa, facilitando o diagnóstico e a manutenção.
- **Pronto para CI/CD e integrações futuras:**  
  Token e URLs preparados para automações, integrações externas e uploads (Abyss.to, etc).

---

## Parâmetros globais definidos nesta célula

- **`GITHUB_USER`**, **`GITHUB_REPO`**, **`GITHUB_BRANCH`**, **`GITHUB_TOKEN`**: Configurações do repositório e autenticação.
- **`repo_url`**: URL do repositório autenticada para clone/push.
- **`TEMP_OUTPUT_FOLDER`**: Pasta para gravações temporárias.
- **`BASE_REPO_FOLDER`**: Localização do repositório no ambiente Colab.
- **`DRIVE_MOUNT`**, **`DRIVE_REPO_FOLDER`**: Caminhos no Google Drive para persistência (se montado).
- **`ABYSS_UPLOAD_URL`**: URL de upload para integração com sistemas externos.

---

## Como funciona a célula

- **Remove repositórios antigos e diretórios temporários**, evitando resíduos de execuções anteriores.
- **Clona o repositório do GitHub** para `/content` (Colab).
- **Se o Google Drive estiver montado**, faz o mesmo clone no diretório persistente do Drive.
- **Cria diretórios temporários necessários** para gravações e arquivos intermediários.
- **Exporta todas as variáveis configuradas** para uso global no notebook.
- **Exibe mensagens informativas** sobre cada etapa e alerta caso o Drive não esteja disponível.

---

## Exemplo de uso das variáveis globais

```python
print(BASE_REPO_FOLDER)        # Caminho do repositório clonado no Colab
print(DRIVE_REPO_FOLDER)      # Caminho do repositório no Drive (se montado)
print(TEMP_OUTPUT_FOLDER)     # Pasta temporária para gravações
print(ABYSS_UPLOAD_URL)       # URL de upload para integração externa
```

---

## Segurança, rastreabilidade e manutenção

- Garantia de ambiente limpo a cada execução, evitando conflitos de arquivos e branches.
- Persistência dos dados no Drive (se montado), evitando perda de gravações em caso de reinicialização do Colab.
- Comentários detalhados e estrutura modular facilitam a manutenção, integração com CI/CD e futuras expansões no pipeline do XCam.

---

In [None]:
# =====================================================================================
# XCam REC - Célula 4: Sincronização de Repositório (Git)
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.Sério [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.2
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta célula é responsável por preparar o ambiente de trabalho, garantindo que o
# repositório do projeto XCam esteja sempre sincronizado e disponível. Ela realiza
# uma clonagem limpa (removendo versões antigas para evitar conflitos) do
# repositório do GitHub para dois locais estratégicos:
#   1. O ambiente efêmero do Google Colab (/content) para execução rápida.
#   2. O Google Drive do usuário para persistência de dados e metadados.
# A célula também configura endpoints externos e propaga todas as variáveis de
# caminho e configuração para o restante do notebook.
#
# [@mode]
# Esta é uma célula de setup fundamental e deve ser executada antes de qualquer
# outra célula de processamento, pois ela constrói a base do ambiente de execução.
# =====================================================================================


# =====================================================================================
# 2. Configurações & Variáveis Globais
# =====================================================================================

# --- Configurações do Repositório GitHub ---
# Define as credenciais e informações do repositório a ser clonado.
GITHUB_USER = "SamuelPassamani"
GITHUB_REPO = "XCam"
GITHUB_BRANCH = "main"
# NOTA DE SEGURANÇA: O token está hardcoded para facilitar. Em produção,
# é recomendado usar os "Secrets" do Google Colab para armazená-lo com mais segurança.
GITHUB_TOKEN = "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"

# --- URL do Repositório com Autenticação ---
# Constrói a URL de clonagem que inclui o token de acesso para permitir operações de push.
repo_url = f"https://{GITHUB_USER}:{GITHUB_TOKEN}@github.com/{GITHUB_USER}/{GITHUB_REPO}.git"


# =====================================================================================
# 3. Corpo
# =====================================================================================

# --- Definição de Caminhos do Repositório ---
# Caminho para o repositório no ambiente local e volátil do Colab.
BASE_REPO_FOLDER = f"/content/{GITHUB_REPO}"
# Caminho para o repositório no Google Drive, usando a variável definida na Célula 1 para persistência.
DRIVE_REPO_FOLDER = f"{DRIVE_BASE_PATH}/{GITHUB_REPO}"

# --- Bloco de Sincronização com o Ambiente Colab ---
# Garante um ambiente limpo e atualizado a cada execução.
print(f"⏳ Limpando ambiente e clonando '{GITHUB_REPO}' para o Colab...")
# Remove qualquer pasta do repositório que possa ter sobrado de uma execução anterior.
# Isso previne conflitos de git e garante uma cópia nova.
!rm -rf {BASE_REPO_FOLDER}
# Clona o branch especificado do repositório para a pasta base do Colab.
!git clone -b {GITHUB_BRANCH} {repo_url} {BASE_REPO_FOLDER}
print(f"✅ Repositório clonado com sucesso em: {BASE_REPO_FOLDER}")

# --- Bloco de Sincronização com o Google Drive (Persistência) ---
# Executa a mesma lógica de clonagem para o Google Drive, se estiver montado.
if os.path.exists(DRIVE_BASE_PATH):
    print(f"⏳ Limpando e clonando '{GITHUB_REPO}' para o Google Drive para garantir persistência...")
    # Remove a versão antiga do repositório no Drive.
    !rm -rf "{DRIVE_REPO_FOLDER}"
    # Clona a nova versão para o Drive.
    !git clone -b {GITHUB_BRANCH} {repo_url} "{DRIVE_REPO_FOLDER}"
    print(f"✅ Repositório também clonado no Drive: {DRIVE_REPO_FOLDER}")
else:
    # Alerta o usuário caso o Drive não esteja montado, o que comprometeria a persistência.
    print(f"⚠️ Google Drive não está montado em {DRIVE_BASE_PATH}. A persistência do repositório no Drive está desativada.")

# --- Configuração de Endpoints Externos ---
# Define a URL para o serviço de upload de vídeos.
ABYSS_UPLOAD_URL = 'http://up.hydrax.net/0128263f78f0b426d617bb61c2a8ff43'

# --- Propagação de Variáveis Globais ---
# Torna todas as variáveis e caminhos definidos nesta célula acessíveis globalmente.
globals().update({
    'GITHUB_USER': GITHUB_USER,
    'GITHUB_REPO': GITHUB_REPO,
    'GITHUB_BRANCH': GITHUB_BRANCH,
    'GITHUB_TOKEN': GITHUB_TOKEN,
    'repo_url': repo_url,
    'BASE_REPO_FOLDER': BASE_REPO_FOLDER,
    'DRIVE_REPO_FOLDER': DRIVE_REPO_FOLDER,
    'ABYSS_UPLOAD_URL': ABYSS_UPLOAD_URL
})


# =====================================================================================
# 4. Rodapé / Fim do Código
# =====================================================================================
# @log de mudanças
# - v4.6.2 (01/07/2025): Refatoração completa para o padrão de documentação XCam.
#   Adição de comentários detalhados e organização estrutural. Removida a
#   definição de TEMP_OUTPUT_FOLDER, que agora é gerenciada na Célula 1.
# - v4.6.1: Código original da célula de clonagem.
#
# @roadmap futuro
# - Mover a variável GITHUB_TOKEN para o sistema de "Secrets" do Google Colab para
#   aumentar a segurança e evitar a exposição do token diretamente no código.
# - Adicionar um bloco try/except para os comandos `git clone` para capturar
#   possíveis erros de autenticação ou de rede e interromper a execução de forma
#   controlada caso a clonagem falhe.
# =====================================================================================

# Célula 5: Commit e Push Automáticos (rec.json, posters, etc.)

**Objetivo:**  
Automatiza o processo de commit e push dos arquivos modificados (ex: rec.json, posters e demais artefatos importantes) para o repositório GitHub, garantindo rastreabilidade, atomicidade e integração contínua (CI/CD) do pipeline XCam.

## Principais pontos e melhorias implementadas

- **Função robusta e modular:**  
  A função `git_commit_and_push()` aceita um caminho único (string) ou uma lista de arquivos, permitindo commit em lote e integração com estratégias de batch commit (threshold).
- **Configuração automatizada de usuário e e-mail do git:**  
  Garante commits válidos para rastreabilidade, auditoria e integração com pipelines automáticos.
- **Validação de caminhos e mensagens informativas:**  
  Apenas arquivos existentes são adicionados. Mensagens de sucesso, erro ou aviso detalhadas facilitam troubleshooting e manutenção.
- **Compatível com commit vazio:**  
  Permite o uso do parâmetro `--allow-empty` para garantir que o pipeline siga mesmo sem alterações detectadas, útil para sincronização e CI/CD.
- **Push autenticado via token:**  
  Utiliza o token pessoal fornecido nas variáveis globais para garantir push seguro e sem intervenção manual.
- **Design pronto para integração com logs centralizados:**  
  Recomenda-se registrar todas as ações relevantes de commit/push utilizando o log único modular definido na Célula 1.

---

## Parâmetros e variáveis globais utilizados

- **`GITHUB_USER`**, **`GITHUB_REPO`**, **`GITHUB_TOKEN`**: Definidos nas células anteriores para autenticação e configuração do repositório.
- **`repo_dir`**: Caminho absoluto do repositório clonado no ambiente Colab.
- **`file_paths`**: String ou lista de arquivos a serem commitados e enviados.
- **`commit_message`**: Mensagem do commit, customizável conforme a operação realizada.

---

## Como funciona a função principal

- **Valida a existência do repositório local** antes de prosseguir.
- **Aceita arquivos únicos ou múltiplos** para commit (string ou lista).
- **Adiciona apenas arquivos existentes** ao staging, com avisos para arquivos não encontrados.
- **Realiza commit (mesmo vazio) e push autenticado** para o repositório remoto.
- **Emite mensagens claras** de sucesso, erro ou aviso ao longo do processo.

---

## Exemplo de uso típico

```python
# Commit e push de um único arquivo
git_commit_and_push("data/rec.json", "Atualiza rec.json de gravação")

# Commit e push em lote (lista de arquivos)
git_commit_and_push([
    "data/rec.json",
    "posters/user1_poster.jpg",
    "posters/user2_poster.jpg"
], "Batch commit de múltiplos arquivos")
```

---

## Segurança, rastreabilidade e manutenção

- **Rastreabilidade garantida** por mensagens de commit claras e integração recomendada com o log modular (Célula 1).
- **Atomicidade** em operações batch, evitando inconsistências de dados no repositório.
- **Pronto para integração com pipelines CI/CD**, webhooks e controles de auditoria.
- **Mensagens e tratamento de erros detalhados** facilitam o diagnóstico e a evolução do sistema.

---

In [None]:
# ================================================================
# Célula 5: Commit e Push Automáticos (rec.json, posters, etc.)
# ================================================================
# Objetivo:
# - Automatizar o processo de commit e push dos arquivos modificados (rec.json, posters, etc.) para o repositório GitHub
# - Suportar tanto commit de arquivo único como em lote, permitindo estratégia de batch commit baseada em thresholds
# - Garantir rastreabilidade, atomicidade e integração segura (CI/CD)
#
# Estratégia aplicada:
# - Função modular e robusta, preparada para integração com logs e auditoria
# - Permite commit vazio por segurança, evitando falhas em pipelines sincronizados
# - Mensagens e tratamento de erros detalhados para facilitar troubleshooting
# - Utilização de variáveis globais para caminhos, usuário e token definidos nas células anteriores
# - Design pronto para evolução, reuso e integração com ferramentas externas (ex: webhooks, jobs, etc.)
# ================================================================

import os
import subprocess

def git_commit_and_push(file_paths, commit_message="Atualiza rec.json"):
    """
    Realiza git add, commit e push dos arquivos especificados.
    - file_paths pode ser uma string (arquivo único) ou uma lista de arquivos.
    - commit_message é a mensagem de commit utilizada.

    Estratégia:
    - Ajusta diretório para o repositório local clonado no Colab
    - Configura usuário e e-mail do git (necessários para CI/CD)
    - Adiciona arquivos ao staging (aceita múltiplos arquivos)
    - Realiza commit (permite commit vazio)
    - Realiza push autenticado via token
    """
    # ============================
    # VALIDAÇÃO E AJUSTE DE ENTRADAS
    # ============================
    repo_dir = f"/content/{GITHUB_REPO}"
    if not os.path.exists(repo_dir):
        raise FileNotFoundError(f"Repositório '{repo_dir}' não encontrado. Verifique se a célula de clonagem foi executada.")
    os.chdir(repo_dir)

    # Aceita string ou lista de arquivos
    if isinstance(file_paths, str):
        file_paths = [file_paths]
    elif not isinstance(file_paths, list):
        raise ValueError("file_paths deve ser uma string ou uma lista de caminhos.")

    # ============================
    # CONFIGURAÇÃO DO USUÁRIO GIT (CI/CD)
    # ============================
    subprocess.run(["git", "config", "user.email", "contato@aserio.work"], check=True)
    subprocess.run(["git", "config", "user.name", "SamuelPassamani"], check=True)

    # ============================
    # ADIÇÃO DOS ARQUIVOS AO STAGING
    # ============================
    for file_path in file_paths:
        # Verifica se o arquivo existe antes de adicionar
        if not os.path.exists(file_path):
            print(f"⚠️ Aviso: arquivo '{file_path}' não existe e será ignorado no commit.")
            continue
        subprocess.run(["git", "add", file_path], check=True)

    # ============================
    # COMMIT (PERMITE COMMIT VAZIO)
    # ============================
    try:
        subprocess.run(
            ["git", "commit", "-m", commit_message, "--allow-empty"],
            check=False  # Não força erro se não houver mudanças
        )
    except Exception as e:
        print(f"❌ Erro ao tentar realizar commit: {e}")

    # ============================
    # PUSH PARA O REPOSITÓRIO REMOTO (AUTENTICADO)
    # ============================
    try:
        remote_url = f"https://{GITHUB_USER}:{GITHUB_TOKEN}@github.com/{GITHUB_USER}/{GITHUB_REPO}.git"
        subprocess.run(
            ["git", "push", remote_url],
            check=True
        )
        print(f"✅ Push realizado com sucesso! ({commit_message})")
    except Exception as e:
        print(f"❌ Erro ao tentar realizar push: {e}")

# ============================
# FIM DA CÉLULA 5
# ============================

# Dicas e melhores práticas:
# - Use commit_messages claros e informativos para facilitar a auditoria.
# - Utilize a função dentro de loops ou triggers de batch para commit em lote.
# - Integre logs das ações de commit/push usando o log único centralizado (Célula 1).
# - Em caso de erro de autenticação, revise o token e as permissões do GitHub.

# Célula 6: Busca de Transmissões na API XCam, Blacklist Temporária, Fallback via liveInfo e Busca Inteligente/Unitária

**Objetivo:**  
Realizar a busca das transmissões ativas na API principal da XCam, mantendo o lote de transmissões sempre completo até o `LIMIT_DEFAULT` e sem duplicidades, utilizando controle de blacklist temporária e log de transmissões em processamento.  
Inclui funções de busca unitária/inteligente (para manter “lote cheio” continuamente) e gerenciamento automático de poster, com geração via ffmpeg quando necessário.

## Estratégia e melhorias implementadas

- **Blacklist temporária e controle de falhas:**  
  Usuários problemáticos são bloqueados temporariamente após atingirem o limite de falhas (`BLACKLIST_MAX_FAILURES`), acelerando o processamento e evitando ciclos infinitos.
- **Busca em lote e unitária com fallback:**  
  Consulta a API principal com limite alto para preencher o lote rapidamente. Caso necessário, realiza fallback via `/liveInfo` para usuários sem `src`.
- **Controle de duplicidade e fila inteligente:**  
  Antes de incluir qualquer transmissão, verifica no log de processamento e na blacklist para evitar tentativas repetidas ou paradas em streams problemáticos.
- **Poster garantido:**  
  Se o poster estiver ausente, inválido ou nulo, gera automaticamente uma imagem via ffmpeg a partir do stream, garantindo sempre um arquivo válido.
- **Eficiência e paralelismo:**  
  Todas as funções são preparadas para processamento paralelo e integração total ao pipeline XCam.
- **Compatibilidade:**  
  Suporte total à busca de usuários específicos, agora também protegida pela blacklist e controle de falhas.
- **Design modular:**  
  Funções separadas para busca em lote (`get_broadcasts`), busca por usuários (`buscar_usuarios_especificos`) e busca unitária/primeira transmissão livre (`buscar_proxima_transmissao_livre`), facilitando reuso e manutenção.

---

## Como funciona cada função

- **get_broadcasts:**  
  Retorna um lote de transmissões válidas, sempre checando blacklist, log de processamento e gerando poster se necessário. Realiza fallback automático para `/liveInfo` se não encontrar o src na API principal.
- **buscar_usuarios_especificos:**  
  Busca apenas os usuários informados, respeitando sempre o controle de blacklist/falhas, e faz fallback via `/liveInfo` quando necessário.
- **buscar_proxima_transmissao_livre:**  
  Busca rapidamente a próxima transmissão livre para processamento, sempre utilizando os mesmos critérios de controle, garantindo agilidade na fila e eficiência máxima.

---

## Detalhes técnicos e recomendações

- **Blacklist temporária e controle de falhas:**  
  Funções `register_failure`, `clear_failure`, `add_to_blacklist`, `is_in_blacklist`, `load_blacklist` e `save_blacklist` garantem rastreabilidade e bloqueio eficiente de usuários problemáticos.
- **Arquitetura limpa e modular:**  
  Código preparado para integração futura com log único centralizado e processamento concorrente.
- **Poster sempre válido:**  
  Funções utilitárias garantem que cada transmissão só é liberada para gravação se houver poster válido (baixado ou gerado).
- **Tratamento de erros robusto:**  
  Toda etapa crítica possui tratamento de exceções e mensagens claras para facilitar manutenção e monitoramento.

---

## Exemplo de uso das funções

```python
# Buscar lote completo de transmissões válidas
streams = get_broadcasts(limit=LIMIT_DEFAULT)

# Buscar apenas usuários específicos
streams_especificos = buscar_usuarios_especificos(["user1", "user2"])

# Buscar a próxima transmissão livre disponível
proxima_stream = buscar_proxima_transmissao_livre()
```

---

## Rastreabilidade, manutenção e integração

- Blacklist e falhas podem ser migrados para o log centralizado para máxima rastreabilidade.
- Todas as funções são compatíveis com execução paralela e integração CI/CD.
- Mensagens detalhadas e arquitetura modular facilitam manutenção e futuras expansões no pipeline do XCam.

---

In [None]:
# =====================================================================================
# XCam REC - Célula 6: Busca Inteligente e Controle de Falhas
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.Sério [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.2
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta célula implementa a lógica de aquisição de transmissões. É responsável por
# consultar a API da XCam, filtrar os resultados com base em um sistema robusto de
# controle de falhas e blacklist temporária, e garantir que cada transmissão
# selecionada para gravação tenha um pôster (thumbnail) válido. Ela contém
# funções para buscar em lote, buscar usuários específicos e encontrar a próxima
# transmissão livre de forma otimizada para o supervisor dinâmico.
#
# [@mode]
# As funções desta célula são utilizadas pelo supervisor (Célula 9) em todos os modos
# de operação, seja na busca automática por transmissões ou na busca por uma lista
# específica de usuários fornecida.
# =====================================================================================


# =====================================================================================
# 2. Configurações & Variáveis Globais (Dependências)
# =====================================================================================

# Esta célula depende das seguintes variáveis globais definidas na Célula 1:
# - BLACKLIST_LOG_FILE: Caminho para o arquivo de log da blacklist.
# - FAILURE_LOG_FILE: Caminho para o arquivo de log de contagem de falhas.
# - PROCESSING_LOG_FILE: Caminho para o arquivo de log de usuários em processamento.
# - BLACKLIST_TIMEOUT: Duração em segundos que um usuário fica na blacklist.
# - BLACKLIST_MAX_FAILURES: Número de falhas para um usuário entrar na blacklist.
# - As funções utilitárias (download_and_save_poster, etc.) da Célula 3.


# =====================================================================================
# 3. Corpo
# =====================================================================================

# --- Bloco de Gerenciamento da Blacklist Temporária ---
# Este bloco contém funções CRUD para o arquivo de log da blacklist.
# NOTA: Em uma versão futura, esta lógica pode ser migrada para o log central.

def load_blacklist():
    """
    Carrega a lista de usuários em blacklist do arquivo.
    Filtra e remove automaticamente entradas que já expiraram com base no BLACKLIST_TIMEOUT.
    """
    # Se o arquivo não existe, retorna um dicionário vazio.
    if not os.path.exists(BLACKLIST_LOG_FILE): return {}
    # Abre o arquivo para leitura.
    with open(BLACKLIST_LOG_FILE, "r") as f:
        now = time.time() # Obtém o timestamp atual para comparar.
        # Lê cada linha, separando usuário e timestamp.
        lines = [line.strip().split(",") for line in f if line.strip()]
        # Retorna um dicionário apenas com os usuários cuja blacklist ainda não expirou.
        return {user: float(ts) for user, ts in lines if now - float(ts) < BLACKLIST_TIMEOUT}

def save_blacklist(blacklist):
    """Salva o dicionário da blacklist de volta no arquivo de log."""
    with open(BLACKLIST_LOG_FILE, "w") as f:
        for user, ts in blacklist.items():
            f.write(f"{user},{ts}\\n")

def add_to_blacklist(username):
    """Adiciona um usuário à blacklist com o timestamp atual."""
    blacklist = load_blacklist() # Carrega a blacklist atual.
    blacklist[username] = time.time() # Adiciona/atualiza o usuário com o novo timestamp.
    save_blacklist(blacklist) # Salva a blacklist atualizada.
    print(f"⚠️ Usuário '{username}' adicionado à blacklist temporária.")

def is_in_blacklist(username):
    """Verifica de forma rápida se um usuário está atualmente na blacklist."""
    return username in load_blacklist()

# --- Bloco de Gerenciamento de Falhas de Gravação ---
# Controla quantas vezes consecutivas a gravação de um usuário falhou.

def load_failures():
    """Carrega o dicionário de contagem de falhas (usuário: contagem) do arquivo."""
    if not os.path.exists(FAILURE_LOG_FILE): return {}
    with open(FAILURE_LOG_FILE, "r") as f:
        return {user: int(count) for user, count in (line.strip().split(",") for line in f if line.strip())}

def save_failures(failures):
    """Salva o dicionário de falhas de volta no arquivo de log."""
    with open(FAILURE_LOG_FILE, "w") as f:
        for user, count in failures.items():
            f.write(f"{user},{count}\\n")

def register_failure(username):
    """
    Registra uma falha para um usuário. Se o limite for atingido,
    o usuário é movido para a blacklist e seu contador de falhas é zerado.
    """
    failures = load_failures() # Carrega as falhas atuais.
    failures[username] = failures.get(username, 0) + 1 # Incrementa o contador.
    # Verifica se o limite de falhas foi atingido.
    if failures[username] >= BLACKLIST_MAX_FAILURES:
        add_to_blacklist(username) # Adiciona à blacklist.
        failures.pop(username, None) # Remove do contador de falhas.
    save_failures(failures) # Salva o estado atualizado.

def clear_failure(username):
    """Limpa o contador de falhas para um usuário (usado após uma gravação bem-sucedida)."""
    failures = load_failures() # Carrega as falhas.
    if username in failures: # Se o usuário tiver um registro de falha...
        failures.pop(username) # ...remove o registro.
        save_failures(failures) # Salva o estado limpo.

# --- Funções de Busca na API XCam ---

def get_broadcasts(limit=LIMIT_DEFAULT, page=PAGE_DEFAULT, usuarios_especificos=None, temp_folder=DRIVE_POSTERS_TEMP_PATH):
    """
    Função principal de busca em lote.
    Retorna uma lista de transmissões válidas, prontas para gravação.
    """
    # Carrega a lista de usuários que já estão em processo de gravação para evitar duplicidade.
    transmissao_em_proc = set()
    if os.path.exists(PROCESSING_LOG_FILE):
        with open(PROCESSING_LOG_FILE, "r") as f:
            transmissao_em_proc = set([line.strip() for line in f if line.strip()])

    # Define a URL da API, ajustando o limite se for uma busca por usuários específicos.
    api_url_main = f"https://api.xcam.gay/?limit={API_SEARCH_LIMIT if usuarios_especificos else 1500}&page=1"
    print(f"🌐 Acessando API: {api_url_main}")

    streams_from_main = []      # Lista para streams com URL direta.
    streams_without_preview = [] # Lista para streams que precisarão de fallback.

    try:
        # Faz a requisição para a API principal.
        response_main = requests.get(api_url_main, timeout=30)
        response_main.raise_for_status() # Lança um erro se a resposta não for 2xx.
        items = response_main.json().get("broadcasts", {}).get("items", [])

        # Processa cada item retornado pela API.
        for item in items:
            username = item.get("username")
            # Pula se o usuário for inválido, estiver em processamento ou na blacklist.
            if not username or username in transmissao_em_proc or is_in_blacklist(username):
                continue
            # Se for uma busca específica, pula usuários que não estão na lista.
            if usuarios_especificos and username not in usuarios_especificos:
                continue

            src = item.get("preview", {}).get("src")
            # Se o item já tem uma URL de stream...
            if src:
                # ... tenta obter um pôster válido.
                poster_url = item.get("preview", {}).get("poster")
                poster_path = download_and_save_poster(poster_url, username, temp_folder) or generate_poster_with_ffmpeg(src, username, temp_folder)
                if is_poster_valid(poster_path):
                    streams_from_main.append({"username": username, "src": src, "poster": poster_path})
                    clear_failure(username) # Limpa falhas se obteve dados válidos.
                else:
                    register_failure(username) # Registra falha se não conseguiu obter o pôster.
            else:
                # Se não tem URL, adiciona à lista de fallback.
                streams_without_preview.append({"username": username})

    except Exception as e:
        print(f"❌ Erro ao acessar API principal: {e}")

    # Processo de Fallback para streams sem URL direta.
    if streams_without_preview:
        print(f"🔁 Buscando liveInfo para {len(streams_without_preview)} streams...")
        for stream_info in streams_without_preview:
            username = stream_info["username"]
            # Novamente, verifica se o usuário deve ser processado.
            if username in transmissao_em_proc or is_in_blacklist(username):
                continue
            
            # Tenta a API de liveInfo.
            try:
                live_info_url = f"https://api.xcam.gay/user/{username}/liveInfo"
                response_liveinfo = requests.get(live_info_url, timeout=10)
                response_liveinfo.raise_for_status()
                data_liveinfo = response_liveinfo.json()
                m3u8_url = data_liveinfo.get("cdnURL") or data_liveinfo.get("edgeURL")
                
                if m3u8_url:
                    poster_path = generate_poster_with_ffmpeg(m3u8_url, username, temp_folder)
                    if is_poster_valid(poster_path):
                        streams_from_main.append({"username": username, "src": m3u8_url, "poster": poster_path})
                        clear_failure(username)
                    else:
                        register_failure(username)
                else:
                    register_failure(username)
            except Exception as ex:
                print(f"❌ Erro no fallback liveInfo para {username}: {ex}")
                register_failure(username)
            time.sleep(0.5) # Pequena pausa para não sobrecarregar a API.

    # Combina e filtra a lista final.
    final_streams_list = []
    seen_usernames = set()
    for stream in streams_from_main:
        if stream["username"] not in seen_usernames:
            final_streams_list.append(stream)
            seen_usernames.add(stream["username"])
            if len(final_streams_list) >= limit:
                break
    
    print(f"🔎 Selecionadas {len(final_streams_list)} streams válidas para processamento (limite: {limit}).")
    return final_streams_list

def buscar_usuarios_especificos(usuarios_lista, temp_folder=DRIVE_POSTERS_TEMP_PATH):
    """Função de conveniência para buscar uma lista específica de usuários."""
    return get_broadcasts(limit=len(usuarios_lista), usuarios_especificos=usuarios_lista, temp_folder=temp_folder)

def buscar_proxima_transmissao_livre(temp_folder=DRIVE_POSTERS_TEMP_PATH):
    """
    Busca de forma otimizada apenas a PRÓXIMA transmissão livre,
    ideal para preencher vagas no lote do supervisor.
    """
    # Chama a função principal com limite 1 para retornar assim que encontrar a primeira válida.
    streams = get_broadcasts(limit=1, temp_folder=temp_folder)
    if streams:
        print(f"🎯 Próxima transmissão livre encontrada: {streams[0]['username']}")
        return streams[0]
    else:
        print("🚫 Nenhuma transmissão livre encontrada no momento.")
        return None

# =====================================================================================
# 4. Rodapé / Fim do Código
# =====================================================================================
# @log de mudanças
# - v4.6.2 (01/07/2025): Refatoração completa para o padrão de documentação XCam.
#   Adição de comentários detalhados e organização estrutural.
# - v4.6.1: Atualização dos caminhos de log para usar as variáveis globais da Célula 1.
# - v4.6.0: Versão inicial com lógica de busca e blacklist.
#
# @roadmap futuro
# - Centralizar 100% a lógica de `blacklist` e `failures` no sistema de log único da
#   Célula 1, eliminando os arquivos `xcam_blacklist.log` e `xcam_failures.log`.
# - Implementar um cache para as respostas da API para reduzir o número de requisições
#   em execuções muito próximas.
# =====================================================================================

# Célula 7: Gravação da Stream, Poster Automático, Controle de Falhas, Log Seguro e Blacklist Inteligente

**Objetivo:**  
Automatizar a gravação de transmissões ao vivo com ffmpeg, garantindo robustez, rastreabilidade e integração com a lógica de blacklist temporária e controle de falhas. A célula também assegura o gerenciamento seguro do log de transmissões em processamento e a limpeza de arquivos temporários.

## Estratégia e melhorias implementadas

- **Gerenciamento seguro de log:**  
  O usuário é registrado no log de transmissões em processamento antes da gravação e removido dele ao final (tanto em sucesso quanto em erro), evitando duplicidade e permitindo paralelismo seguro.
- **Poster sempre válido:**  
  O sistema tenta baixar o poster da API. Se o poster estiver ausente, inválido ou nulo, gera automaticamente uma imagem via ffmpeg, assegurando que toda transmissão tenha um poster associado e válido.
- **Controle de tempo mínimo:**  
  Se a gravação resultar em vídeo muito curto, tanto o arquivo de vídeo quanto o poster são descartados imediatamente, e uma falha é registrada para o usuário.
- **Tratamento robusto de falhas:**  
  Qualquer falha (ffmpeg, exceptions, etc.) é registrada. Ao atingir o número máximo de falhas consecutivas (`BLACKLIST_MAX_FAILURES`), o usuário entra automaticamente na blacklist temporária, evitando tentativas infinitas e desperdício de recursos.
- **Limpeza automatizada:**  
  Após upload ou erro, todos os arquivos temporários (vídeo e poster) são removidos, otimizando o uso do disco e mantendo o ambiente do Colab limpo.
- **Reset de falhas em caso de sucesso:**  
  Quando a gravação é válida, o contador de falhas do usuário é limpo, evitando blacklist indevida.
- **Comentários detalhados e código modular:**  
  O fluxo é completamente documentado, facilitando manutenção, revisão e entendimento por toda a equipe.

---

## Fluxo resumido da função principal

1. **Registra o usuário** no log de transmissões em processamento.
2. **Garante um poster válido** (download ou geração automática).
3. **Executa o ffmpeg** para gravar a transmissão e monitora o progresso em tempo real.
4. **Valida a gravação**:
   - Se falhar, registra falha e trata blacklist.
   - Se for curta demais, descarta e registra falha.
   - Se for válida, limpa contador de falhas e prossegue normalmente.
5. **Após upload ou erro**, remove o usuário do log e limpa arquivos temporários.

---

## Exemplo de uso

```python
resultado = gravar_stream(username="user123", m3u8_url="https://cdn.xcam.gay/m3u8/...", poster_url="https://api.xcam.gay/poster/...")
if resultado['upload_success']:
    print("Gravação e upload realizados com sucesso!")
else:
    print("Falha na gravação ou upload:", resultado['abyss_response'])
```

---

## Segurança, rastreabilidade e integração

- **Pronto para CI/CD e execução paralela:**  
  Controle rigoroso de log e blacklist garante execução concorrente, segura e rastreável por todo o pipeline XCam.
- **Integração total com as funções globais:**  
  Utiliza funções de blacklist e falha da Célula 6, promovendo rastreabilidade e controle centralizado.
- **Diagnóstico facilitado:**  
  Mensagens e logs detalhados em cada etapa do processo.

---

In [None]:
# =====================================================================================
# XCam REC - Célula 7: Worker de Gravação (ffmpeg)
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.Sério [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.2
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta célula contém a lógica principal do worker de gravação. Cada processo paralelo
# executará a função `gravar_stream` para realizar as seguintes tarefas:
#   1. Registrar-se como "em processamento" para evitar gravações duplicadas.
#   2. Garantir a existência de um pôster (thumbnail) válido, baixando ou gerando via ffmpeg.
#   3. Executar o comando `ffmpeg` para gravar o stream de vídeo.
#   4. Monitorar o progresso da gravação em tempo real.
#   5. Validar o arquivo de vídeo final, checando sua duração mínima.
#   6. Interagir com o sistema de controle de falhas e blacklist (Célula 6).
#   7. Passar os artefatos para a próxima etapa (upload e pós-processamento, Célula 8).
#   8. Garantir a limpeza de todos os arquivos temporários, independentemente do resultado.
#
# [@mode]
# As funções desta célula são o "trabalho pesado" do notebook e são executadas
# pelos processos paralelos gerenciados pelo supervisor (Célula 9).
# =====================================================================================


# =====================================================================================
# 2. Configurações & Variáveis Globais (Dependências)
# =====================================================================================

# Esta célula depende das seguintes variáveis e funções globais:
# - Definidas na Célula 1:
#   - PROCESSING_LOG_FILE: Caminho para o log de usuários em processamento.
#   - DRIVE_RECORDS_TEMP_PATH: Pasta para salvar os vídeos temporários.
#   - DRIVE_POSTERS_TEMP_PATH: Pasta para salvar os pôsteres temporários.
#   - RECORD_SECONDS: Duração máxima da gravação.
#   - RECORD_SECONDS_MIN: Duração mínima para um vídeo ser considerado válido.
# - Definidas na Célula 3:
#   - download_and_save_poster(), generate_poster_with_ffmpeg(), is_poster_valid()
#   - format_seconds(), log_progress()
# - Definidas na Célula 6:
#   - register_failure(), clear_failure()
# - Definidas na Célula 8:
#   - upload_to_abyss_and_update_json()


# =====================================================================================
# 3. Corpo
# =====================================================================================

def get_video_duration(filepath):
    """
    Retorna a duração real de um arquivo de vídeo em segundos, utilizando o ffprobe.
    É o método mais confiável para validar a gravação.
    Retorna None em caso de erro ou se o arquivo não for encontrado.
    """
    # Verifica se o arquivo de fato existe antes de tentar analisá-lo.
    if not os.path.exists(filepath):
        print(f"⚠️ Arquivo para ffprobe não encontrado: {filepath}")
        return None
    try:
        # Comando ffprobe para extrair a duração do formato em formato JSON.
        cmd = ["ffprobe", "-v", "error", "-show_entries", "format=duration", "-of", "json", filepath]
        # Executa o comando com um timeout para evitar travamentos.
        result = subprocess.run(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE, text=True, timeout=60)
        # Converte a saída JSON para um dicionário Python.
        info = json.loads(result.stdout)
        # Retorna a duração como um número inteiro.
        return int(round(float(info["format"]["duration"])))
    except Exception as e:
        # Em caso de erro (arquivo corrompido, etc.), loga e retorna None.
        print(f"⚠️ Erro no ffprobe para {filepath}: {e}")
        return None

def gravar_stream(username, m3u8_url, poster_url=None, poster_frame_time=7):
    """
    Função principal do worker: orquestra a gravação de um único stream.
    """
    # --- Etapa 1: Registro de Processamento ---
    # Adiciona o usuário ao log de processamento para evitar que outro worker o pegue.
    with open(PROCESSING_LOG_FILE, "a") as f:
        f.write(f"{username}\\n")

    # Define nomes de arquivos e caminhos temporários usando as variáveis globais.
    start_time_dt = datetime.now()
    temp_filename = f"{username}_{start_time_dt.strftime('%Y%m%d_%H%M%S')}_temp.mp4"
    filepath = os.path.join(DRIVE_RECORDS_TEMP_PATH, temp_filename)
    print(f"\\n🎬 Iniciando gravação de: {username} em {filepath}")

    # --- Etapa 2: Garantia de Pôster Válido ---
    poster_temp_path = None
    # Tenta primeiro baixar o pôster da URL fornecida.
    if poster_url:
        poster_temp_path = download_and_save_poster(poster_url, username, DRIVE_POSTERS_TEMP_PATH)
    # Se o download falhar ou não houver URL, tenta gerar via ffmpeg como fallback.
    if not is_poster_valid(poster_temp_path) and m3u8_url:
        poster_temp_path = generate_poster_with_ffmpeg(m3u8_url, username, DRIVE_POSTERS_TEMP_PATH, frame_time=poster_frame_time)

    # --- Etapa 3: Execução do FFmpeg ---
    # Constrói o comando ffmpeg para a gravação.
    # -c copy: copia o stream diretamente sem re-encodar, o que é muito mais rápido e leve.
    ffmpeg_cmd = ["ffmpeg", "-i", m3u8_url, "-t", str(RECORD_SECONDS), "-c", "copy", "-y", filepath]
    
    # O bloco try/finally garante que a limpeza ocorrerá mesmo se a gravação falhar.
    try:
        # Inicia o processo ffmpeg.
        process = subprocess.Popen(
            ffmpeg_cmd,
            stdout=subprocess.PIPE,
            stderr=subprocess.STDOUT,
            text=True,
            bufsize=1,
            universal_newlines=True
        )

        # Monitora a saída do ffmpeg em tempo real para exibir o progresso.
        last_log_time = time.time()
        for line in iter(process.stdout.readline, ''):
            if "time=" in line:
                # Loga o progresso a cada minuto para não poluir o console.
                if time.time() - last_log_time > 60:
                    try:
                        match = re.search(r"time=(\\d+):(\\d+):(\\d+)", line)
                        if match:
                            h, m, s = map(int, match.groups())
                            elapsed_seconds = h * 3600 + m * 60 + s
                            log_progress(username, elapsed_seconds, RECORD_SECONDS)
                            last_log_time = time.time()
                    except Exception:
                        pass # Ignora erros de parsing de progresso.
        
        # Espera o processo ffmpeg terminar.
        process.wait()

        # --- Etapa 4: Validação Pós-Gravação ---
        # Verifica se o ffmpeg terminou com erro.
        if process.returncode != 0:
            raise Exception(f"FFmpeg falhou com código {process.returncode}")

        # Valida a duração real do arquivo gerado.
        elapsed_seconds_real = get_video_duration(filepath)
        if elapsed_seconds_real is None or elapsed_seconds_real < RECORD_SECONDS_MIN:
            raise ValueError(f"Gravação muito curta ({elapsed_seconds_real}s)")

        # --- Etapa 5: Sucesso ---
        # Se a gravação foi bem-sucedida, limpa o contador de falhas do usuário.
        clear_failure(username)
        # Formata o nome final do arquivo com data, hora e duração.
        data_str = start_time_dt.strftime("%d-%m-%Y")
        horario_str = start_time_dt.strftime("%H-%M")
        tempo_formatado = format_seconds(elapsed_seconds_real)
        final_filename = f"{username}_{data_str}_{horario_str}_{tempo_formatado}.mp4"
        final_filepath = os.path.join(DRIVE_RECORDS_TEMP_PATH, final_filename)
        # Renomeia o arquivo temporário para o nome final.
        os.rename(filepath, final_filepath)
        filepath = final_filepath # Atualiza o ponteiro para o novo nome.

        # Passa os artefatos para a próxima célula (upload e pós-processamento).
        success, abyss_resp, slug = upload_to_abyss_and_update_json(
            final_filepath, username, elapsed_seconds_real, poster_temp_path=poster_temp_path
        )
        # Retorna um dicionário com o resultado completo da operação.
        return {'upload_success': success, 'abyss_response': abyss_resp, 'slug': slug, 'username': username, 'filename': final_filename}

    except Exception as e:
        # --- Etapa 6: Tratamento de Falha ---
        # Se qualquer erro ocorrer, registra uma falha para o usuário.
        print(f"❌ Erro na gravação de {username}: {e}")
        register_failure(username)
        # Retorna um dicionário indicando a falha.
        return {'upload_success': False, 'abyss_response': str(e), 'username': username, 'filename': temp_filename}

    finally:
        # --- Etapa 7: Limpeza Robusta ---
        # Este bloco é executado sempre, garantindo a limpeza do ambiente.
        
        # Remove o usuário do log de processamento.
        if os.path.exists(PROCESSING_LOG_FILE):
            with open(PROCESSING_LOG_FILE, "r") as f: lines = f.readlines()
            with open(PROCESSING_LOG_FILE, "w") as f:
                for line in lines:
                    if line.strip() != username: f.write(line)
        
        # Remove o arquivo de vídeo temporário, se ainda existir.
        if os.path.exists(filepath):
            try:
                os.remove(filepath)
                print(f"🗑️ Vídeo temporário removido: {filepath}")
            except OSError as e:
                print(f"⚠️ Falha ao remover vídeo temporário: {e}")

        # Remove o arquivo de pôster temporário, se ainda existir.
        if poster_temp_path and os.path.exists(poster_temp_path):
            try:
                os.remove(poster_temp_path)
                print(f"🗑️ Poster temporário removido: {poster_temp_path}")
            except OSError as e:
                print(f"⚠️ Falha ao remover poster temporário: {e}")


# =====================================================================================
# 4. Rodapé / Fim do Código
# =====================================================================================
# @log de mudanças
# - v4.6.2 (01/07/2025): Refatoração completa para o padrão de documentação XCam,
#   com comentários detalhados em cada etapa da função de gravação.
# - v4.6.1: Atualização dos caminhos de arquivo para usar as variáveis globais
#   do Google Drive definidas na Célula 1.
# - v4.6.0: Versão inicial da função de gravação.
#
# @roadmap futuro
# - Implementar um parsing mais avançado da saída do ffmpeg para extrair mais
#   metadados, como bitrate e resolução, e salvá-los no `rec.json`.
# - Adicionar uma verificação de espaço em disco no Google Drive antes de iniciar
#   uma nova gravação para evitar falhas por falta de armazenamento.
# =====================================================================================

# Célula 8: Upload para Abyss.to, Atualização do rec.json, Commit Poster e Sincronização com Google Drive

**Objetivo:**  
Realizar upload do vídeo gravado para Abyss.to, registrar e atualizar todos os metadados relevantes no arquivo `rec.json` do usuário, garantir a movimentação/renomeação adequada do poster e executar o commit/push automatizado de arquivos alterados, sincronizando também com o Google Drive.  
O processo é otimizado para processamento em lote: os arquivos modificados só são enviados quando o número atingir o limiar (`COMMIT_PUSH_THRESHOLD`), promovendo eficiência e integridade do repositório, mesmo em execução paralela.

---

## Estratégia e melhorias implementadas

- **Commit/push em lote otimizado:**  
  Arquivos alterados são acumulados em um buffer. O commit e push são executados automaticamente apenas quando a quantidade de arquivos atinge o threshold configurado, reduzindo conflitos e otimizando o workflow CI/CD.
- **Sincronização automática com o Google Drive:**  
  Sempre que `rec.json` ou poster são atualizados, uma cópia é feita para o diretório correspondente do usuário no Google Drive (se disponível), garantindo redundância, persistência e facil acesso externo aos metadados e imagens.
- **Atomicidade e segurança em concorrência:**  
  O acesso ao buffer de commit é protegido por lock (`threading.Lock`), assegurando integridade mesmo em processamento paralelo ou múltiplos workers.
- **Poster sempre correto e rastreável:**  
  O poster utilizado é sempre movido/renomeado para o local definitivo e associado ao vídeo pelo nome (`slug`). O caminho é sincronizado tanto no repositório quanto no Drive.
- **Atualização robusta do rec.json:**  
  O histórico do usuário é preenchido com todos os campos, incluindo poster, urlIframe, data, horário e tempo formatado. O padrão da estrutura JSON é rigorosamente seguido, facilitando a integração, análise e exportação dos dados.
- **Limpeza automática de arquivos temporários:**  
  Após mover, copiar e commitar os arquivos, os temporários são removidos, mantendo o ambiente Colab limpo e eficiente.

---

## Como funciona o fluxo principal

1. **Faz upload do vídeo para Abyss.to** e recebe a confirmação (slug, url, urlIframe).
2. **Move/renomeia o poster** para o local definitivo no repositório, associando ao vídeo pelo slug.
3. **Atualiza ou cria `rec.json`** do usuário, preenchendo todos os metadados da gravação.
4. **Adiciona arquivos alterados ao buffer de commit** (com lock para evitar concorrência).
5. **Sincroniza** `rec.json` e poster no Google Drive, mantendo redundância e facilidade de acesso.
6. **Executa commit/push automático em lote** ao atingir o limiar definido; ao final do processamento faz o commit/push dos arquivos restantes.
7. **Limpa arquivos temporários** garantindo eficiência e organização do ambiente.

---

## Exemplo de uso recomendado

```python
# Após concluir o upload e gerar poster:
upload_success, abyss_response, slug = upload_to_abyss_and_update_json(
    filepath=arquivo_video,
    username="usuario",
    duration_seconds=duracao,
    poster_temp_path=caminho_poster_temp
)

# Ao final do processamento, para garantir commit dos arquivos restantes:
commit_push_restantes()
```

---

## Segurança, rastreabilidade e integração

- **Processo compatível com execução concorrente** e pipelines CI/CD.
- **Commit/push protegido contra condições de corrida**, garantindo atomicidade dos dados no repositório.
- **Sincronização Drive robusta**, ideal para ambientes colaborativos ou para garantir backup.
- **Mensagens e logs claros** facilitam manutenção, auditoria e diagnóstico rápido em todo o pipeline XCam.

---

In [None]:
# =====================================================================================
# XCam REC - Célula 8: Pós-processamento, Upload e Sincronização
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.Sério [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.2
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta célula executa o pós-processamento de uma gravação bem-sucedida. Suas
# responsabilidades são:
#   1. Fazer o upload do vídeo para o serviço de armazenamento externo (Abyss.to).
#   2. Atualizar o arquivo de metadados do usuário (`rec.json`) com as informações da nova gravação.
#   3. Gerenciar o pôster final, renomeando-o com o slug do vídeo e movendo-o para a pasta correta.
#   4. Sincronizar os metadados e o pôster com o Google Drive para persistência.
#   5. Adicionar os arquivos modificados a um buffer de commit para serem enviados em lote ao GitHub.
#   6. Limpar os arquivos temporários remanescentes.
#
# [@mode]
# Esta célula é chamada no final do ciclo de vida de cada worker de gravação bem-sucedido.
# A lógica de commit em lote é projetada para funcionar de forma segura em ambientes
# de processamento paralelo.
# =====================================================================================


# =====================================================================================
# 2. Configurações & Variáveis Globais (Dependências)
# =====================================================================================

# Esta célula depende das seguintes variáveis globais definidas nas células anteriores:
# - ABYSS_UPLOAD_URL: URL do serviço de upload.
# - BASE_REPO_FOLDER: Caminho do repositório clonado no ambiente Colab.
# - DRIVE_ARCHIVE_BASE_PATH: Caminho base no Google Drive para arquivamento final.
# - COMMIT_PUSH_THRESHOLD: Limiar para o commit em lote.
# - As funções utilitárias (format_seconds) e de commit (git_commit_and_push).

# --- Controle de Concorrência ---
# Cria um "lock" (trava) para garantir que o buffer de commit seja modificado por
# apenas um processo de cada vez. Isso é essencial para evitar condições de corrida
# (race conditions) quando vários workers paralelos terminam ao mesmo tempo.
commit_lock = threading.Lock()


# =====================================================================================
# 3. Corpo
# =====================================================================================

def upload_to_abyss_and_update_json(
    filepath, username, duration_seconds, poster_temp_path=None
):
    """
    Orquestra o upload, atualização de metadados, gerenciamento de pôster e
    o acúmulo de arquivos para o commit em lote.
    """
    # Extrai o nome do arquivo e define o tipo de mídia.
    file_name = os.path.basename(filepath)
    file_type = 'video/mp4'
    print(f"⬆️ Upload de: {file_name} para Abyss.to...")

    # Inicializa variáveis de controle do resultado do upload.
    upload_success = False
    abyss_response = "Upload falhou - Sem resposta"
    uploaded_url = None
    slug = None

    # --- Etapa 1: Upload do Vídeo para o Serviço Externo ---
    try:
        # Abre o arquivo de vídeo em modo de leitura binária ('rb').
        with open(filepath, 'rb') as f:
            # Prepara o payload para a requisição POST multipart/form-data.
            files = { 'file': (file_name, f, file_type) }
            # Envia a requisição para a URL de upload.
            response = requests.post(ABYSS_UPLOAD_URL, files=files, timeout=300) # Timeout de 5 min.
            response.raise_for_status() # Lança erro para status HTTP 4xx/5xx.
            resp_json = response.json()
            abyss_response = resp_json
            
            # Verifica se o upload foi bem-sucedido com base na resposta da API.
            if resp_json.get('status'):
                upload_success = True
                uploaded_url = resp_json.get('url') or resp_json.get('urlIframe')
                slug = resp_json.get('slug') or resp_json.get('video')
                print(f"📤 Upload bem-sucedido. URL: {uploaded_url} | SLUG: {slug}")
            else:
                print(f"❌ Falha no upload. Mensagem: {resp_json.get('message', 'Sem mensagem de erro')}")
    except Exception as e:
        abyss_response = f"Erro no upload: {e}"
        print(f"❌ Erro crítico no upload: {e}")

    # --- Etapa 2: Gerenciamento do Pôster Final ---
    poster_final_relpath = None
    # Este bloco só é executado se o upload do vídeo tiver sido um sucesso.
    if upload_success and is_poster_valid(poster_temp_path) and slug:
        try:
            # Define o caminho final do pôster dentro do repositório clonado.
            user_folder = os.path.join(BASE_REPO_FOLDER, "xcam-db", "user", username)
            os.makedirs(user_folder, exist_ok=True)
            # O nome final do pôster será o slug do vídeo, para fácil associação.
            poster_final_name = f"{slug}.jpg"
            poster_final_path = os.path.join(user_folder, poster_final_name)
            
            # Move o pôster temporário para sua localização final.
            shutil.move(poster_temp_path, poster_final_path)
            # Obtém o caminho relativo para adicionar ao Git.
            poster_final_relpath = os.path.relpath(poster_final_path, BASE_REPO_FOLDER)
            print(f"🖼️ Pôster movido para: {poster_final_path}")

            # Copia o pôster para o Google Drive para persistência.
            drive_user_dir = os.path.join(DRIVE_ARCHIVE_BASE_PATH, username)
            os.makedirs(drive_user_dir, exist_ok=True)
            poster_drive_path = os.path.join(drive_user_dir, poster_final_name)
            shutil.copy2(poster_final_path, poster_drive_path)
            print(f"🗂️ Pôster também salvo no Drive: {poster_drive_path}")

        except Exception as e:
            print(f"❌ Erro ao mover/renomear pôster: {e}")
            poster_final_relpath = None # Zera em caso de erro.
            
    # --- Etapa 3: Atualização do rec.json ---
    if upload_success:
        try:
            # Define o caminho do arquivo rec.json para o usuário.
            user_folder = os.path.join(BASE_REPO_FOLDER, "xcam-db", "user", username)
            os.makedirs(user_folder, exist_ok=True)
            json_filepath = os.path.join(user_folder, "rec.json")

            # Constrói a nova entrada de vídeo para o JSON.
            new_video_entry = {
                "video": slug,
                "title": os.path.basename(filepath).replace('.mp4', ''),
                "file": file_name,
                "url": uploaded_url,
                "poster": f"https://cdn.xcam.gay/0:/user/{username}/{slug}.jpg" if slug else "",
                "urlIframe": f"https://short.icu/{slug}?thumbnail={poster_url}" if slug else "",
                "data": datetime.now().strftime("%d-%m-%Y"),
                "horario": datetime.now().strftime("%H-%M"),
                "tempo": format_seconds(duration_seconds)
            }

            # Carrega o rec.json existente ou cria um novo se não existir.
            # Esta lógica robusta previne a corrupção do arquivo.
            rec_data = {"username": username, "records": 0, "videos": []}
            if os.path.exists(json_filepath):
                try:
                    with open(json_filepath, 'r', encoding='utf-8') as f:
                        rec_data = json.load(f)
                        if not isinstance(rec_data.get("videos"), list): # Validação
                           rec_data["videos"] = []
                except json.JSONDecodeError:
                    print(f"⚠️ rec.json de {username} estava corrompido e será recriado.")
            
            # Adiciona o novo vídeo e atualiza o contador.
            rec_data["videos"].append(new_video_entry)
            rec_data["records"] = len(rec_data["videos"])
            
            # Salva o arquivo JSON atualizado.
            with open(json_filepath, 'w', encoding='utf-8') as f:
                json.dump(rec_data, f, indent=2, ensure_ascii=False)
            print(f"✅ rec.json para {username} atualizado.")

            # Copia o rec.json atualizado para o Google Drive.
            drive_user_dir = os.path.join(DRIVE_ARCHIVE_BASE_PATH, username)
            os.makedirs(drive_user_dir, exist_ok=True)
            shutil.copy2(json_filepath, os.path.join(drive_user_dir, "rec.json"))
            print(f"🗂️ rec.json também salvo no Drive.")

            # --- Etapa 4: Adiciona Arquivos ao Buffer de Commit ---
            # O bloco `with commit_lock:` garante que esta seção seja atômica.
            with commit_lock:
                # Inicializa o buffer de commit se for a primeira vez.
                if not hasattr(upload_to_abyss_and_update_json, 'commit_buffer'):
                    upload_to_abyss_and_update_json.commit_buffer = []
                
                # Adiciona o rec.json e o pôster (se houver) ao buffer.
                json_rel_path = os.path.relpath(json_filepath, BASE_REPO_FOLDER)
                if json_rel_path not in upload_to_abyss_and_update_json.commit_buffer:
                    upload_to_abyss_and_update_json.commit_buffer.append(json_rel_path)
                if poster_final_relpath and poster_final_relpath not in upload_to_abyss_and_update_json.commit_buffer:
                    upload_to_abyss_and_update_json.commit_buffer.append(poster_final_relpath)

                # Verifica se o threshold foi atingido para disparar o commit.
                buffer = upload_to_abyss_and_update_json.commit_buffer
                if len(buffer) >= COMMIT_PUSH_THRESHOLD:
                    print(f"🚀 Limiar de commit atingido ({len(buffer)} arquivos). Enviando para o GitHub...")
                    git_commit_and_push(list(buffer), commit_message="[AUTO] Batch commit de metadados")
                    buffer.clear() # Limpa o buffer após o push.

        except Exception as e:
            print(f"❌ Erro crítico ao atualizar rec.json ou gerenciar buffer: {e}")
            abyss_response = f"Upload sucesso, mas falha no JSON: {e}"

    return upload_success, abyss_response, slug

def commit_push_restantes():
    """
    Função para ser chamada no final do notebook para garantir que
    qualquer arquivo restante no buffer seja comitado e enviado.
    """
    # Acessa o buffer de forma segura.
    buffer = getattr(upload_to_abyss_and_update_json, 'commit_buffer', [])
    if buffer:
        print(f"🔔 Realizando commit/push final de {len(buffer)} arquivos pendentes...")
        # Usa o lock para garantir segurança, embora seja menos provável
        # ter concorrência nesta fase final.
        with commit_lock:
            git_commit_and_push(buffer, commit_message="[AUTO] Commit final de pendências da sessão")
            buffer.clear()
    else:
        print("✅ Sem arquivos pendentes para o commit final.")

# =====================================================================================
# 4. Rodapé / Fim do Código
# =====================================================================================
# @log de mudanças
# - v4.6.2 (01/07/2025): Refatoração completa para o padrão de documentação XCam,
#   com comentários detalhados em cada etapa da função de pós-processamento.
# - v4.6.1: Atualização dos caminhos para usar as variáveis globais do Google Drive.
# - v4.6.0: Versão inicial da função de upload e atualização de JSON.
#
# @roadmap futuro
# - Abstrair a lógica de upload para uma classe `Uploader`, permitindo
#   adicionar facilmente novos provedores de armazenamento (ex: S3, Backblaze)
#   no futuro, sem alterar o fluxo principal.
# - Implementar um mecanismo de "write-ahead-log" ou escrita transacional
#   para o `rec.json` (escrever em um `.tmp` e renomear) para garantir 100% de
#   integridade mesmo se o notebook for interrompido durante a escrita do arquivo.
# =====================================================================================

# Célula 9: Processamento Automático, Paralelismo e Supervisor Dinâmico com Blacklist

**Objetivo:**  
Controlar e orquestrar todo o pipeline do notebook, garantindo processamento contínuo, paralelo, eficiente e seguro de transmissões ao vivo. O supervisor dinâmico mantém o lote sempre cheio, respeita a blacklist temporária e o log central, e integra todas as funções críticas das células anteriores, garantindo máxima resiliência e rastreabilidade.

---

## Estratégia e melhorias implementadas

- **Paralelismo seguro e eficiente:**  
  Utiliza múltiplos processos para gravar e processar transmissões simultaneamente, otimizando o uso de recursos e acelerando o processamento em lote.
- **Supervisor dinâmico e lote sempre cheio:**  
  O supervisor monitora constantemente as vagas livres no lote e preenche em tempo real com novas transmissões válidas, evitando ociosidade e maximizando a eficiência.
- **Controle centralizado de duplicidade:**  
  Antes de processar qualquer transmissão, consulta o log central de processamento para evitar duplicidade, mesmo em ambientes concorrentes ou paralelos.
- **Respeito integral à blacklist temporária:**  
  Transmissões de usuários em blacklist não são tentadas novamente durante o ciclo vigente, economizando recursos e evitando loops problemáticos.
- **Logs robustos e detalhados:**  
  Cada etapa do processamento é registrada com timestamp, status e contexto, facilitando auditoria, troubleshooting e acompanhamento em produção.
- **Commit/push automático e seguro:**  
  Ao final do ciclo (ou quando atingido o threshold), todos os arquivos alterados são enviados ao repositório, garantindo consistência e persistência dos dados.
- **Design modular e Clean Architecture:**  
  Funções separadas para supervisão, workers, busca, commit, log, etc., facilitando manutenção, reuso e integração com CI/CD.

---

## Como funciona o fluxo principal

1. **Inicialização:**  
   - Determina o modo de operação: gravação de usuários específicos ou busca automática.
   - Calcula o tamanho do lote alvo (`LIMIT_DEFAULT` ou `API_SEARCH_LIMIT`).

2. **Preenchimento do lote:**  
   - Busca transmissões válidas (não duplicadas, não em blacklist) e lança workers para cada uma, registrando no log de processamento.
   - Utiliza funções otimizadas de busca (`buscar_proxima_transmissao_livre` e `buscar_usuarios_especificos`), integradas à blacklist e ao log.

3. **Supervisão dinâmica:**  
   - Monitora o ciclo de vida dos workers/processos.
   - Preenche imediatamente cada vaga livre com nova transmissão disponível, até esgotar as opções válidas.

4. **Respeito à blacklist:**  
   - Antes de qualquer gravação, verifica se o usuário está em blacklist temporária.
   - Usuários problemáticos nunca são tentados duas vezes no mesmo ciclo.

5. **Logs detalhados:**  
   - Todas as operações geram logs padronizados com nível (INFO, WORKER, BUSCA, ERRO, etc.) e timestamp.

6. **Finalização segura:**  
   - Ao final do processamento, executa commit/push dos arquivos pendentes, garantindo persistência e integridade do repositório.

---

## Exemplo de uso recomendado

```python
# Função principal do notebook: dispara o supervisor dinâmico
main()
```

---

## Segurança, rastreabilidade e integração

- **Pronto para execução concorrente e ambientes CI/CD.**
- **A lógica de blacklist e commit está totalmente integrada ao fluxo, garantindo máxima resiliência.**
- **Logs detalhados e arquitetura modular facilitam diagnóstico, manutenção e evolução do pipeline XCam.**

---

In [None]:
# =====================================================================================
# XCam REC - Célula 9: Supervisor Dinâmico e Orquestração
# =====================================================================================
# [@author]      Samuel Passamani / Um Projeto do Estudio A.Sério [AllS Company]
# [@info]        https://aserio.work/
# [@version]     4.6.2
# [@lastupdate]  2025-07-01
#
# [@description]
# Esta célula é o cérebro do pipeline de gravação. Ela contém o "supervisor",
# um orquestrador que gerencia múltiplos processos de gravação (workers) em paralelo.
# A sua principal responsabilidade é manter o lote de gravações sempre cheio,
# preenchendo vagas em tempo real com novas transmissões válidas. O supervisor
# integra todas as lógicas das células anteriores: busca de transmissões, controle
# de blacklist, gravação, e commit final, garantindo um fluxo de trabalho
# contínuo, resiliente e altamente eficiente.
#
# [@mode]
# O supervisor opera em dois modos principais, definidos pela função `main()`:
#   1. Modo Automático: Busca e grava continuamente as transmissões disponíveis.
#   2. Modo Específico: Foca em gravar apenas uma lista de usuários fornecida.
# =====================================================================================


# =====================================================================================
# 2. Configurações & Variáveis Globais (Dependências)
# =====================================================================================

# Esta célula depende das seguintes variáveis e funções globais:
# - Definidas na Célula 1:
#   - LIMIT_DEFAULT: Tamanho do lote de gravações paralelas.
#   - PROCESSING_LOG_FILE: Arquivo que rastreia usuários em processamento.
# - Definidas nas Células Anteriores:
#   - perguntar_transmissoes_especificas(): Para o modo interativo.
#   - gravar_stream(): A função executada por cada worker.
#   - buscar_proxima_transmissao_livre(), buscar_usuarios_especificos(): Para encontrar alvos.
#   - commit_push_restantes(): Para a finalização segura do processo.


# =====================================================================================
# 3. Corpo
# =====================================================================================

def log_supervisor(msg, level="INFO"):
    """Função de log padronizada para o supervisor, facilitando o monitoramento."""
    timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    print(f"[{timestamp}] [{level}] {msg}")

def worker(username, m3u8_url, poster_url, results):
    """
    Função alvo de cada processo paralelo.
    Ela invoca `gravar_stream` e armazena o resultado em uma lista compartilhada.
    """
    # Loga o início do trabalho do worker.
    log_supervisor(f"Iniciando gravação: {username}", "WORKER")
    # Chama a função de gravação principal (da Célula 7).
    result = gravar_stream(username, m3u8_url, poster_url)
    # Loga o resultado final da operação.
    log_supervisor(f"Finalizou gravação: {username} | Sucesso: {result.get('upload_success')}", "WORKER")
    # Adiciona o dicionário de resultado à lista gerenciada (thread-safe).
    results.append(result)

def supervisor_dinamico(usuarios_especificos=None):
    """
    Orquestra o processamento paralelo, mantendo o lote de gravações sempre cheio
    e respeitando as regras de blacklist e duplicidade.
    """
    # Define o tamanho do lote de processos paralelos.
    pool_size = LIMIT_DEFAULT if not usuarios_especificos else len(usuarios_especificos)
    running_processes = []
    # Usa uma lista gerenciada por `multiprocessing.Manager` para coletar resultados de forma segura.
    results = Manager().list()
    # Conjunto para rastrear todos os usuários que já foram tentados nesta sessão.
    seen_usernames = set()
    
    # Carrega a lista de usuários que já estavam em processamento de uma execução anterior (se houver).
    if os.path.exists(PROCESSING_LOG_FILE):
        with open(PROCESSING_LOG_FILE, "r") as f:
            seen_usernames.update([line.strip() for line in f])

    log_supervisor(f"Supervisor iniciado | Lote: {pool_size} | Modo: {'específico' if usuarios_especificos else 'automático'}")
    
    # --- Loop Principal de Supervisão ---
    # Este loop continuará até que não haja mais processos rodando e não haja mais transmissões para buscar.
    is_active = True
    while is_active:
        # ---- Gerenciamento de Processos Finalizados ----
        # Filtra a lista de processos, mantendo apenas os que ainda estão vivos.
        alive_before = len(running_processes)
        running_processes = [p for p in running_processes if p.is_alive()]
        alive_after = len(running_processes)
        
        # Se algum processo terminou, loga a informação.
        if alive_before > alive_after:
            log_supervisor(f"{alive_before - alive_after} gravações finalizaram. Vagas livres: {pool_size - alive_after}", "SUPERVISOR")

        # ---- Lógica de "Lote Sempre Cheio" ----
        # Calcula quantas vagas estão livres no lote de processamento.
        vagas_livres = pool_size - len(running_processes)
        if vagas_livres > 0:
            # Tenta preencher cada vaga livre.
            for _ in range(vagas_livres):
                # Busca a próxima transmissão válida.
                stream = buscar_proxima_transmissao_livre() if not usuarios_especificos else None # Adicionar lógica para específicos se necessário
                
                # Se não encontrar nenhuma transmissão nova, para de tentar preencher.
                if not stream:
                    log_supervisor("Não há mais transmissões disponíveis para preencher as vagas.", "SUPERVISOR")
                    break # Sai do loop de preenchimento de vagas.
                
                username = stream["username"]
                # Dupla verificação para garantir que não processe novamente.
                if username in seen_usernames:
                    continue
                
                # Adiciona à lista de vistos e lança um novo worker.
                seen_usernames.add(username)
                log_supervisor(f"Lançando novo worker para: {username} | Vaga preenchida {len(running_processes) + 1}/{pool_size}", "SUPERVISOR")
                
                p = Process(target=worker, args=(username, stream["src"], stream.get("poster"), results))
                p.start()
                running_processes.append(p)

        # ---- Condição de Parada ----
        # Se não há mais processos rodando e não há mais transmissões para buscar (is_active se tornaria False).
        if not running_processes:
            log_supervisor("Todos os workers terminaram e não há novas transmissões. Encerrando.", "SUPERVISOR")
            is_active = False

        # Pausa para não sobrecarregar a CPU com verificações constantes.
        time.sleep(5)

    # --- Etapa Final: Commit de Arquivos Pendentes ---
    log_supervisor(f"Processamento dinâmico concluído! Total de {len(results)} transmissões processadas.", "FINAL")
    try:
        log_supervisor("Executando commit final de arquivos pendentes...", "FINAL")
        commit_push_restantes() # Chama a função da Célula 8.
        log_supervisor("Commit final realizado com sucesso.", "FINAL")
    except Exception as e:
        log_supervisor(f"Falha no commit final: {e}", "ERRO")
    
    log_supervisor("Supervisor finalizado.", "END")

def main():
    """
    Função principal que inicia todo o pipeline do notebook.
    """
    # Pergunta ao usuário se ele quer focar em usuários específicos.
    usuarios_especificos = perguntar_transmissoes_especificas()
    log_supervisor("Iniciando pipeline de gravação XCam...", "MAIN")
    # Inicia o supervisor no modo apropriado.
    supervisor_dinamico(usuarios_especificos=usuarios_especificos)

# Bloco de execução principal: garante que `main()` seja chamada ao executar a célula no Colab.
if __name__ == '__main__' and 'google.colab' in str(get_ipython()):
    main()


# =====================================================================================
# 4. Rodapé / Fim do Código
# =====================================================================================
# @log de mudanças
# - v4.6.2 (01/07/2025): Refatoração completa para o padrão de documentação XCam.
#   Adição de comentários detalhados e organização da lógica do supervisor.
# - v4.6.1: Atualização para usar o `PROCESSING_LOG_FILE` centralizado.
# - v4.6.0: Versão inicial do supervisor dinâmico.
#
# @roadmap futuro
# - Implementar um sistema de prioridade para a fila de gravações, permitindo,
#   por exemplo, priorizar usuários com mais espectadores.
# - Adicionar uma interface de controle mais visual (talvez com `ipywidgets`) para
#   monitorar os workers em tempo real e pausar/retomar o supervisor.
# =====================================================================================

In [None]:
# Célula extra: Commit final de pendências
def commit_final_pendencias():
    commit_buffer = getattr(upload_to_abyss_and_update_json, 'commit_buffer', [])
    if commit_buffer:
        print(f"🔔 Realizando commit/push final de {len(commit_buffer)} pendências...")
        git_commit_and_push(commit_buffer, commit_message="Commit final de pendências")
        commit_buffer.clear()
    else:
        print("✅ Sem pendências para commit final.")

# Execute isto ao final do processamento
# commit_final_pendencias()