<a href="https://colab.research.google.com/github/SamuelPassamani/XCam/blob/main/xcam-colab/XCam_REC_V4.3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Célula 1: Configurações Auxiliares, Parâmetros Globais e Log Centralizado

**Objetivo:**  
Esta célula inicializa e centraliza todas as variáveis globais, parâmetros essenciais e agora também fornece um utilitário robusto para o log único do notebook XCam.  
Permite ajuste rápido e seguro do comportamento do notebook, incluindo limites de processamento, controle de gravação, commit automático e mecanismos de resiliência contra transmissões problemáticas.

## Principais pontos e melhorias implementadas

- **Centralização dos parâmetros globais:**  
  Todos os valores críticos (limites, thresholds, caminhos) são definidos e propagados como globais pelo notebook.
- **Log único modular e estruturado (`xcam_master.log`):**  
  Todas as operações relevantes (busca, gravação, blacklist, commit, erros, etc.) agora são registradas em um único arquivo JSON Lines.  
  Cada entrada inclui sessão, evento, id, username, id_username, timestamps, status e detalhes.
- **Funções utilitárias para o log:**  
  Adição, busca, remoção e atualização de eventos são facilitadas por funções modulares (CRUD), promovendo robustez, rastreabilidade e fácil manutenção.
- **Blacklist, falhas e processamento padronizados por `id`:**  
  Toda lógica de controle é feita via identificador único (`id`) e referência `{id}:{username}` (`id_username`), garantindo unicidade e eliminando inconsistências.
- **Uso consistente do campo `sessao`:**  
  Todos os registros são organizados por sessões lógicas, facilitando filtros, relatórios e auditoria.
- **Função interativa para seleção de transmissões específicas:**  
  Permite ao usuário informar nomes de usuários para filtrar transmissões antes do processamento.
- **Comentários detalhados:**  
  Cada etapa do código está documentada para orientar ajustes, manutenção e integração por toda a equipe.

---

## Parâmetros globais controlados nesta célula

- **`LIMIT_DEFAULT`**: Quantidade máxima de transmissões processadas em paralelo/lote.
- **`PAGE_DEFAULT`**: Página inicial para busca na API.
- **`RECORD_SECONDS`**: Tempo máximo de gravação de cada vídeo (em segundos).
- **`RECORD_SECONDS_MIN`**: Tempo mínimo exigido para considerar o vídeo válido (em segundos).
- **`API_SEARCH_LIMIT`**: Limite de transmissões retornadas ao buscar usuários específicos.
- **`COMMIT_PUSH_THRESHOLD`**: Quantidade de transmissões processadas até realizar commit/push automático (0 = commit imediato a cada gravação).
- **`LOG_PATH`**: Caminho do arquivo único de log (JSONL).
- **`BLACKLIST_TIMEOUT`**: Tempo de expiração da blacklist (em segundos).
- **`BLACKLIST_MAX_FAILURES`**: Quantidade de falhas consecutivas antes de banir temporariamente o usuário.

---

## Estrutura do log único (`xcam_master.log`)

Cada entrada segue o modelo:
```json
{
  "timestamp": "2025-06-06T06:15:00Z",
  "sessao": "busca|gravação|blacklist|processing|failure|success|commit|erro|...",
  "evento": "...",
  "id": "...",           // identificador único (primário)
  "username": "...",     // nome do usuário para exibição
  "id_username": "...",  // referência padrão "{id}:{username}" para consultas e auditoria
  "status": "...",       // ok|erro|blacklisted|expirado|...
  "detalhes": "...",     // informações adicionais (motivo, paths, etc)
}
```

---

## Funções utilitárias para o log

- **`append_log(entry, log_path=LOG_PATH)`**: Adiciona uma nova entrada ao log central (gera campo `id_username` automaticamente).
- **`read_logs(log_path=LOG_PATH)`**: Lê todas as entradas do log.
- **`query_logs(...)`**: Consulta entradas do log por filtros opcionais (sessão, id, id_username, status, etc).
- **`remove_logs(condition_fn, log_path=LOG_PATH)`**: Remove todas as entradas que satisfaçam a condição.
- **`update_log_entry(match_fn, update_fn, log_path=LOG_PATH)`**: Atualiza entradas do log conforme regra.

---

## Exemplo de uso das funções (a serem aplicadas nas próximas células)

```python
append_log({
    "sessao": "processing",
    "evento": "iniciado",
    "id": "abc123",
    "username": "Manugic_",
    "status": "ok",
    "detalhes": "URL válida"
})

# Consultar blacklist:
logs_blacklist = query_logs(sessao="blacklist", status="blacklisted")

# Remover registros expirados:
remove_logs(lambda entry: entry["sessao"] == "processing" and expirou(entry), log_path=LOG_PATH)

# Atualizar status:
update_log_entry(lambda e: e["id"]=="abc123" and e["sessao"]=="processing", lambda e: e.update({"status":"ok"}))
```

---

## Função interativa

Permite ao usuário informar transmissões específicas a serem gravadas antes de iniciar o processamento.

---

## Segurança, rastreabilidade e manutenção

- Todos os parâmetros globais são definidos no início e propagados para todo o notebook, garantindo consistência.
- O log único fornece rastreabilidade detalhada e elimina arquivos dispersos (blacklist, falha, etc).
- Uso do padrão `{id}:{username}` para referência e auditoria.
- Ajuste qualquer valor diretamente nesta célula para alterar o comportamento global do notebook de forma segura.
- Comentários detalhados auxiliam a compreensão, integração e manutenção por toda a equipe.

---

In [None]:
# ================================================================
# Célula 1: Configuração Global, Parâmetros e Log Único Estruturado
# ================================================================
# Objetivo:
# - Centralizar configurações globais e thresholds
# - Definir e montar caminhos do notebook
# - Fornecer utilitário robusto para LOG ÚNICO MODULAR (JSONL)
#   => Todas as células e funções usarão este log para registrar, consultar e manipular eventos
# - Garantir padronização, rastreabilidade, unicidade e fácil manutenção futura
#
# Estratégia:
# - Log único estruturado (JSONL): sessão, evento, id, username, id_username, timestamps, status, detalhes
# - Funções CRUD para log: adicionar, buscar, atualizar, remover (para blacklist, processing, falhas, auditoria)
# - Blacklist e controles baseados em id (com username apenas para exibição)
# - Parâmetros globais facilmente editáveis e propagados via globals()
# - Uso consistente de "sessao" para diferenciar tipos de registros
# ================================================================

from google.colab import drive
drive.mount('/content/drive')

import os
import json

# ============================
# PARÂMETROS GLOBAIS EDITÁVEIS
# ============================
# Modifique abaixo conforme necessidade do ambiente ou processamento

# Limites e thresholds principais de processamento
LIMIT_DEFAULT = 100             # Máximo de transmissões processadas por rodada
PAGE_DEFAULT = 1               # Página padrão para busca na API
RECORD_SECONDS = 12780         # Duração máxima da gravação (em segundos)
RECORD_SECONDS_MIN = 420       # Duração mínima válida (em segundos)
API_SEARCH_LIMIT = 3333        # Limite ao buscar usuários específicos
# COMMIT_PUSH_THRESHOLD removido pois o commit/push é gerenciado externamente

# Caminhos de arquivos principais
BASE_PATH = '/content' # Mantido para referência, mas LOG_PATH vai para o Drive
DRIVE_BASE_LOG_PATH = '/content/drive/MyDrive/XCam.Drive/logs' # Novo caminho base para logs no Drive
LOG_PATH = f"{DRIVE_BASE_LOG_PATH}/xcam_master.log"          # Arquivo único de log central MOVIDO PARA O DRIVE
BLACKLIST_TIMEOUT = 15 * 60                        # Blacklist: tempo de expiração (segundos)
BLACKLIST_MAX_FAILURES = 3                         # Blacklist: falhas para banimento temporário

# Garante que o diretório de logs no Drive exista
os.makedirs(DRIVE_BASE_LOG_PATH, exist_ok=True)
print(f"Diretório de logs no Drive garantido: {DRIVE_BASE_LOG_PATH}")


# ============================
# ATUALIZAÇÃO GLOBAL DOS PARÂMETROS
# ============================
# Propaga parâmetros como globais do notebook
globals().update({
    'LIMIT_DEFAULT': LIMIT_DEFAULT,
    'PAGE_DEFAULT': PAGE_DEFAULT,
    'RECORD_SECONDS': RECORD_SECONDS,
    'RECORD_SECONDS_MIN': RECORD_SECONDS_MIN,
    'API_SEARCH_LIMIT': API_SEARCH_LIMIT,
    'LOG_PATH': LOG_PATH, # Atualizado para o caminho do Drive
    'BLACKLIST_TIMEOUT': BLACKLIST_TIMEOUT,
    'BLACKLIST_MAX_FAILURES': BLACKLIST_MAX_FAILURES
})

# =============================================================================
# UTILITÁRIO DE LOG ÚNICO MODULAR (JSONL) — Clean Architecture
# -----------------------------------------------------------------------------
# Cada entrada: {
#   "timestamp": "2025-06-06T06:15:00Z",
#   "sessao": "busca|gravação|blacklist|processing|failure|commit|erro|...",
#   "evento": "...",
#   "id": "...",               # identificador primário (ex: id da transmissão)
#   "username": "...",         # apenas referência humana
#   "id_username": "...",      # padrão "{id}:{username}" para fácil leitura/humano
#   "status": "...",           # ok|erro|blacklisted|expirado|...
#   "detalhes": "...",         # informações adicionais/motivo/paths
# }
# =============================================================================

from datetime import datetime

def now_iso():
    """Retorna timestamp UTC em formato ISO."""
    return datetime.utcnow().isoformat() + "Z"

def make_id_username(id, username):
    """Gera o identificador de referência padrão para logs: '{id}:{username}'."""
    return f"{id}:{username}"

def append_log(entry, log_path=LOG_PATH):
    """
    Adiciona uma nova entrada ao log central (JSONL).
    Campos obrigatórios: sessao, evento, id, username, status.
    - 'id' DEVE ser chave primária (único por transmissão/processo).
    - 'username' é apenas referência humana.
    - 'id_username' sempre gerado para facilitar auditoria/consulta.
    - 'sessao' obrigatório e padronizado para facilitar filtros e consultas.
    """
    entry.setdefault("timestamp", now_iso())
    for field in ["sessao", "evento", "id", "username", "status"]:
        entry.setdefault(field, "")
    # Padrão de referência único e fácil busca
    entry["id_username"] = make_id_username(entry["id"], entry["username"])
    # Evitar duplicidade de id+sessao+evento (unicidade lógica)
    logs = []
    # Verifica se o arquivo existe ANTES de tentar ler
    if os.path.exists(log_path):
        try:
            with open(log_path, "r", encoding="utf-8") as f:
                # Lê linha por linha e tenta parsear JSON. Ignora linhas inválidas com aviso.
                for line in f:
                    line = line.strip()
                    if line:
                        try:
                            logs.append(json.loads(line))
                        except json.JSONDecodeError as e:
                            print(f"⚠️ Aviso: Linha inválida no log '{log_path}', ignorada: {line} - Erro: {e}")
        except Exception as e:
             print(f"❌ Erro inesperado ao ler log '{log_path}', inicializando lista vazia: {e}")
             logs = []


    # Checa unicidade apenas para eventos que não podem ser duplicados (ex: processing, blacklist, etc)
    if entry["sessao"] in {"processing", "blacklist", "failure", "success"}:
        key = (entry["id"], entry["sessao"], entry["evento"])
        # Encontra o índice da entrada existente, se houver
        existing_index = next((i for i, e in enumerate(logs) if (e.get("id"), e.get("sessao"), e.get("evento")) == key), -1)

        if existing_index != -1:
            # Atualiza o registro existente ao invés de duplicar
            logs[existing_index].update(entry)
            # Escreve o arquivo completo de volta (substitui)
            try:
                with open(log_path, "w", encoding="utf-8") as f:
                    for l in logs:
                        f.write(json.dumps(l, ensure_ascii=False) + "\n")
                return # Retorna após atualizar
            except Exception as e:
                print(f"❌ Erro ao reescrever log '{log_path}' após atualização: {e}")
                # Em caso de erro ao reescrever, tenta apenas append abaixo como fallback?
                # Ou seria melhor parar? Por segurança, vamos tentar append (pode gerar duplicidade temporária)
                pass # Continua para o append abaixo em caso de erro ao reescrever

    # Se não existe ou se houve erro ao reescrever, apenas append a nova entrada
    try:
        with open(log_path, "a", encoding="utf-8") as f:
            f.write(json.dumps(entry, ensure_ascii=False) + "\n")
    except Exception as e:
        print(f"❌ Erro ao adicionar entrada ao log '{log_path}': {e}")


def read_logs(log_path=LOG_PATH):
    """Lê todas as entradas do log central."""
    if not os.path.exists(log_path):
        return []
    logs = []
    try:
        with open(log_path, "r", encoding="utf-8") as f:
            for line in f:
                line = line.strip()
                if line:
                    try:
                        logs.append(json.loads(line))
                    except json.JSONDecodeError as e:
                         print(f"⚠️ Aviso: Linha inválida no log '{log_path}', ignorada: {line} - Erro: {e}")
    except Exception as e:
         print(f"❌ Erro inesperado ao ler log '{log_path}': {e}")
         return []
    return logs


def query_logs(sessao=None, id=None, username=None, id_username=None, evento=None, status=None, after=None, before=None, log_path=LOG_PATH):
    """
    Consulta entradas do log por filtros opcionais.
    Filtros disponíveis: sessao, id, username, id_username, evento, status, after, before.
    - after/before: string ISO ou datetime
    """
    logs = read_logs(log_path)
    result = []
    for entry in logs:
        if sessao and entry.get("sessao") != sessao:
            continue
        if id and entry.get("id") != id:
            continue
        if username and entry.get("username") != username:
            continue
        if id_username and entry.get("id_username") != id_username:
            continue
        if evento and entry.get("evento") != evento:
            continue
        if status and entry.get("status") != status:
            continue
        ts = entry.get("timestamp")
        if after:
            after_val = after if isinstance(after, str) else after.isoformat()
            if ts < after_val:
                continue
        if before:
            before_val = before if isinstance(before, str) else before.isoformat()
            if ts > before_val:
                continue
        result.append(entry)
    return result

def remove_logs(condition_fn, log_path=LOG_PATH):
    """
    Remove do log central todas as entradas que satisfaçam condition_fn(entry).
    Útil para expurgar logs expirados, blacklists vencidas, eventos processados, etc.
    """
    logs = read_logs(log_path)
    kept = [entry for entry in logs if not condition_fn(entry)]
    # Só reescreve se houve remoção ou se o arquivo existia e agora está vazio
    if len(kept) < len(logs) or (len(logs) > 0 and len(kept) == 0):
        try:
            with open(log_path, "w", encoding="utf-8") as f:
                for entry in kept:
                    f.write(json.dumps(entry, ensure_ascii=False) + "\n")
            print(f"✅ {len(logs) - len(kept)} entradas removidas do log '{log_path}'.")
            return len(logs) - len(kept)
        except Exception as e:
            print(f"❌ Erro ao reescrever log '{log_path}' após remoção: {e}")
            return 0 # Não podemos confirmar quantas foram removidas no arquivo
    else:
         print(f"ℹ️ Nenhuma entrada satisfez a condição de remoção no log '{log_path}'.")
         return 0


def update_log_entry(match_fn, update_fn, log_path=LOG_PATH):
    """
    Atualiza entradas do log central: se match_fn(entry)==True, aplica update_fn(entry).
    Exemplo: promover status de "pending" para "ok".
    """
    logs = read_logs(log_path)
    updated = 0
    # Cria uma cópia para iterar enquanto modifica a original (ou uma nova lista)
    new_logs = []
    made_changes = False
    for entry in logs:
        # Cria uma cópia da entrada para modificar, se necessário
        entry_copy = entry.copy()
        if match_fn(entry_copy):
            update_fn(entry_copy)
            updated += 1
            made_changes = True
        new_logs.append(entry_copy)

    if made_changes:
        try:
            with open(log_path, "w", encoding="utf-8") as f:
                for entry in new_logs:
                    f.write(json.dumps(entry, ensure_ascii=False) + "\n")
            print(f"✅ {updated} entradas atualizadas no log '{log_path}'.")
        except Exception as e:
             print(f"❌ Erro ao reescrever log '{log_path}' após atualização: {e}")

    return updated

# Exemplos de uso (para as próximas células):
# append_log({"sessao":"processing", "evento":"iniciado", "id":"123456", "username":"Manugic_", "status":"ok", "detalhes":"URL válida"})
# logs_blacklist = query_logs(sessao="blacklist", status="blacklisted")
# remove_logs(lambda entry: entry["sessao"]=="processing" and expirou(entry), log_path=LOG_PATH)
# update_log_entry(lambda e: e["id"]=="123456" and e["sessao"]=="processing", lambda e: e.update({"status":"ok"}))

# =============================================================================
# FUNÇÃO INTERATIVA (opcional) PARA ESCOLHA DE TRANSMISSÕES ESPECÍFICAS
# =============================================================================
def perguntar_transmissoes_especificas():
    """
    Pergunta ao usuário se deseja informar transmissões específicas para gravar,
    recebendo nomes de usuário separados por vírgula e retornando lista limpa.
    Retorna lista vazia caso não deseje selecionar usuários.
    """
    resp = input('Deseja gravar alguma transmissão específica? (sim/não): ').strip().lower()
    if resp.startswith('s'):
        usuarios = input('Informe o(s) nome(s) de usuário, separados por vírgula (ex: userNovo234, jovemPT): ')
        usuarios_lista = [u.strip() for u in usuarios.split(',') if u.strip()]
        return usuarios_lista
    return []

# =============================================================================
# DICAS DE USO EM OUTRAS CÉLULAS:
# - Para registrar evento: append_log({...})
# - Para consultar blacklist: query_logs(sessao="blacklist", status="blacklisted")
# - Para remover registros expirados: remove_logs(lambda e: ...)
# - Para atualizar status: update_log_entry(lambda e: ..., lambda e: ...)
# - Sempre use o id como chave primária e id_username para referência em relatórios/auditoria
# =============================================================================

# ============================
# FIM DA CÉLULA 1
# ============================

# Célula 2: Instalação e Validação do ffmpeg

**Objetivo:**  
Esta célula garante que o utilitário `ffmpeg` esteja instalado e disponível no ambiente Google Colab. O ffmpeg é indispensável para a gravação dos vídeos das transmissões e para o processamento de mídia ao longo do pipeline do notebook XCam.

## Pontos principais e melhorias implementadas

- **Verificação pré-instalação:**  
  Antes de instalar, verifica se o ffmpeg já está disponível no ambiente, tornando o processo idempotente e eficiente.
- **Instalação automatizada:**  
  Efetua a instalação via `apt-get` apenas se necessário, reduzindo o tempo de setup em execuções futuras.
- **Validação pós-instalação:**  
  Exibe a versão instalada do ffmpeg, garantindo transparência e rastreabilidade.
- **Mensagens detalhadas:**  
  O usuário recebe logs informativos sobre cada etapa, facilitando o diagnóstico em caso de erros.
- **Design modular:**  
  Estrutura pronta para ser utilizada em outros ambientes (Colab, local, server) com pequenas adaptações.

---

## Como funciona a célula

- **Verifica se o ffmpeg está instalado (no PATH do sistema).**
- **Se não estiver, instala automaticamente via apt-get.**
- **Valida e exibe a versão instalada após o processo.**
- **Em caso de falha, exibe erro detalhado e interrompe o fluxo para evitar inconsistências futuras.**

---

## Exemplo de uso das funções nesta célula

```python
if not is_ffmpeg_installed():
    install_ffmpeg()
show_ffmpeg_version()
```

---

## Segurança, rastreabilidade e manutenção

- A célula torna o setup do ambiente mais robusto, impedindo falhas silenciosas relacionadas à ausência de ffmpeg.
- Mensagens e validações ajudam a equipe a identificar rapidamente problemas de ambiente ou permissões.
- O padrão modular facilita a reutilização do código em diferentes notebooks ou pipelines do projeto XCam.

---

In [None]:
# ================================================================
# Célula 2: Instalação e Validação do FFMPEG no Colab e Linux
# ================================================================
# Objetivo:
# - Garantir que o utilitário ffmpeg está instalado e disponível no ambiente (Colab ou Linux)
# - Validar a instalação e exibir a versão instalada para rastreabilidade
# - Tornar a etapa idempotente, evitando instalações desnecessárias (safe to rerun)
# - Fornecer feedback detalhado e logs a cada etapa para diagnóstico rápido
#
# Estratégia aplicada:
# - Checa se ffmpeg está disponível no PATH do sistema
# - Caso não esteja, instala automaticamente via apt-get (compatível Colab/Linux)
# - Valida a instalação e exibe a versão instalada
# - Modularidade e robustez para uso em pipelines, CI/CD e ambientes colaborativos
# ================================================================

import subprocess   # Importação obrigatória para checagem e instalação do ffmpeg
import sys

def is_ffmpeg_installed():
    """
    Verifica se o ffmpeg está instalado e disponível no PATH do sistema.
    Retorna True se estiver, False caso contrário.
    """
    try:
        result = subprocess.run(["ffmpeg", "-version"], capture_output=True, text=True)
        return result.returncode == 0
    except Exception:
        return False

def install_ffmpeg():
    """
    Instala o ffmpeg via apt-get caso não esteja presente.
    Somente para sistemas baseados em Debian/Ubuntu (inclui Google Colab).
    """
    print("[INFO] Iniciando instalação do ffmpeg via apt-get...")
    try:
        # Atualiza pacotes e instala ffmpeg de forma silenciosa para logs limpos
        subprocess.run("apt-get update -y", shell=True, check=True, stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
        subprocess.run("apt-get install -y ffmpeg", shell=True, check=True, stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
        print("[INFO] ffmpeg instalado com sucesso.")
    except subprocess.CalledProcessError as e:
        print(f"[ERRO] Falha ao instalar ffmpeg via apt-get: {e}")
        print("🔴 Tente rodar manualmente ou verifique permissões/root.")
        raise

def show_ffmpeg_version():
    """
    Exibe a versão instalada do ffmpeg, se disponível.
    Mostra as duas primeiras linhas para rastreabilidade.
    """
    print("[INFO] Versão do ffmpeg instalada:")
    try:
        result = subprocess.run(["ffmpeg", "-version"], capture_output=True, text=True)
        if result.returncode == 0:
            linhas = result.stdout.strip().split('\n')
            for l in linhas[:2]:
                print(l)
        else:
            print("[ERRO] ffmpeg instalado, mas não foi possível obter a versão.")
    except Exception as e:
        print(f"[ERRO] Não foi possível exibir a versão do ffmpeg: {e}")

# ================================================================
# EXECUÇÃO DA ETAPA DE SETUP — Sempre idempotente e segura
# ================================================================

if not is_ffmpeg_installed():
    print("[WARN] ffmpeg não encontrado no ambiente.")
    try:
        install_ffmpeg()
    except Exception:
        raise RuntimeError("[ERRO] Falha ao instalar o ffmpeg. Verifique permissões ou tente novamente.")
    if not is_ffmpeg_installed():
        # Última checagem após instalação
        raise RuntimeError("[ERRO] Falha ao instalar o ffmpeg. Verifique permissões, root ou tente novamente.")
    else:
        print("[OK] ffmpeg instalado e pronto para uso.")
else:
    print("[OK] ffmpeg já está instalado no ambiente.")

show_ffmpeg_version()

# ================================================================
# FIM DA CÉLULA 2 — Instalação e Validação do ffmpeg
# ================================================================
#
# Observações técnicas:
# - ffmpeg deve estar disponível para todas as etapas do pipeline XCam.
# - Para obter o caminho absoluto: subprocess.run(['which', 'ffmpeg'], capture_output=True, text=True).stdout.strip()
# - Célula idempotente: pode ser executada múltiplas vezes sem efeitos colaterais.
# - Pronta para uso em pipelines, scripts automatizados e ambientes colaborativos.

# Célula 3: Imports Essenciais, Utilitários e Preparação do Ambiente

**Objetivo:**  
Importa todas as bibliotecas essenciais do Python necessárias para o funcionamento do notebook, incluindo módulos para requisições HTTP, processamento paralelo, manipulação de datas, controle de subprocessos e exibição interativa.  
Centraliza funções utilitárias robustas e padronizadas para processamento, download de poster, geração automática de poster com ffmpeg e exibição de progresso, totalmente integradas ao log único centralizado definido na Célula 1.

## Principais pontos e melhorias implementadas

- **Centralização de imports essenciais:**  
  Todos os módulos fundamentais (os, requests, multiprocessing, datetime, json, time, subprocess, math, re, IPython) estão disponíveis e prontos para uso global.
- **Funções utilitárias padronizadas:**  
  Funções para formatação de segundos, exibição de progresso, download e validação de poster, geração de poster via ffmpeg (com fallback e múltiplas tentativas) e integração direta ao log centralizado, seguindo Clean Architecture.
- **Remoção de logs temporários dispersos:**  
  Toda rastreabilidade de eventos (incluindo processamento, blacklist, falhas e auditoria) agora é feita apenas pelo log único centralizado (LOG_PATH), eliminando arquivos dispersos como LOG_PROCESSAMENTO_PATH, BLACKLIST_PATH ou FAILURE_LOG_PATH.
- **Robustez, clareza e modularidade:**  
  As funções possuem tratamento de erros, são preparadas para uso concorrente, possuem fallback inteligente (poster placeholder) e integração automática com o pipeline e o log centralizado.
- **Pronto para uso em todo o notebook:**  
  Todas as funções aqui definidas são utilizadas em toda a automação, promovendo reuso, legibilidade e manutenção facilitada em pipelines concorrentes ou distribuídos.

---

## Funções utilitárias disponíveis nesta célula

- **`format_seconds(seconds)`**: Formata um valor em segundos para string legível (ex: "1h23m45s").
- **`log_progress(username, elapsed_seconds, total_seconds)`**: Exibe o progresso da gravação de cada transmissão.
- **`download_and_save_poster(poster_url, username, temp_folder)`**: Baixa e salva o poster da transmissão a partir de uma URL remota ou retorna se for um caminho local.
- **`generate_poster_with_ffmpeg(m3u8_url, username, temp_folder, tries=(7,1,15,30), timeout=30)`**: Gera automaticamente um poster usando ffmpeg, tentando múltiplos pontos e, em caso de falha, gera um placeholder e registra o erro no log centralizado.
- **`is_poster_valid(poster_path)`**: Verifica se o arquivo de poster é válido (existe e não está vazio).

---

## Exemplo de uso das funções

```python
# Formatar segundos em string legível
tempo = format_seconds(385)

# Exibir progresso
log_progress("userNovo234", 385, 12780)

# Download do poster
poster_path = download_and_save_poster(url_poster, "userNovo234", "/content/temp")

# Geração automática de poster via ffmpeg (com fallback e registro no log)
if not is_poster_valid(poster_path):
    poster_path = generate_poster_with_ffmpeg(m3u8_url, "userNovo234", "/content/temp")
```

---

## Segurança, rastreabilidade e manutenção

- Todas as funções são preparadas para tratamento de erros, integração com processos concorrentes e fallback inteligente.
- O log temporário de processamento foi removido, garantindo que todo o rastreio e auditoria sejam feitos via log único centralizado da Célula 1.
- Funções de geração de poster integram fallback (placeholder) e registro detalhado de falhas no log central.
- Comentários detalhados facilitam manutenção, entendimento e evolução do notebook para toda a equipe.

---

In [None]:
# ================================================================
# Célula 3: Imports Essenciais, Utilitários e Preparação do Ambiente
# ================================================================
# Objetivo:
# - Importar bibliotecas essenciais para todo o notebook
# - Centralizar funções auxiliares de formatação, download e geração de poster
# - Remover dependências de logs temporários dispersos, integrando ao log único do sistema (LOG_PATH)
# - Garantir robustez, clareza e modularidade para as próximas células
#
# Estratégia aplicada:
# - Apenas os imports necessários para o funcionamento do notebook
# - Funções auxiliares adaptadas para Clean Architecture e integração com o log centralizado (Célula 1)
# - Função de geração de poster com ffmpeg robusta, com múltiplas tentativas e fallback
# - Modularidade: funções isoladas, reusáveis, prontas para testes e integração
# ================================================================

import os
import requests
from multiprocessing import Manager, Process
from datetime import datetime
import json
import time
import subprocess
import math
import re
import shutil
import threading

from IPython import get_ipython
from IPython.display import display

# ============================
# UTILITÁRIOS DE FORMATAÇÃO E PROGRESSO
# ============================

def format_seconds(seconds):
    """
    Formata segundos em string legível (e.g., 1h23m45s).
    """
    total_seconds = int(seconds)
    hours = total_seconds // 3600
    minutes = (total_seconds % 3600) // 60
    seconds = total_seconds % 60
    parts = []
    if hours > 0:
        parts.append(f"{hours}h")
    if minutes > 0 or (hours == 0 and seconds > 0):
        parts.append(f"{minutes}m")
    if seconds > 0 or total_seconds == 0:
        parts.append(f"{seconds}s")
    return "".join(parts) if parts else "0s"

def log_progress(username, elapsed_seconds, total_seconds):
    """
    Exibe progresso da gravação de cada transmissão em tempo real.
    """
    percent = min((elapsed_seconds / total_seconds) * 100, 100)
    tempo = format_seconds(elapsed_seconds)
    minutos_gravados = math.floor(elapsed_seconds / 60)
    minutos_restantes = max(0, math.ceil((total_seconds - elapsed_seconds) / 60))
    print(f"⏱️ [{username}] Gravados: {minutos_gravados} min | Restantes: {minutos_restantes} min | Tempo total: {tempo} — 📊 {percent:.1f}% concluído")

# ============================
# UTILITÁRIO PARA DOWNLOAD DE POSTER
# ============================

def download_and_save_poster(poster_url, username, temp_folder):
    """
    Baixa e salva o poster (thumbnail) a partir de uma URL HTTP/HTTPS.
    Se for um caminho local existente, retorna esse caminho.
    Retorna o caminho do arquivo salvo, ou None em caso de erro.
    """
    # Se for um caminho local válido, retorna diretamente
    if os.path.exists(poster_url):
        return poster_url
    # Download de URL HTTP/HTTPS
    if isinstance(poster_url, str) and (poster_url.startswith("http://") or poster_url.startswith("https://")):
        try:
            response = requests.get(poster_url, timeout=15)
            response.raise_for_status()
            ext = os.path.splitext(poster_url)[1].lower()
            if ext not in [".jpg", ".jpeg", ".png"]:
                ext = ".jpg"
            poster_temp_path = os.path.join(temp_folder, f"{username}_poster_temp{ext}")
            with open(poster_temp_path, "wb") as f:
                f.write(response.content)
            print(f"🖼️ Poster baixado em: {poster_temp_path}")
            return poster_temp_path
        except Exception as e:
            print(f"❌ Erro ao baixar poster {poster_url}: {e}")
            return None
    else:
        print(f"❌ poster_url inválido ou não encontrado: {poster_url}")
        return None

# ============================
# UTILITÁRIO PARA GERAR POSTER COM FFMPEG (com fallback e log central)
# ============================

def generate_poster_with_ffmpeg(m3u8_url, username, temp_folder, tries=(3, 1, 7, 15, 30), timeout=30):
    """
    Gera um poster (screenshot) usando ffmpeg a partir da URL .m3u8 da transmissão.
    Tenta múltiplos pontos no vídeo caso haja erro (robustez).
    Integra ao log centralizado via append_log em caso de falha.
    Retorna o caminho do arquivo gerado ou None em caso de erro.
    """
    from IPython.display import clear_output
    import requests # Garantir requests está importado aqui

    # --- Checa se a URL está acessível antes de rodar ffmpeg ---
    try:
        # Usar um timeout curto para a checagem inicial
        head_resp = requests.head(m3u8_url, timeout=5)
        if not head_resp.ok:
            msg = f"Stream offline ou não disponível para {username} (status {head_resp.status_code})"
            print(f"⚠️ {msg}")
            # Registrar falha de conexão no log central
            if "register_failure" in globals():
                 register_failure(username, msg)
            return None # Retorna None imediatamente se a stream não estiver acessível
    except requests.exceptions.RequestException as e:
        msg = f"Erro de conexão ao acessar stream de {username}: {e}"
        print(f"❌ {msg}")
        # Registrar falha de conexão no log central
        if "register_failure" in globals():
             register_failure(username, msg)
        return None # Retorna None imediatamente em caso de erro de conexão
    except Exception as e:
        msg = f"Erro inesperado na checagem de stream para {username}: {e}"
        print(f"❌ {msg}")
        # Registrar falha genérica na checagem
        if "register_failure" in globals():
             register_failure(username, msg)
        return None # Retorna None em caso de qualquer outra exceção na checagem


    # --- Tenta gerar poster com ffmpeg (se a checagem inicial passou) ---
    for frame_time in tries:
        poster_ffmpeg_path = os.path.join(temp_folder, f"{username}_poster_ffmpeg_{frame_time}.jpg")
        command = [
            "ffmpeg",
            "-y",
            "-analyzeduration", "10M",
            "-probesize", "50M",
            "-ss", str(frame_time),
            "-i", m3u8_url,
            "-vframes", "1",
            "-q:v", "2",
            poster_ffmpeg_path
        ]
        try:
            print(f"🎬 Tentando gerar poster para {username} com ffmpeg no segundo {frame_time}...")
            result = subprocess.run(
                command,
                stdout=subprocess.PIPE,
                stderr=subprocess.PIPE,
                timeout=timeout
            )
            if result.returncode == 0 and os.path.exists(poster_ffmpeg_path) and os.path.getsize(poster_ffmpeg_path) > 0:
                print(f"🖼️ Poster gerado via ffmpeg: {poster_ffmpeg_path}")
                # Limpa falhas relacionadas a poster/ffmpeg se a geração for bem-sucedida
                if "clear_failure" in globals():
                    clear_failure(username)
                return poster_ffmpeg_path
            else:
                msg = f"ffmpeg não conseguiu gerar poster para {username} no segundo {frame_time}. Código: {result.returncode}"
                print(f"❌ {msg}\nSTDOUT:\n{result.stdout.decode(errors='ignore')}\nSTDERR:\n{result.stderr.decode(errors='ignore')}")
                # Registrar falha específica de ffmpeg no log central
                if "append_log" in globals():
                    append_log({
                        "sessao": "poster",
                        "evento": "erro_ffmpeg_frame",
                        "id": username,
                        "username": username,
                        "status": "erro",
                        "detalhes": f"{msg} | stdout: {result.stdout.decode(errors='ignore')[:200]} | stderr: {result.stderr.decode(errors='ignore')[:200]}"
                    })

        except subprocess.TimeoutExpired:
            msg = f"Tempo excedido ao tentar gerar poster para {username} via ffmpeg (segundo {frame_time})."
            print(f"⏰ {msg}")
            # Registrar timeout de ffmpeg no log central
            if "append_log" in globals():
                append_log({
                    "sessao": "poster",
                    "evento": "timeout_ffmpeg",
                    "id": username,
                    "username": username,
                    "status": "erro",
                    "detalhes": msg
                })
        except Exception as e:
            msg = f"Erro inesperado ao rodar ffmpeg para poster ({username}, segundo {frame_time}): {e}"
            print(f"❌ {msg}")
            # Registrar exceção de ffmpeg no log central
            if "append_log" in globals():
                append_log({
                    "sessao": "poster",
                    "evento": "excecao_ffmpeg",
                    "id": username,
                    "username": username,
                    "status": "erro",
                    "detalhes": msg
                })


    # --- Fallback: gera um poster placeholder se todas as tentativas falharem ---
    placeholder_path = os.path.join(temp_folder, f"{username}_placeholder.jpg")
    try:
        from PIL import Image, ImageDraw
        img = Image.new('RGB', (640, 360), color=(80, 80, 80))
        d = ImageDraw.Draw(img)
        d.text((10, 150), f"Poster indisponível\n{username}", fill=(255, 255, 255))
        img.save(placeholder_path)
        print(f"⚠️ Poster placeholder gerado para {username}: {placeholder_path}")
        # Registrar geração de placeholder no log central
        if "append_log" in globals():
             append_log({
                 "sessao": "poster",
                 "evento": "placeholder_gerado",
                 "id": username,
                 "username": username,
                 "status": "aviso",
                 "detalhes": f"Poster placeholder gerado após falha no ffmpeg."
             })
        return placeholder_path
    except Exception as e:
        msg = f"Erro ao gerar placeholder para {username}: {e}"
        print(f"❌ {msg}")
        # Registrar falha na geração de placeholder no log central
        if "append_log" in globals():
             append_log({
                 "sessao": "poster",
                 "evento": "erro_placeholder",
                 "id": username,
                 "username": username,
                 "status": "erro",
                 "detalhes": msg
             })
        return None

# ============================
# VALIDAÇÃO DE POSTER
# ============================

def is_poster_valid(poster_path):
    """
    Verifica se o poster existe e não está vazio.
    """
    return poster_path and os.path.exists(poster_path) and os.path.getsize(poster_path) > 0

# ============================
# FIM DA CÉLULA 3
# ============================

# Observações:
# - Todas as funções de logging, blacklist, falha e auditoria devem ser feitas via utilitário de log centralizado (Célula 1).
# - LOG_PROCESSAMENTO_PATH, BLACKLIST_PATH, FAILURE_LOG_PATH e outros logs dispersos não devem mais ser usados.
# - O pipeline está pronto para Clean Architecture, máxima rastreabilidade e integração.
# - Funções aqui são modulares, reusáveis e preparadas para tratamento de exceções e logging detalhado.

# Célula 4: Clonagem do Repositório GitHub no Colab e Google Drive

**Objetivo:**  
Esta célula garante que o repositório do projeto XCam seja sempre clonado de forma limpa e sincronizada no ambiente local do Colab e, se disponível, também no Google Drive para persistência.  
Assegura ambiente pronto, atualizado, seguro para gravações e processamento, e prepara diretórios padronizados para integração com o restante do pipeline.

## Principais pontos e melhorias implementadas

- **Clonagem idempotente e limpa:**  
  Remove repositórios antigos antes de clonar para evitar conflitos, arquivos órfãos ou problemas de sincronização.
- **Clonagem para ambiente temporário e persistente:**  
  O repositório é clonado tanto para `/content` (Colab) quanto para o Drive (`/content/drive/MyDrive/XCam.Drive`) se o Drive estiver montado.
- **Preparação de diretórios de gravação e processamento:**  
  Estrutura de diretórios temporários criada automaticamente, garantindo organização dos dados.
- **Exportação de variáveis globais:**  
  Todos os caminhos, URLs e configurações relevantes são disponibilizados via `globals().update()` para uso em todo o notebook.
- **Mensagens e validações detalhadas:**  
  Feedback informativo sobre o status de cada etapa, facilitando o diagnóstico e a manutenção.
- **Pronto para CI/CD e integrações futuras:**  
  Token e URLs preparados para automações, integrações externas e uploads (Abyss.to, etc).

---

## Parâmetros globais definidos nesta célula

- **`GITHUB_USER`**, **`GITHUB_REPO`**, **`GITHUB_BRANCH`**, **`GITHUB_TOKEN`**: Configurações do repositório e autenticação.
- **`repo_url`**: URL do repositório autenticada para clone/push.
- **`TEMP_OUTPUT_FOLDER`**: Pasta para gravações temporárias.
- **`BASE_REPO_FOLDER`**: Localização do repositório no ambiente Colab.
- **`DRIVE_MOUNT`**, **`DRIVE_REPO_FOLDER`**: Caminhos no Google Drive para persistência (se montado).
- **`ABYSS_UPLOAD_URL`**: URL de upload para integração com sistemas externos.

---

## Como funciona a célula

- **Remove repositórios antigos e diretórios temporários**, evitando resíduos de execuções anteriores.
- **Clona o repositório do GitHub** para `/content` (Colab).
- **Se o Google Drive estiver montado**, faz o mesmo clone no diretório persistente do Drive.
- **Cria diretórios temporários necessários** para gravações e arquivos intermediários.
- **Exporta todas as variáveis configuradas** para uso global no notebook.
- **Exibe mensagens informativas** sobre cada etapa e alerta caso o Drive não esteja disponível.

---

## Exemplo de uso das variáveis globais

```python
print(BASE_REPO_FOLDER)        # Caminho do repositório clonado no Colab
print(DRIVE_REPO_FOLDER)      # Caminho do repositório no Drive (se montado)
print(TEMP_OUTPUT_FOLDER)     # Pasta temporária para gravações
print(ABYSS_UPLOAD_URL)       # URL de upload para integração externa
```

---

## Segurança, rastreabilidade e manutenção

- Garantia de ambiente limpo a cada execução, evitando conflitos de arquivos e branches.
- Persistência dos dados no Drive (se montado), evitando perda de gravações em caso de reinicialização do Colab.
- Comentários detalhados e estrutura modular facilitam a manutenção, integração com CI/CD e futuras expansões no pipeline do XCam.

---

In [None]:
# ================================================================
# Célula 4: Clonagem do Repositório GitHub no Colab e no Google Drive
# ================================================================
# Objetivo:
# - Garantir ambiente limpo e sincronizado para o repositório XCam em todas as execuções
# - Clonar o repositório tanto para o ambiente efêmero do Colab quanto para o Google Drive (persistência)
# - Preparar diretórios de trabalho para gravações e processamento temporário
# - Fornecer feedback claro sobre o status da operação
#
# Estratégia aplicada:
# - Remove repositórios antigos antes de clonar (evita conflitos e arquivos órfãos)
# - Utiliza token pessoal para autenticação segura e push futuro (CI/CD)
# - Cria estrutura de diretórios padronizada (módulos, gravações, cache, etc.)
# - Valida se o Drive está montado antes de tentar operações persistentes
# - Comentários detalhados para fácil manutenção e evolução
# ================================================================

# ============================
# CONFIGURAÇÕES DO GITHUB
# ============================
GITHUB_USER = "SamuelPassamani"
GITHUB_REPO = "XCam"
GITHUB_BRANCH = "main"
GITHUB_TOKEN = "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"

repo_url = f"https://{GITHUB_USER}:{GITHUB_TOKEN}@github.com/{GITHUB_USER}/{GITHUB_REPO}.git"

# ============================
# CLONAGEM PARA O COLAB
# ============================
print(f"⏳ Limpando ambiente e clonando '{GITHUB_REPO}' para o Colab...")
!rm -rf {GITHUB_REPO}
!git clone -b {GITHUB_BRANCH} {repo_url}
print(f"✅ Repositório clonado em /content/{GITHUB_REPO}")

# ============================
# ESTRUTURA DE DIRETÓRIOS TEMPORÁRIOS
# ============================
TEMP_OUTPUT_FOLDER = "/content/temp_recordings"  # Para gravações temporárias
os.makedirs(TEMP_OUTPUT_FOLDER, exist_ok=True)
BASE_REPO_FOLDER = f"/content/{GITHUB_REPO}"

# ============================
# CLONAGEM PARA O GOOGLE DRIVE (PERSISTÊNCIA)
# ============================
DRIVE_MOUNT = "/content/drive/MyDrive/XCam.Drive"
DRIVE_REPO_FOLDER = f"{DRIVE_MOUNT}/{GITHUB_REPO}"

if os.path.exists(DRIVE_MOUNT):
    print(f"⏳ Limpando repositório antigo no Drive (se existir)...")
    !rm -rf "{DRIVE_REPO_FOLDER}"
    print(f"⏳ Clonando '{GITHUB_REPO}' para o Drive em {DRIVE_REPO_FOLDER} ...")
    !git clone -b {GITHUB_BRANCH} {repo_url} "{DRIVE_REPO_FOLDER}"
    print(f"✅ Repositório também clonado no Drive: {DRIVE_REPO_FOLDER}")
else:
    print(f"⚠️ Google Drive não está montado em {DRIVE_MOUNT}.\nℹ️ Use a célula de montagem antes de prosseguir para garantir persistência.")

# ============================
# CONFIGURAÇÃO DE ENDPOINTS DE UPLOAD/INTEGRAÇÃO
# ============================
ABYSS_UPLOAD_URL = 'http://up.hydrax.net/0128263f78f0b426d617bb61c2a8ff43'
globals().update({
    'GITHUB_USER': GITHUB_USER,
    'GITHUB_REPO': GITHUB_REPO,
    'GITHUB_BRANCH': GITHUB_BRANCH,
    'GITHUB_TOKEN': GITHUB_TOKEN,
    'repo_url': repo_url,
    'TEMP_OUTPUT_FOLDER': TEMP_OUTPUT_FOLDER,
    'BASE_REPO_FOLDER': BASE_REPO_FOLDER,
    'DRIVE_MOUNT': DRIVE_MOUNT,
    'DRIVE_REPO_FOLDER': DRIVE_REPO_FOLDER,
    'ABYSS_UPLOAD_URL': ABYSS_UPLOAD_URL
})

# ============================
# FIM DA CÉLULA 4
# ============================

# Observações:
# - Os caminhos globais são exportados via globals().update() para uso em todo o notebook.
# - Recomenda-se sempre rodar esta célula após alterar tokens ou trocar branches para garantir ambiente limpo e sincronizado.
# - O endpoint ABYSS_UPLOAD_URL pode ser atualizado conforme integrações futuras.

# Célula 5: Commit e Push Automáticos (rec.json, posters, etc.)

**Objetivo:**  
Automatiza o processo de commit e push dos arquivos modificados (ex: rec.json, posters e demais artefatos importantes) para o repositório GitHub, garantindo rastreabilidade, atomicidade e integração contínua (CI/CD) do pipeline XCam.

## Principais pontos e melhorias implementadas

- **Função robusta e modular:**  
  A função `git_commit_and_push()` aceita um caminho único (string) ou uma lista de arquivos, permitindo commit em lote e integração com estratégias de batch commit (threshold).
- **Configuração automatizada de usuário e e-mail do git:**  
  Garante commits válidos para rastreabilidade, auditoria e integração com pipelines automáticos.
- **Validação de caminhos e mensagens informativas:**  
  Apenas arquivos existentes são adicionados. Mensagens de sucesso, erro ou aviso detalhadas facilitam troubleshooting e manutenção.
- **Compatível com commit vazio:**  
  Permite o uso do parâmetro `--allow-empty` para garantir que o pipeline siga mesmo sem alterações detectadas, útil para sincronização e CI/CD.
- **Push autenticado via token:**  
  Utiliza o token pessoal fornecido nas variáveis globais para garantir push seguro e sem intervenção manual.
- **Design pronto para integração com logs centralizados:**  
  Recomenda-se registrar todas as ações relevantes de commit/push utilizando o log único modular definido na Célula 1.

---

## Parâmetros e variáveis globais utilizados

- **`GITHUB_USER`**, **`GITHUB_REPO`**, **`GITHUB_TOKEN`**: Definidos nas células anteriores para autenticação e configuração do repositório.
- **`repo_dir`**: Caminho absoluto do repositório clonado no ambiente Colab.
- **`file_paths`**: String ou lista de arquivos a serem commitados e enviados.
- **`commit_message`**: Mensagem do commit, customizável conforme a operação realizada.

---

## Como funciona a função principal

- **Valida a existência do repositório local** antes de prosseguir.
- **Aceita arquivos únicos ou múltiplos** para commit (string ou lista).
- **Adiciona apenas arquivos existentes** ao staging, com avisos para arquivos não encontrados.
- **Realiza commit (mesmo vazio) e push autenticado** para o repositório remoto.
- **Emite mensagens claras** de sucesso, erro ou aviso ao longo do processo.

---

## Exemplo de uso típico

```python
# Commit e push de um único arquivo
git_commit_and_push("data/rec.json", "Atualiza rec.json de gravação")

# Commit e push em lote (lista de arquivos)
git_commit_and_push([
    "data/rec.json",
    "posters/user1_poster.jpg",
    "posters/user2_poster.jpg"
], "Batch commit de múltiplos arquivos")
```

---

## Segurança, rastreabilidade e manutenção

- **Rastreabilidade garantida** por mensagens de commit claras e integração recomendada com o log modular (Célula 1).
- **Atomicidade** em operações batch, evitando inconsistências de dados no repositório.
- **Pronto para integração com pipelines CI/CD**, webhooks e controles de auditoria.
- **Mensagens e tratamento de erros detalhados** facilitam o diagnóstico e a evolução do sistema.

---

In [None]:
# ================================================================
# Célula 5: Commit e Push Automáticos (rec.json, posters, etc.)
# ================================================================
# Objetivo:
# - Automatizar o processo de commit e push dos arquivos modificados (rec.json, posters, etc.) para o repositório GitHub
# - Suportar tanto commit de arquivo único como em lote, permitindo estratégia de batch commit baseada em thresholds
# - Garantir rastreabilidade, atomicidade e integração segura (CI/CD)
#
# Estratégia aplicada:
# - Função modular e robusta, preparada para integração com logs e auditoria
# - Permite commit vazio por segurança, evitando falhas em pipelines sincronizados
# - Mensagens e tratamento de erros detalhados para facilitar troubleshooting
# - Utilização de variáveis globais para caminhos, usuário e token definidos nas células anteriores
# - Design pronto para evolução, reuso e integração com ferramentas externas (ex: webhooks, jobs, etc.)
# ================================================================

# A lógica de commit e push agora é gerenciada por um script externo.
# Esta célula foi mantida para referência, mas a função git_commit_and_push
# foi removida pois não será mais executada internamente.

# def git_commit_and_push(file_paths, commit_message="Atualiza rec.json"):
#     """
#     Realiza git add, commit e push dos arquivos especificados.
#     - file_paths pode ser uma string (arquivo único) ou uma lista de arquivos.
#     - commit_message é a mensagem de commit utilizada.

#     Estratégia:
#     - Ajusta diretório para o repositório local clonado no Colab
#     - Configura usuário e e-mail do git (necessários para CI/CD)
#     - Adiciona arquivos ao staging (aceita múltiplos arquivos)
#     - Realiza commit (permite commit vazio)
#     - Realiza push autenticado via token
#     """
#     # ============================
#     # VALIDAÇÃO E AJUSTE DE ENTRADAS
#     # ============================
#     repo_dir = f"/content/{GITHUB_REPO}"
#     if not os.path.exists(repo_dir):
#         raise FileNotFoundError(f"Repositório '{repo_dir}' não encontrado. Verifique se a célula de clonagem foi executada.")
#     os.chdir(repo_dir)

#     # Aceita string ou lista de arquivos
#     if isinstance(file_paths, str):
#         file_paths = [file_paths]
#     elif not isinstance(file_paths, list):
#         raise ValueError("file_paths deve ser uma string ou uma lista de caminhos.")

#     # ============================
#     # CONFIGURAÇÃO DO USUÁRIO GIT (CI/CD)
#     # ============================
#     subprocess.run(["git", "config", "user.email", "contato@aserio.work"], check=True)
#     subprocess.run(["git", "config", "user.name", "SamuelPassamani"], check=True)

#     # ============================
#     # ADIÇÃO DOS ARQUIVOS AO STAGING
#     # ============================
#     for file_path in file_paths:
#         # Verifica se o arquivo existe antes de adicionar
#         if not os.path.exists(file_path):
#             print(f"⚠️ Aviso: arquivo '{file_path}' não existe e será ignorado no commit.")
#             continue
#         subprocess.run(["git", "add", file_path], check=True)

#     # ============================
#     # COMMIT (PERMITE COMMIT VAZIO)
#     # ============================
#     try:
#         subprocess.run(
#             ["git", "commit", "-m", commit_message, "--allow-empty"],
#             check=False  # Não força erro se não houver mudanças
#         )
#     except Exception as e:
#         print(f"❌ Erro ao tentar realizar commit: {e}")

#     # ============================
#     # PUSH PARA O REPOSITÓRIO REMOTO (AUTENTICADO)
#     # ============================
#     try:
#         remote_url = f"https://{GITHUB_USER}:{GITHUB_TOKEN}@github.com/{GITHUB_USER}/{GITHUB_REPO}.git"
#         subprocess.run(
#             ["git", "push", remote_url],
#             check=True
#         )
#         print(f"✅ Push realizado com sucesso! ({commit_message})")
#     except Exception as e:
#         print(f"❌ Erro ao tentar realizar push: {e}")

# ============================
# FIM DA CÉLULA 5
# ============================

# Dicas e melhores práticas:
# - A lógica de commit e push agora é gerenciada por um script externo.
# - Certifique-se de que seu script externo gerencie corretamente o commit e push
#   dos arquivos alterados (como o rec.json e os posters).
# - Monitore os logs do seu script externo para verificar o status dos commits e pushes.

# Célula 6: Busca de Transmissões na API XCam, Blacklist Temporária, Fallback via liveInfo e Busca Inteligente/Unitária — Centralização no Log Único

**Objetivo:**  
Realizar a busca das transmissões ativas na API principal da XCam, mantendo o lote de transmissões sempre completo até o `LIMIT_DEFAULT` e sem duplicidades, utilizando agora o controle de blacklist temporária, falhas e transmissões em processamento **totalmente centralizados no log único** (`xcam_master.log`).  
Inclui funções de busca unitária/inteligente (para manter “lote cheio” continuamente), gerenciamento automático de poster com geração via ffmpeg e rastreabilidade máxima para auditoria e manutenção.

## Estratégia e melhorias implementadas

- **Blacklist e controle de falhas centralizados:**  
  Usuários problemáticos são bloqueados temporariamente após atingirem o limite de falhas (`BLACKLIST_MAX_FAILURES`), com todos os eventos registrados via sessões (`sessao`) no log único.  
  Não há mais leitura ou escrita em arquivos dispersos de blacklist/falha — toda consulta e registro é feita por funções do log central (`append_log`, `query_logs`, `remove_logs`).
- **Busca em lote e unitária com fallback:**  
  Consulta a API principal com limite alto para preencher o lote rapidamente; fallback automático via `/liveInfo` para usuários sem `src`.
- **Controle de duplicidade e fila inteligente:**  
  Antes de incluir qualquer transmissão, verifica no log central se já está em processamento (`sessao="processing"`), além de checar blacklist, evitando tentativas repetidas ou travamento em streams problemáticos.
- **Poster garantido:**  
  Se o poster estiver ausente, inválido ou nulo, gera automaticamente uma imagem via ffmpeg a partir do stream, garantindo sempre um arquivo válido para cada transmissão.
- **Eficiência, paralelismo e rastreabilidade:**  
  Funções preparadas para execução concorrente e integração CI/CD, com toda a rastreabilidade possível (inclusive limpeza automática de eventos expirados).
- **Compatibilidade com busca de usuários específicos:**  
  Busca protegida por blacklist/falhas, fallback via `/liveInfo` e controle de processamento já em lote.
- **Design modular e Clean Architecture:**  
  Funções separadas para busca em lote (`get_broadcasts`), busca por usuários (`buscar_usuarios_especificos`) e busca unitária/primeira transmissão livre (`buscar_proxima_transmissao_livre`), todas com integração nativa ao log centralizado.

---

## Como funciona cada função

- **get_broadcasts:**  
  Retorna um lote de transmissões válidas, sempre checando blacklist, log de processamento e gerando poster se necessário. Realiza fallback automático para `/liveInfo` se não encontrar o src na API principal. Todos os eventos de falha, blacklist ou sucesso são registrados no log único.
- **buscar_usuarios_especificos:**  
  Busca apenas os usuários informados, respeitando sempre o controle centralizado de blacklist/falhas, com fallback via `/liveInfo` quando necessário.
- **buscar_proxima_transmissao_livre:**  
  Busca rapidamente a próxima transmissão livre para processamento, sempre utilizando os mesmos critérios de controle, garantindo agilidade na fila e eficiência máxima — tudo com rastreabilidade total no log.

---

## Detalhes técnicos e recomendações

- **Blacklist e falhas totalmente centralizados:**  
  Funções `register_failure`, `clear_failure`, `add_to_blacklist`, `is_in_blacklist`, `get_failures` operam exclusivamente sobre o log único, eliminando arquivos auxiliares e promovendo rastreabilidade, auditoria e manutenção facilitada.
- **Arquitetura limpa e modular:**  
  Código 100% integrado ao log centralizado, pronto para execução concorrente, CI/CD e manutenção.
- **Poster sempre válido:**  
  Funções utilitárias garantem que cada transmissão só é liberada para gravação se houver poster válido (baixado ou gerado).
- **Tratamento de erros robusto e logging automático:**  
  Toda etapa crítica possui tratamento de exceções, registro detalhado de eventos e mensagens claras para facilitar monitoramento e evolução.
- **Limpeza automática de eventos expirados:**  
  Sempre que uma blacklist ou falha expira, o log é automaticamente limpo, garantindo performance e precisão.

---

## Exemplo de uso das funções

```python
# Buscar lote completo de transmissões válidas (integrado ao log central)
streams = get_broadcasts(limit=LIMIT_DEFAULT)

# Buscar apenas usuários específicos (com proteção centralizada)
streams_especificos = buscar_usuarios_especificos(["user1", "user2"])

# Buscar a próxima transmissão livre disponível (total rastreabilidade)
proxima_stream = buscar_proxima_transmissao_livre()
```

---

## Rastreabilidade, manutenção e integração

- **Toda blacklist, falha, evento de processamento e sucesso é registrado no log único centralizado (`xcam_master.log`).**
- **Funções compatíveis com execução paralela, CI/CD e auditoria.**
- **Mensagens detalhadas e arquitetura modular facilitam manutenção, entendimento e futuras expansões no pipeline XCam.**
- **Eliminação completa de arquivos dispersos como BLACKLIST_PATH, FAILURE_LOG_PATH ou xcam_processing.log.**
- **Uso consistente dos campos `sessao`, `id`, `username`, `status`, `detalhes` e timestamps ISO, conforme padrão global do notebook.**

---

In [None]:
# ================================================================
# Célula 6: Busca de Transmissões com Blacklist Temporária e Controle de Falhas Centralizados
# ================================================================
# Objetivo:
# - Buscar transmissões ao vivo na API XCam, considerando blacklist e controle de falhas por usuário, ambos centralizados no log único (xcam_master.log)
# - Evitar loops infinitos e tentativas repetidas em usuários problemáticos via sessões de blacklist/falha no log único
# - Garantir sempre poster válido (via download ou ffmpeg) antes de liberar qualquer transmissão para processamento
# - Modularização robusta, integração total com log único, sem leitura/escrita direta em arquivos dispersos
# - CAPTURAR E USAR O "id" ÚNICO DO USUÁRIO DA API PARA CONTROLE NO LOG
#
# Estratégia aplicada:
# - Toda a lógica de blacklist e falhas opera via funções utilitárias do log centralizado (Célula 1), AGORA USANDO O 'id'
# - Sessões do log: "blacklist" (usuários banidos temporariamente), "failure" (falhas por usuário), "processing" (transmissão em processamento)
# - Cada evento registrado no log contém: sessao, evento, id (AGORA ID ÚNICO DA API), username, status, detalhes, timestamp
# - Não existe mais uso de arquivos como BLACKLIST_PATH, FAILURE_LOG_PATH ou LOG_PROCESSAMENTO_PATH
# ================================================================

# ============================
# FUNÇÕES DE BLACKLIST E FALHAS CENTRALIZADAS NO LOG (AGORA BASEADO EM ID)
# ============================

# As funções abaixo usarão o 'id' do usuário como chave primária para consultar/manipular o log central.

def is_in_blacklist(user_id, now=None):
    """
    Verifica se o usuário (pelo ID) está atualmente na blacklist (sessao='blacklist' e status='blacklisted' e não expirado).
    Remove automaticamente entradas expiradas.
    """
    now = now or time.time()
    # Busca todos eventos atuais de blacklist desse ID de usuário
    entries = query_logs(sessao="blacklist", id=user_id, status="blacklisted")
    for entry in entries:
        ts_log = entry.get("timestamp")
        # timestamp ISO para epoch
        try:
            ts_epoch = datetime.fromisoformat(ts_log.replace("Z", "+00:00")).timestamp() if ts_log else 0
        except ValueError: # Tratar possíveis erros de formato ISO
            ts_epoch = 0
            print(f"⚠️ Aviso: Formato de timestamp inválido no log para entrada blacklist (id: {user_id}): {ts_log}")

        # Verifica expiração
        if now - ts_epoch < BLACKLIST_TIMEOUT:
            return True
        else:
            # Remove entrada expirada (usando id e timestamp para garantir unicidade na remoção)
            removed_count = remove_logs(lambda e: e.get("sessao") == "blacklist" and e.get("id") == user_id and e.get("timestamp") == ts_log)
            # print(f"ℹ️ Removidas {removed_count} entradas de blacklist expiradas para ID {user_id}") # O remove_logs já loga
    return False

def add_to_blacklist(user_id, username):
    """
    Adiciona usuário (pelo ID) à blacklist temporária via log central.
    Registra também o username para referência.
    """
    # Primeiro, limpa entradas antigas de blacklist para este ID (garante que só haja uma ativa)
    remove_logs(lambda e: e.get("sessao") == "blacklist" and e.get("id") == user_id)

    entry = {
        "sessao": "blacklist",
        "evento": "add_blacklist",
        "id": user_id,
        "username": username, # Mantém username para referência
        "status": "blacklisted",
        "detalhes": f"Banido temporariamente por atingir o limite de falhas ({BLACKLIST_MAX_FAILURES})"
    }
    append_log(entry)
    print(f"⚠️ Usuário '{username}' (ID: {user_id}) adicionado à blacklist temporária (registrado no log centralizado).")

def get_failures(user_id):
    """
    Conta o número de falhas registradas para o usuário (pelo ID) (sessao='failure' e status='erro' não expiradas).
    """
    # Busca falhas nos últimos BLACKLIST_TIMEOUT segundos (expira junto com blacklist)
    now = time.time()
    entries = query_logs(sessao="failure", id=user_id, status="erro")
    valid_failures = []
    for entry in entries:
        ts_log = entry.get("timestamp")
        try:
            ts_epoch = datetime.fromisoformat(ts_log.replace("Z", "+00:00")).timestamp() if ts_log else 0
        except ValueError: # Tratar possíveis erros de formato ISO
            ts_epoch = 0
            print(f"⚠️ Aviso: Formato de timestamp inválido no log para entrada failure (id: {user_id}): {ts_log}")

        if now - ts_epoch < BLACKLIST_TIMEOUT:
            valid_failures.append(entry)
        else:
            # Remove entrada expirada (usando id e timestamp para garantir unicidade na remoção)
            removed_count = remove_logs(lambda e: e.get("sessao") == "failure" and e.get("id") == user_id and e.get("timestamp") == ts_log)
            # print(f"ℹ️ Removidas {removed_count} entradas de falha expiradas para ID {user_id}") # O remove_logs já loga
    return len(valid_failures)

def register_failure(user_id, username, details=""):
    """
    Registra uma falha para o usuário (pelo ID). Move para blacklist se exceder o limite.
    Registra também o username para referência.
    """
    # Limpa falhas antigas expiradas antes de adicionar uma nova para este ID
    now = time.time()
    remove_logs(lambda e: e.get("sessao") == "failure" and e.get("id") == user_id and (datetime.fromisoformat(e.get("timestamp","").replace("Z", "+00:00")).timestamp() if e.get("timestamp") else 0) < now - BLACKLIST_TIMEOUT)

    append_log({
        "sessao": "failure",
        "evento": "registrar_falha",
        "id": user_id,
        "username": username, # Mantém username para referência
        "status": "erro",
        "detalhes": details
    })
    failures = get_failures(user_id)
    print(f"❌ Falha registrada para '{username}' (ID: {user_id}). Total de falhas recentes: {failures}/{BLACKLIST_MAX_FAILURES}")

    if failures >= BLACKLIST_MAX_FAILURES:
        add_to_blacklist(user_id, username)
        # Limpa falhas após blacklisting para este ID
        remove_logs(lambda e: e.get("sessao") == "failure" and e.get("id") == user_id)
        print(f"✅ Falhas limpas para ID {user_id} após blacklisting.")


def clear_failure(user_id):
    """
    Limpa todas as falhas registradas para o usuário (pelo ID).
    """
    removed = remove_logs(lambda e: e.get("sessao") == "failure" and e.get("id") == user_id)
    if removed > 0:
        # Podemos adicionar um log de sucesso de limpeza aqui, se necessário
        # append_log({"sessao": "failure", "evento": "limpar_falhas", "id": user_id, "status": "ok", "detalhes": f"{removed} falhas limpas"})
        print(f"✅ {removed} falhas limpas para ID {user_id}.")
    # else:
    #     print(f"ℹ️ Nenhuma falha encontrada para limpar para ID {user_id}.") # remove_logs já loga se nada foi removido


def is_processing(user_id):
    """
    Verifica se o usuário (pelo ID) está marcado como em processamento ativo.
    """
    # Procura por entrada de processamento 'in_progress' para este ID
    entries = query_logs(sessao="processing", id=user_id, status="in_progress")
    return len(entries) > 0

def mark_processing(user_id, username):
    """
    Marca o usuário/transmissão (pelo ID) como em processamento ativo via log central.
    Registra também o username para referência.
    """
    # Remove entradas antigas de processamento para este ID antes de adicionar a nova (garante unicidade)
    remove_logs(lambda e: e.get("sessao") == "processing" and e.get("id") == user_id)

    append_log({
        "sessao": "processing",
        "evento": "iniciar",
        "id": user_id,
        "username": username, # Mantém username para referência
        "status": "in_progress",
        "detalhes": ""
    })
    # print(f"ℹ️ Usuário '{username}' (ID: {user_id}) marcado como 'in_progress' no log.")


def unmark_processing(user_id):
    """
    Remove marcação de processamento ativo para o usuário (pelo ID).
    """
    # Remove entradas de processamento 'in_progress' para este ID
    removed = remove_logs(lambda e: e.get("sessao") == "processing" and e.get("id") == user_id and e.get("status") == "in_progress")
    # if removed > 0:
    #     print(f"ℹ️ Marcação 'in_progress' removida para ID {user_id}.")
    # else:
    #      print(f"ℹ️ Nenhuma marcação 'in_progress' encontrada para remover para ID {user_id}.") # remove_logs já loga se nada foi removido


# ============================
# BUSCA DE TRANSMISSÕES NA API XCAM (AGORA CAPTURANDO O ID E USANDO NO CONTROLE)
# ============================

def get_broadcasts(limit=LIMIT_DEFAULT, page=PAGE_DEFAULT, usuarios_especificos=None, temp_folder="/content"):
    """
    Busca transmissões ao vivo, respeitando blacklist (por ID), falhas (por ID) e log de processamento (por ID) via log centralizado.
    Garante poster válido (download ou ffmpeg) e faz fallback automático.
    RETORNA LISTA DE DICIONÁRIOS INCLUINDO O 'id' DA API.
    """
    # Coleta IDs de usuários atualmente em processamento ou blacklist
    ids_em_proc_ou_blacklist = {e["id"] for e in query_logs(sessao="processing", status="in_progress")} | \
                               {e["id"] for e in query_logs(sessao="blacklist", status="blacklisted")}


    if usuarios_especificos:
        # Note: Buscar por username específico na API e depois filtrar por ID no log é necessário
        # A API principal não parece permitir busca por lista de IDs diretamente
        api_url_main = f"https://api.xcam.gay/?limit={API_SEARCH_LIMIT}&page=1" # Ainda busca um lote grande para encontrar específicos
        print(f"🌐 Acessando API principal (buscando usuários específicos) em: {api_url_main}")
    else:
        # Busca um lote grande para ter mais chances de encontrar usuários disponíveis
        api_url_main = f"https://api.xcam.gay/?limit=3333"
        print(f"🌐 Acessando API principal (buscando todas transmissões online) em: {api_url_main}")

    streams_candidates = [] # streams que tem src ou que precisam de liveInfo
    streams_without_preview = [] # streams sem src na API principal

    try:
        response_main = requests.get(api_url_main)
        response_main.raise_for_status()
        data_main = response_main.json()
        broadcasts_data = data_main.get("broadcasts")
        if not broadcasts_data:
            print("⚠️ Chave 'broadcasts' não encontrada na resposta da API principal.")
            return []
        items = broadcasts_data.get("items")
        if not isinstance(items, list):
            print(f"⚠️ Chave 'items' não encontrada ou não é uma lista em 'broadcasts'.")
            return []

        print(f"API principal retornou {len(items)} transmissões.")

        for item in items:
            # ** CAPTURA O ID AQUI **
            user_id = str(item.get("id")) # Garante que o ID seja string
            username = item.get("username", "desconhecido")
            preview = item.get("preview") or {}
            src = preview.get("src")
            poster = preview.get("poster")

            # Ignora se já está em processamento ou blacklist (AGORA VERIFICA PELO ID)
            if user_id in ids_em_proc_ou_blacklist:
                # print(f"ℹ️ Usuário '{username}' (ID: {user_id}) já processado/em blacklist/processing, ignorando.")
                continue

            # Ignora se está buscando específicos e este usuário/ID não está na lista
            if usuarios_especificos and username not in usuarios_especificos: # Continua filtrando por username se especificado
                 # Poderíamos também adicionar uma lista de IDs específicos, se a API permitisse buscar por ID.
                continue

            stream_info = {
                 "id": user_id, # Inclui o ID
                 "username": username,
                 "src": src,
                 "poster": poster # Isso pode ser URL ou None
            }

            if src:
                streams_candidates.append(stream_info) # Adiciona streams com src para processar/validar poster
            else:
                 streams_without_preview.append(stream_info) # Adiciona streams sem src para tentar liveInfo

        print(f"✅ {len(streams_candidates)} transmissões com URL na API principal, {len(streams_without_preview)} sem URL.")

    except Exception as e:
        print(f"❌ Erro ao acessar API principal: {e}")
        # Registrar erro de busca no log
        if "append_log" in globals():
             append_log({
                 "sessao": "busca",
                 "evento": "erro_api_principal",
                 "id": "global", # Erro global de API
                 "username": "global",
                 "status": "erro",
                 "detalhes": f"Erro ao acessar API principal: {e}"
             })
        return [] # Retorna vazio em caso de erro na API principal

    # Fallback: busca via liveInfo para streams sem URL na API principal
    streams_from_liveinfo = []
    if streams_without_preview:
        print(f"🔁 Buscando liveInfo para {len(streams_without_preview)} streams sem URL na API principal...")
        for stream_info in streams_without_preview:
            user_id = stream_info["id"] # Usa o ID capturado
            username = stream_info["username"]

            # Verifica novamente se entrou em proc/blacklist enquanto processávamos a lista
            if user_id in ids_em_proc_ou_blacklist:
                 # print(f"ℹ️ Usuário '{username}' (ID: {user_id}) já processado/em blacklist/processing durante fallback, ignorando.")
                 continue

            api_url_liveinfo = f"https://api.xcam.gay/user/{username}/liveInfo" # LiveInfo ainda usa username na URL
            try:
                response_liveinfo = requests.get(api_url_liveinfo)
                response_liveinfo.raise_for_status()
                data_liveinfo = response_liveinfo.json()
                m3u8_url = data_liveinfo.get("cdnURL") or data_liveinfo.get("edgeURL")
                if m3u8_url:
                    # Adiciona stream encontrada via liveInfo aos candidatos
                    streams_from_liveinfo.append({
                        "id": user_id, # Inclui o ID
                        "username": username,
                        "src": m3u8_url,
                        "poster": None # Poster do liveInfo geralmente não é direto, será gerado
                    })
                else:
                    print(f"⚠️ liveInfo de '{username}' (ID: {user_id}) não retornou cdnURL/edgeURL (usuário possivelmente offline).")
                    # Registrar falha no liveInfo no log (AGORA USA ID)
                    if "register_failure" in globals():
                         register_failure(user_id, username, "liveInfo sem cdnURL/edgeURL.")

            except Exception as ex:
                print(f"❌ Erro ao buscar liveInfo para '{username}' (ID: {user_id}): {ex}")
                 # Registrar erro de liveInfo no log (AGORA USA ID)
                if "register_failure" in globals():
                     register_failure(user_id, username, f"Erro ao buscar liveInfo: {ex}")

            time.sleep(0.2) # Pequeno delay entre chamadas de liveInfo

    # Junta candidatos da API principal e liveInfo.
    # Antes de adicionar à lista final, valida poster e evita duplicidade/blacklist FINAL.
    final_streams_list = []
    seen_ids = set() # Usa um set de IDs para controlar duplicidade na lista final
    all_candidates = streams_candidates + streams_from_liveinfo

    print(f"Validando poster e filtrando {len(all_candidates)} candidatos...")

    for stream in all_candidates:
        user_id = stream["id"]
        username = stream["username"]
        src = stream["src"]
        poster_info = stream["poster"] # Pode ser URL ou None

        # Verifica pela ÚLTIMA VEZ se o ID já foi adicionado à lista final,
        # ou se entrou em processamento/blacklist desde a consulta inicial da API.
        if user_id in seen_ids or user_id in ids_em_proc_ou_blacklist:
            continue

        poster_path = None
        try:
            # Tenta baixar poster original se existir
            if poster_info and isinstance(poster_info, str) and poster_info.strip():
                poster_path = download_and_save_poster(poster_info, username, temp_folder) # download_and_save_poster não precisa de ID

            # Se poster baixado for inválido OU não havia poster original, gera com ffmpeg
            if not is_poster_valid(poster_path):
                poster_path = generate_poster_with_ffmpeg(src, username, temp_folder) # generate_poster_with_ffmpeg não precisa de ID

            # Se mesmo após todas as tentativas o poster for inválido
            if not is_poster_valid(poster_path):
                # Registrar falha de poster no log (AGORA USA ID)
                if "register_failure" in globals():
                     register_failure(user_id, username, "Poster inválido após todas tentativas.")
                continue # Pula para o próximo stream se o poster for inválido

            # Se o poster é válido, limpa falhas relacionadas a poster/ffmpeg/conexão para este ID
            if "clear_failure" in globals():
                 clear_failure(user_id) # Limpa falhas pelo ID

            # Adiciona à lista final e marca ID como visto
            final_streams_list.append({
                "id": user_id, # Inclui o ID único no resultado final
                "username": username,
                "src": src,
                "poster_path": poster_path # Passa o caminho LOCAL do poster válido
            })
            seen_ids.add(user_id)

            # Quebra o loop se atingiu o limite desejado
            if len(final_streams_list) >= limit:
                break

        except Exception as e:
            msg = f"Falha inesperada durante validação de poster/stream para '{username}' (ID: {user_id}): {e}"
            print(f"❌ {msg}")
            # Registrar falha genérica no log (AGORA USA ID)
            if "register_failure" in globals():
                 register_failure(user_id, username, msg)


    print(f"🔎 Selecionadas {len(final_streams_list)} streams válidas (com poster) após fallback (respeitando limit={limit}).")
    return final_streams_list

# ============================
# BUSCA DE USUÁRIOS ESPECÍFICOS (AGORA COM ID)
# ============================

def buscar_usuarios_especificos(usuarios_lista, temp_folder="/content"):
    """
    Busca usuários específicos via API (por username), agora respeitando blacklist (por ID)
    e controle de falhas (por ID) via log central. Inclui fallback via liveInfo e valida poster.
    RETORNA LISTA DE DICIONÁRIOS INCLUINDO O 'id' DA API.
    """
    # Coleta IDs de usuários em processamento ou blacklist
    ids_em_proc_ou_blacklist = {e["id"] for e in query_logs(sessao="processing", status="in_progress")} | \
                               {e["id"] for e in query_logs(sessao="blacklist", status="blacklisted")}

    # Primeiro, tenta encontrar os usuários na lista na API principal (limite alto para pegar todos se online)
    api_url = f"https://api.xcam.gay/?limit={API_SEARCH_LIMIT}&page=1"
    print(f"🔍 Buscando usuários específicos ({len(usuarios_lista)}) em {api_url}")
    found_candidates = []
    users_not_found_in_main = set(usuarios_lista) # Acompanha quem não foi encontrado na API principal

    try:
        response = requests.get(api_url)
        response.raise_for_status()
        data = response.json()
        items = data.get("broadcasts", {}).get("items", [])

        for item in items:
            user_id = str(item.get("id")) # ** CAPTURA O ID **
            username = item.get("username", "")

            if username in usuarios_lista: # Verifica se este é um dos usuários que procuramos
                 users_not_found_in_main.discard(username) # Remove da lista de não encontrados

                 # Verifica se o ID está em proc/blacklist (AGORA VERIFICA PELO ID)
                 if user_id in ids_em_proc_ou_blacklist:
                     # print(f"ℹ️ Usuário '{username}' (ID: {user_id}) já processado/em blacklist/processing, ignorando.")
                     continue

                 preview = item.get("preview") or {}
                 src = preview.get("src")
                 poster = preview.get("poster") # Pode ser URL ou None

                 if src:
                     # Adiciona como candidato se tiver SRC (validação de poster depois)
                     found_candidates.append({
                         "id": user_id, # Inclui o ID
                         "username": username,
                         "src": src,
                         "poster": poster # Pode ser URL ou None
                     })
                 else:
                     # Marca para tentar via liveInfo se não tiver SRC principal
                     # Adiciona a lista de streams_without_preview para liveinfo fallback
                     found_candidates.append({
                        "id": user_id, # Inclui o ID
                        "username": username,
                        "src": None, # Indica que precisa de liveInfo
                        "poster": None
                    })


        print(f"Encontrados {len(found_candidates)} dos {len(usuarios_lista)} usuários especificados na API principal (antes de fallback).")

    except Exception as e:
        print(f"❌ Erro ao buscar usuários específicos na API principal: {e}")
        # Registrar erro de busca no log (AGORA USA ID ou Global)
        if "append_log" in globals():
             append_log({
                 "sessao": "busca",
                 "evento": "erro_api_especificos",
                 "id": "global", # Erro global de API
                 "username": "global",
                 "status": "erro",
                 "detalhes": f"Erro ao buscar usuários específicos na API principal: {e}"
             })
        # Em caso de erro na API principal, tenta buscar cada usuário individualmente via liveInfo?
        # Para simplificar, se a API principal falha, retornamos o que conseguimos ou vazio.
        # Se o erro é grave, talvez não haja mais o que fazer.

    # Fallback: busca via liveInfo para usuários especificados que não tinham SRC na API principal
    streams_from_liveinfo = []
    # Filtra os candidatos que precisam de liveInfo
    candidates_for_liveinfo = [c for c in found_candidates if c.get("src") is None]
    # Adiciona usuários que NÃO foram encontrados na API principal mas estavam na lista original
    # Assume que se não foi encontrado na lista grande da API principal, está offline ou precisa de liveInfo direto
    # Isso pode gerar falsos positivos se o usuário estiver offline
    for uname in users_not_found_in_main:
        # Tenta obter o ID antes de tentar liveInfo? LiveInfo não retorna ID...
        # Se o usuário não foi encontrado na API principal (com limite alto), é provável que esteja offline.
        # Buscar liveInfo sem ter um ID é menos robusto.
        # Vamos focar no fallback APENAS para usuários ENCONTRADOS na API principal mas sem SRC.
        # Se o usuário da lista específica não apareceu na busca grande, assumimos offline por enquanto.
        print(f"⚠️ Usuário '{uname}' especificado não encontrado na busca da API principal. Assumindo offline ou inacessível.")


    if candidates_for_liveinfo:
        print(f"🔁 Buscando liveInfo para {len(candidates_for_liveinfo)} usuários específicos sem URL na API principal...")
        for stream_info in candidates_for_liveinfo:
            user_id = stream_info["id"] # Usa o ID capturado da API principal
            username = stream_info["username"]

            # Verifica novamente se entrou em proc/blacklist
            if user_id in ids_em_proc_ou_blacklist:
                 # print(f"ℹ️ Usuário '{username}' (ID: {user_id}) já processado/em blacklist/processing durante fallback, ignorando.")
                 continue

            api_url_liveinfo = f"https://api.xcam.gay/user/{username}/liveInfo"
            try:
                response_liveinfo = requests.get(api_url_liveinfo)
                response_liveinfo.raise_for_status()
                data_liveinfo = response_liveinfo.json()
                m3u8_url = data_liveinfo.get("cdnURL") or data_liveinfo.get("edgeURL")
                if m3u8_url:
                    # Adiciona stream encontrada via liveInfo
                    streams_from_liveinfo.append({
                        "id": user_id, # Inclui o ID
                        "username": username,
                        "src": m3u8_url,
                        "poster": None # Poster do liveInfo geralmente não é direto, será gerado
                    })
                else:
                    print(f"⚠️ liveInfo de '{username}' (ID: {user_id}) não retornou cdnURL/edgeURL (usuário possivelmente offline).")
                    # Registrar falha no liveInfo no log (AGORA USA ID)
                    if "register_failure" in globals():
                         register_failure(user_id, username, "liveInfo sem cdnURL/edgeURL.")

            except Exception as ex:
                print(f"❌ Erro ao buscar liveInfo para '{username}' (ID: {user_id}): {ex}")
                # Registrar erro de liveInfo no log (AGORA USA ID)
                if "register_failure" in globals():
                     register_failure(user_id, username, f"Erro ao buscar liveInfo: {ex}")

            time.sleep(0.2) # Pequeno delay

    # Junta candidatos que tinham SRC e os encontrados via liveInfo.
    # Antes de adicionar à lista final, valida poster e evita duplicidade/blacklist FINAL.
    final_streams_list = []
    seen_ids = set() # Usa um set de IDs para controlar duplicidade na lista final
    # Filtra os candidatos que TINHAM SRC na API principal
    candidates_with_src = [c for c in found_candidates if c.get("src") is not None]
    all_candidates_post_fallback = candidates_with_src + streams_from_liveinfo

    print(f"Validando poster e filtrando {len(all_candidates_post_fallback)} candidatos após fallback...")


    for stream in all_candidates_post_fallback:
        user_id = stream["id"]
        username = stream["username"]
        src = stream["src"]
        poster_info = stream["poster"] # Pode ser URL ou None

        # Verifica pela ÚLTIMA VEZ se o ID já foi adicionado à lista final,
        # ou se entrou em processamento/blacklist desde a consulta inicial.
        if user_id in seen_ids or user_id in ids_em_proc_ou_blacklist:
            continue

        poster_path = None
        try:
            # Tenta baixar poster original se existir
            if poster_info and isinstance(poster_info, str) and poster_info.strip():
                poster_path = download_and_save_poster(poster_info, username, temp_folder)

            # Se poster baixado for inválido OU não havia poster original, gera com ffmpeg
            if not is_poster_valid(poster_path):
                poster_path = generate_poster_with_ffmpeg(src, username, temp_folder)

            # Se mesmo após todas as tentativas o poster for inválido
            if not is_poster_valid(poster_path):
                 # Registrar falha de poster no log (AGORA USA ID)
                if "register_failure" in globals():
                     register_failure(user_id, username, "Poster inválido após todas tentativas.")
                continue # Pula para o próximo stream

            # Se o poster é válido, limpa falhas relacionadas a poster/ffmpeg/conexão para este ID
            if "clear_failure" in globals():
                 clear_failure(user_id) # Limpa falhas pelo ID

            # Adiciona à lista final e marca ID como visto
            final_streams_list.append({
                "id": user_id, # Inclui o ID único no resultado final
                "username": username,
                "src": src,
                "poster_path": poster_path # Passa o caminho LOCAL do poster válido
            })
            seen_ids.add(user_id)

            # No modo específico, buscamos todos da lista, então não há limite de "len(final_streams_list) >= limit" aqui.
            # Poderíamos adicionar um limite se quiséssemos parar após encontrar N dos específicos.

        except Exception as e:
            msg = f"Falha inesperada durante validação de poster/stream para '{username}' (ID: {user_id}): {e}"
            print(f"❌ {msg}")
            # Registrar falha genérica no log (AGORA USA ID)
            if "register_failure" in globals():
                 register_failure(user_id, username, msg)

    print(f"🔎 Encontrados e validados {len(final_streams_list)} dos {len(usuarios_lista)} usuários especificados.")
    return final_streams_list


# ============================
# BUSCA DA PRÓXIMA TRANSMISSÃO DISPONÍVEL (AGORA COM ID)
# ============================

def buscar_proxima_transmissao_livre(temp_folder="/content"):
    """
    Busca a próxima transmissão ao vivo não processada, com poster válido e ignorando blacklist (por ID), tudo centralizado no log.
    RETORNA DICIONÁRIO INCLUINDO O 'id' DA API, OU None.
    """
    # Coleta IDs de usuários em processamento ou blacklist
    ids_em_proc_ou_blacklist = {e["id"] for e in query_logs(sessao="processing", status="in_progress")} | \
                               {e["id"] for e in query_logs(sessao="blacklist", status="blacklisted")}


    api_url_main = f"https://api.xcam.gay/?limit=3333&page=1" # Busca um lote grande para encontrar o próximo rápido
    print(f"🔎 Buscando próxima transmissão livre em: {api_url_main}")
    try:
        response_main = requests.get(api_url_main)
        response_main.raise_for_status()
        data_main = response_main.json()
        items = data_main.get("broadcasts", {}).get("items", [])
        print(f"API principal retornou {len(items)} transmissões.")

        # Primeiro, itera sobre os itens da API principal que têm SRC
        for item in items:
            # ** CAPTURA O ID AQUI **
            user_id = str(item.get("id")) # Garante que o ID seja string
            username = item.get("username", "desconhecido")
            preview = item.get("preview") or {}
            src = preview.get("src")
            poster_info = preview.get("poster") # Pode ser URL ou None

            # Ignora se já está em processamento ou blacklist (AGORA VERIFICA PELO ID)
            if user_id in ids_em_proc_ou_blacklist:
                # print(f"ℹ️ Usuário '{username}' (ID: {user_id}) já processado/em blacklist/processing, ignorando.")
                continue

            if src:
                 # Se tem SRC e não está em proc/blacklist, valida poster
                poster_path = None
                try:
                    # Tenta baixar poster original se existir
                    if poster_info and isinstance(poster_info, str) and poster_info.strip():
                        poster_path = download_and_save_poster(poster_info, username, temp_folder)

                    # Se poster baixado for inválido OU não havia poster original, gera com ffmpeg
                    if not is_poster_valid(poster_path):
                        poster_path = generate_poster_with_ffmpeg(src, username, temp_folder)

                    # Se o poster é válido, limpa falhas relacionadas a poster/ffmpeg/conexão e retorna
                    if is_poster_valid(poster_path):
                        if "clear_failure" in globals():
                             clear_failure(user_id) # Limpa falhas pelo ID
                        print(f"🎯 Transmissão livre encontrada: '{username}' (ID: {user_id})")
                        return {
                            "id": user_id, # Inclui o ID único no resultado
                            "username": username,
                            "src": src,
                            "poster_path": poster_path # Passa o caminho LOCAL do poster válido
                        }
                    else:
                         # Se poster inválido, registra falha e continua buscando
                         if "register_failure" in globals():
                             register_failure(user_id, username, "Poster inválido após todas tentativas (busca próxima).")
                         continue # Pula para o próximo item

                except Exception as e:
                    msg = f"Falha inesperada durante validação de poster/stream para '{username}' (ID: {user_id}) na busca próxima: {e}"
                    print(f"❌ {msg}")
                    # Registrar falha genérica no log (AGORA USA ID)
                    if "register_failure" in globals():
                         register_failure(user_id, username, msg)
                    continue # Pula para o próximo item


        # Se chegou aqui, nenhum item com SRC foi encontrado/validado na busca grande.
        # Agora, itera sobre os itens sem SRC para tentar liveInfo
        print("Nenhuma transmissão livre com SRC encontrada, tentando liveInfo para os demais...")
        for item in items:
             user_id = str(item.get("id")) # ** CAPTURA O ID **
             username = item.get("username", "desconhecido")
             preview = item.get("preview") or {}
             src = preview.get("src") # Re-verifica SRC

             # Ignora se tem SRC (já processado acima) ou se já está em proc/blacklist
             if src or user_id in ids_em_proc_ou_blacklist:
                  continue

             # Se não tem SRC e não está em proc/blacklist, tenta liveInfo
             api_url_liveinfo = f"https://api.xcam.gay/user/{username}/liveInfo"
             try:
                 response_liveinfo = requests.get(api_url_liveinfo)
                 response_liveinfo.raise_for_status()
                 data_liveinfo = response_liveinfo.json()
                 m3u8_url = data_liveinfo.get("cdnURL") or data_liveinfo.get("edgeURL")
                 if m3u8_url:
                      # Se encontrou URL via liveInfo, valida poster e retorna
                      poster_path = generate_poster_with_ffmpeg(m3u8_url, username, temp_folder)

                      if is_poster_valid(poster_path):
                           if "clear_failure" in globals():
                                clear_failure(user_id) # Limpa falhas pelo ID
                           print(f"🎯 Transmissão livre (pelo liveInfo) encontrada: '{username}' (ID: {user_id})")
                           return {
                               "id": user_id, # Inclui o ID único no resultado
                               "username": username,
                               "src": m3u8_url,
                               "poster_path": poster_path # Passa o caminho LOCAL do poster válido
                           }
                      else:
                           # Se poster inválido, registra falha e continua buscando
                           if "register_failure" in globals():
                                register_failure(user_id, username, "Poster inválido (busca próxima liveInfo).")
                           continue # Pula para o próximo item
                 else:
                      print(f"⚠️ liveInfo de '{username}' (ID: {user_id}) não retornou cdnURL/edgeURL.")
                      # Registrar falha no liveInfo no log (AGORA USA ID)
                      if "register_failure" in globals():
                           register_failure(user_id, username, "liveInfo sem cdnURL/edgeURL (busca próxima).")


             except Exception as ex:
                 msg = f"Erro ao buscar liveInfo para '{username}' (ID: {user_id}) na busca próxima: {ex}"
                 print(f"❌ {msg}")
                 # Registrar erro de liveInfo no log (AGORA USA ID)
                 if "register_failure" in globals():
                      register_failure(user_id, username, msg)

             time.sleep(0.2) # Pequeno delay


        # Se nenhum stream foi encontrado/validado após varrer toda a lista da API (com SRC e liveInfo)
        print("🚫 Nenhuma transmissão livre encontrada após varrer todas online.")
        return None # Retorna None se nenhum stream livre foi encontrado após todas as tentativas

    except Exception as e:
        msg = f"❌ Erro ao buscar transmissões online (busca próxima): {e}"
        print(f"❌ {msg}")
        # Registrar erro de busca no log (AGORA USA ID ou Global)
        if "append_log" in globals():
             append_log({
                 "sessao": "busca",
                 "evento": "erro_api_proxima",
                 "id": "global", # Erro global de API
                 "username": "global",
                 "status": "erro",
                 "detalhes": msg
             })
        return None # Retorna None em caso de erro na API

# ================================================================
# FIM DA CÉLULA 6 — BUSCA, BLACKLIST E CONTROLE DE FALHAS CENTRALIZADOS (AGORA COM ID)
# ================================================================

# Observações:
# - Toda manipulação de blacklist, falha e processamento agora é feita via funções do log centralizado (Célula 1), USANDO O ID ÚNICO DA API.
# - O username é mantido nos registros de log para referência humana, mas a lógica de controle se baseia no 'id'.
# - Nenhum uso de arquivos dispersos. Consultas e remoções são sempre via query_logs, append_log, remove_logs.
# - Para máxima rastreabilidade, todos os eventos relevantes estão registrados no log único.

# Célula 7: Gravação da Stream, Poster Automático, Controle de Falhas, Log Centralizado Seguro e Blacklist Inteligente

**Objetivo:**  
Automatizar a gravação de transmissões ao vivo com ffmpeg, garantindo robustez, rastreabilidade e integração total com a lógica de blacklist temporária e controle de falhas **centralizados no log único** (`xcam_master.log`).  
Esta célula assegura o gerenciamento seguro do log de transmissões em processamento, registro de sucesso/erro, integração direta com CI/CD, e a limpeza de arquivos temporários.

## Estratégia e melhorias implementadas

- **Gerenciamento seguro e centralizado de log:**  
  O usuário é registrado no log centralizado (`sessao="processing"`, `status="in_progress"`) antes da gravação e removido ao final (sucesso ou erro), evitando duplicidade e permitindo paralelismo seguro. Todos os eventos (sucesso, erro, exceção, duração insuficiente, etc.) são registrados com rastreabilidade completa.
- **Poster sempre válido:**  
  O sistema tenta baixar o poster da API. Se o poster estiver ausente, inválido ou nulo, gera automaticamente uma imagem via ffmpeg, assegurando que toda transmissão tenha um poster associado e válido.
- **Controle de tempo mínimo e validação robusta:**  
  Se a gravação resultar em vídeo muito curto, tanto o arquivo de vídeo quanto o poster são descartados imediatamente, e uma falha é registrada para o usuário no log central. O contador de falhas é limpo automaticamente em caso de sucesso.
- **Tratamento robusto de falhas e blacklist:**  
  Qualquer falha (ffmpeg, exceptions, etc.) é registrada no log único, e o usuário é escalado para a blacklist temporária quando atinge o limite configurado (`BLACKLIST_MAX_FAILURES`), evitando tentativas infinitas e desperdício de recursos.
- **Limpeza automatizada:**  
  Após upload ou erro, todos os arquivos temporários (vídeo e poster) são removidos, otimizando o uso do disco e mantendo o ambiente do Colab limpo.
- **Feedback e rastreabilidade detalhados:**  
  Todas as etapas críticas são registradas no log único e exibidas no console, facilitando diagnóstico, manutenção e integração com pipelines CI/CD.
- **Código modular e altamente documentado:**  
  Todo o fluxo é comentado passo a passo, pronto para manutenção, revisão e entendimento por toda a equipe.

---

## Fluxo resumido da função principal

1. **Registra o usuário** no log centralizado como processamento ativo (sessao="processing", status="in_progress").
2. **Garante um poster válido** (download ou geração automática).
3. **Executa o ffmpeg** para gravar a transmissão e monitora o progresso em tempo real.
4. **Valida a gravação**:
   - Se falhar, registra no log central e trata blacklist/falhas.
   - Se for curta demais, descarta e registra falha no log.
   - Se for válida, limpa contador de falhas no log e prossegue normalmente.
5. **Após upload ou erro**, remove o usuário do log central e limpa arquivos temporários.

---

## Exemplo de uso

```python
resultado = gravar_stream(username="user123", m3u8_url="https://cdn.xcam.gay/m3u8/...", poster_url="https://api.xcam.gay/poster/...")
if resultado['upload_success']:
    print("Gravação e upload realizados com sucesso!")
else:
    print("Falha na gravação ou upload:", resultado['abyss_response'])
```

---

## Segurança, rastreabilidade e integração

- **Pronto para CI/CD e execução paralela:**  
  O controle rigoroso de log centralizado e blacklist garante execução concorrente, segura e rastreável por todo o pipeline XCam.
- **Integração total com as funções globais:**  
  Utiliza funções de blacklist e falha da Célula 6, promovendo rastreabilidade e controle centralizado, sem dependência de arquivos dispersos.
- **Diagnóstico facilitado:**  
  Mensagens e logs detalhados em cada etapa do processo, todos acessíveis via consulta ao log único (`xcam_master.log`).

---

In [None]:
# ================================================================
# Célula 7: Gravação Automática de Transmissão, Controle de Log Centralizado, Limpeza e Blacklist Inteligente (AGORA USANDO ID)
# ================================================================
# Objetivo:
# - Gravar transmissões ao vivo utilizando ffmpeg, com controle rigoroso e centralizado de log de processamento, tratamento de falhas e integração com blacklist temporária (log único).
# - Garantir que cada transmissão seja registrada no log central no início e removida ao final (sucesso ou erro), evitando duplicidade/processamento concorrente (sessao="processing").
# - Registrar falhas (ffmpeg, duração insuficiente, poster inválido), escalando usuários para a blacklist temporária via log central ao atingir o limite de tentativas, AGORA USANDO O ID.
# - Assegurar limpeza robusta de arquivos temporários e rastreabilidade total via eventos no log único e mensagens detalhadas.
# - Modular, preparado para integração com pipelines CI/CD, paralelismo e auditoria centralizada.
# ================================================================

def get_video_duration(filepath):
    """
    Retorna a duração real do arquivo mp4, em segundos, utilizando ffprobe.
    Retorna None em caso de erro ou se o arquivo não existir.
    """
    try:
        if not os.path.exists(filepath):
            print(f"⚠️ Arquivo para ffprobe não encontrado: {filepath}")
            return None
        cmd = [
            "ffprobe", "-v", "error",
            "-show_entries", "format=duration",
            "-of", "json",
            filepath
        ]
        result = subprocess.run(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE, text=True)
        info = json.loads(result.stdout)
        duration = float(info["format"]["duration"])
        return int(round(duration))
    except Exception as e:
        print(f"⚠️ Não foi possível obter duração via ffprobe para {filepath}: {e}")
        return None

# Adicionando user_id como parâmetro
def gravar_stream(user_id, username, m3u8_url, poster_url=None, poster_frame_time=7):
    """
    Grava a transmissão ao vivo do usuário (pelo ID) usando ffmpeg, com controle de erros, log centralizado e integração à blacklist.
    - Registra no log centralizado (sessao="processing") no início (status="in_progress"), USANDO O ID.
    - Remove do log ao finalizar, independentemente do resultado, USANDO O ID.
    - Em caso de falha do ffmpeg ou gravação muito curta, registra falha do usuário no log (sessao="failure"), USANDO O ID.
    - Ao atingir N falhas consecutivas, usuário entra na blacklist (funções de log centralizado), USANDO O ID.
    - Limpa arquivos temporários ao final.
    - Garante poster válido: baixa da poster_url ou gera automaticamente com ffmpeg.
    - poster_frame_time: segundo do vídeo onde a captura do poster será feita, se necessário.
    """
    # --- Registro no log centralizado: PROCESSAMENTO INICIADO (USANDO ID) ---
    # As funções mark_processing, unmark_processing, register_failure, clear_failure
    # na Célula 6 já foram ajustadas para aceitar e usar user_id.
    mark_processing(user_id, username) # Passa user_id e username

    start_time_dt = datetime.now()
    data_str = start_time_dt.strftime("%d-%m-%Y")
    horario_str = start_time_dt.strftime("%H-%M")
    temp_filename = f"{username}_{start_time_dt.strftime('%Y%m%d_%H%M%S')}_temp.mp4"
    filepath = os.path.join(TEMP_OUTPUT_FOLDER, temp_filename)
    append_log({
        "sessao": "processing",
        "evento": "iniciar_gravacao",
        "id": user_id, # Usa o ID
        "username": username,
        "status": "in_progress",
        "detalhes": f"Gravação iniciada para '{username}' (ID: {user_id}) em {filepath}" # Adiciona ID nos detalhes
    })

    print(f"\n🎬 Iniciando gravação de: '{username}' (ID: {user_id}) | URL: {m3u8_url}) em {filepath}") # Adiciona ID no print

    # --- Garante poster válido ---
    # As funções de poster (download_and_save_poster, generate_poster_with_ffmpeg)
    # não precisam do ID para funcionar, apenas o username para o nome do arquivo temporário.
    poster_temp_path = None
    if poster_url:
        poster_temp_path = download_and_save_poster(poster_url, username, TEMP_OUTPUT_FOLDER)
    # generate_poster_with_ffmpeg já foi ajustada na Célula 3 para usar a tupla de tries correta
    if not is_poster_valid(poster_temp_path) and m3u8_url:
        poster_temp_path = generate_poster_with_ffmpeg(m3u8_url, username, TEMP_OUTPUT_FOLDER, frame_time=poster_frame_time)


    ffmpeg_cmd = [
        "ffmpeg", "-i", m3u8_url,
        "-t", str(RECORD_SECONDS),
        "-c", "copy", "-y", filepath
    ]

    start_time_process = time.time()
    process = None

    try:
        process = subprocess.Popen(
            ffmpeg_cmd,
            stdout=subprocess.PIPE,
            stderr=subprocess.STDOUT,
            text=True,
            bufsize=1,
            universal_newlines=True
        )

        # --- Monitoramento de progresso do ffmpeg (logs em tempo real) ---
        # log_progress usa apenas username
        elapsed_seconds = 0
        last_log_minute = -1
        while True:
            line = process.stdout.readline()
            if not line and process.poll() is not None:
                break
            if "time=" in line:
                try:
                    match = re.search(r"time=(\d+):(\d+):(\d+)", line)
                    if match:
                        h, m, s = map(int, match.groups())
                        elapsed_seconds = h * 3600 + m * 60 + s
                        if elapsed_seconds // 60 != last_log_minute:
                            log_progress(username, elapsed_seconds, RECORD_SECONDS)
                            last_log_minute = elapsed_seconds // 60
                except Exception:
                    pass

        process.wait()
        end_time_process = time.time()
        elapsed_seconds_proc = round(end_time_process - start_time_process)
        log_progress(username, elapsed_seconds_proc, RECORD_SECONDS)

        # --- Se FFmpeg falhou, registra no log central e retorna erro (USANDO ID) ---
        if process.returncode != 0:
            msg = f"FFmpeg falhou para '{username}' (ID: {user_id}). Código de saída: {process.returncode}" # Adiciona ID na mensagem
            print(f"❌ {msg}")
            append_log({
                "sessao": "processing",
                "evento": "erro_ffmpeg",
                "id": user_id, # Usa o ID
                "username": username,
                "status": "erro",
                "detalhes": msg
            })
            register_failure(user_id, username, "Erro FFmpeg") # Passa user_id e username
            return {
                'user_id': user_id, # Inclui user_id no resultado
                'username': username,
                'filename': temp_filename,
                'filepath': filepath,
                'upload_success': False,
                'abyss_response': msg
            }

        # --- Validação pelo tempo real do arquivo gravado (robusta) ---
        elapsed_seconds_real = get_video_duration(filepath)
        if elapsed_seconds_real is not None:
            print(f"✅ Duração real do arquivo gravado: {elapsed_seconds_real}s (ffprobe)")
        else:
            print(f"⚠️ Não foi possível aferir duração real, usando a do processo: {elapsed_seconds_proc}s")
            elapsed_seconds_real = elapsed_seconds_proc

        if elapsed_seconds_real < RECORD_SECONDS_MIN:
            msg = f"Gravação muito curta para '{username}' (ID: {user_id}). Duração gravada ({elapsed_seconds_real}s) menor que o mínimo ({RECORD_SECONDS_MIN}s). Arquivo descartado." # Adiciona ID
            print(f"⏩ {msg}")
            append_log({
                "sessao": "processing",
                "evento": "erro_duracao",
                "id": user_id, # Usa o ID
                "username": username,
                "status": "erro",
                "detalhes": msg
            })
            register_failure(user_id, username, "Gravação muito curta") # Passa user_id e username
            if os.path.exists(filepath): os.remove(filepath)
            if poster_temp_path and os.path.exists(poster_temp_path): os.remove(poster_temp_path)
            return {
                'user_id': user_id, # Inclui user_id no resultado
                'username': username,
                'filename': temp_filename,
                'filepath': filepath,
                'upload_success': False,
                'abyss_response': "Gravação muito curta (descartada)"
            }

        # --- Sucesso: limpa falhas acumuladas do usuário no log central (USANDO ID) ---
        clear_failure(user_id) # Passa user_id
        tempo_formatado = format_seconds(elapsed_seconds_real)
        final_filename = f"{username}_{data_str}_{horario_str}_{tempo_formatado}.mp4"
        final_filepath = os.path.join(TEMP_OUTPUT_FOLDER, final_filename)

        try:
            os.rename(filepath, final_filepath)
            print(f"✅ Arquivo renomeado para: {final_filename}")
            filepath_for_upload = final_filepath
            filename_for_upload = final_filename
        except Exception as e:
            print(f"❌ Erro ao renomear arquivo {temp_filename} para {final_filename}: {e}")
            filepath_for_upload = filepath
            filename_for_upload = temp_filename

        # --- Realiza upload e atualização do banco de dados (json) ---
        # upload_to_abyss_and_update_json (Célula 8) precisará receber o user_id
        success, abyss_resp, slug = upload_to_abyss_and_update_json(
            filepath_for_upload, user_id, username, elapsed_seconds_real, # Passa user_id e username
            poster_temp_path=poster_temp_path
        )

        # --- Loga sucesso de gravação no log central (USANDO ID) ---
        append_log({
            "sessao": "processing",
            "evento": "sucesso_gravacao",
            "id": user_id, # Usa o ID
            "username": username,
            "status": "ok",
            "detalhes": f"Arquivo {filename_for_upload} gravado e enviado com sucesso para '{username}' (ID: {user_id}). Duração: {elapsed_seconds_real}s" # Adiciona ID
        })

        return {
            'user_id': user_id, # Inclui user_id no resultado
            'username': username,
            'filename': filename_for_upload,
            'filepath': filepath_for_upload,
            'upload_success': success,
            'abyss_response': abyss_resp,
            'slug': slug
        }

    except FileNotFoundError:
        msg = "Comando 'ffmpeg' não encontrado. Certifique-se de que foi instalado corretamente."
        print(f"❌ {msg}")
        # Registrar falha de ffmpeg não encontrado (USANDO ID)
        if 'register_failure' in globals(): # Verifica se a função existe
             register_failure(user_id, username, msg) # Passa user_id e username
        append_log({
            "sessao": "processing",
            "evento": "erro_ffmpeg_nao_encontrado",
            "id": user_id, # Usa o ID
            "username": username,
            "status": "erro",
            "detalhes": msg
        })
        return {
            'user_id': user_id, # Inclui user_id no resultado
            'username': username,
            'filename': None,
            'filepath': None,
            'upload_success': False,
            'abyss_response': msg
        }
    except Exception as e:
        msg = f"Erro inesperado durante a execução do FFmpeg para '{username}' (ID: {user_id}): {e}" # Adiciona ID
        print(f"❌ {msg}")
        # Registrar falha de execução de ffmpeg (USANDO ID)
        if 'register_failure' in globals(): # Verifica se a função existe
             register_failure(user_id, username, msg) # Passa user_id e username
        append_log({
            "sessao": "processing",
            "evento": "erro_execucao_ffmpeg",
            "id": user_id, # Usa o ID
            "username": username,
            "status": "erro",
            "detalhes": msg
        })
        return {
            'user_id': user_id, # Inclui user_id no resultado
            'username': username,
            'filename': None,
            'filepath': None,
            'upload_success': False,
            'abyss_response': msg
        }
    finally:
        # --- Remove marcação de processamento ativo no log central (USANDO ID) ---
        unmark_processing(user_id) # Passa user_id

        # --- Limpeza do arquivo de vídeo pós-upload ---
        if 'filepath_for_upload' in locals() and os.path.exists(filepath_for_upload):
            try:
                os.remove(filepath_for_upload)
                print(f"🗑️ Arquivo de vídeo temporário local removido do Colab: {filepath_for_upload}")
                # Log de limpeza
                if 'append_log' in globals():
                     append_log({
                         "sessao": "cleanup",
                         "evento": "remover_video_temp",
                         "id": user_id, # Usa o ID
                         "username": username,
                         "status": "ok",
                         "detalhes": f"Arquivo de vídeo temporário local removido: {filepath_for_upload}"
                     })
            except Exception as e:
                print(f"⚠️ Não foi possível remover o arquivo de vídeo temporário local: {e}")
                # Log de erro de limpeza
                if 'append_log' in globals():
                     append_log({
                         "sessao": "cleanup",
                         "evento": "erro_remover_video_temp",
                         "id": user_id, # Usa o ID
                         "username": username,
                         "status": "erro",
                         "detalhes": f"Erro ao remover arquivo de vídeo temporário local: {e}"
                     })


        # --- Limpeza do poster temporário ---
        # poster_temp_path é o caminho ANTES da renomeação com slug
        if poster_temp_path and os.path.exists(poster_temp_path):
            try:
                os.remove(poster_temp_path)
                # print(f"🗑️ Poster temporário original removido: {poster_temp_path}") # Já logado na Célula 8 se movido
            except Exception as e:
                # print(f"⚠️ Não foi possível remover o poster temporário original: {e}") # Já logado na Célula 8 se movido
                pass # A Célula 8 lida com a limpeza do poster renomeado/movido


# ================================================================
# Fim da Célula 7 — Gravação, Log Centralizado e Blacklist Inteligente (AGORA USANDO ID)
# ================================================================

# Observações e recomendações:
# - Toda manipulação de status, falha, blacklist e processamento é feita via funções do log centralizado (Célula 1 e 6), AGORA USANDO O ID.
# - Mensagens claras e detalhadas e logging estruturado garantem rastreabilidade, CI/CD e manutenção.
# - Pronto para execução concorrente, pipelines e auditoria centralizada no XCam.

# Célula 8: Upload para Abyss.to, Atualização do rec.json, Commit Poster, Sincronização com Google Drive — Log Centralizado

**Objetivo:**  
Realizar upload do vídeo gravado para Abyss.to, registrar e atualizar todos os metadados relevantes no arquivo `rec.json` do usuário, garantir a movimentação/renomeação adequada do poster e executar o commit/push automatizado de arquivos alterados, sincronizando também com o Google Drive e **registrando todas as ações relevantes no log centralizado (`xcam_master.log`)**.  
O processo é otimizado para processamento em lote: os arquivos modificados só são enviados quando o número atingir o limiar (`COMMIT_PUSH_THRESHOLD`), promovendo eficiência, rastreabilidade e integridade do repositório, mesmo em execução paralela.

---

## Estratégia e melhorias implementadas

- **Commit/push em lote otimizado e rastreável:**  
  Arquivos alterados são acumulados em um buffer protegido por lock. O commit e push são executados automaticamente quando a quantidade de arquivos atinge o threshold configurado, reduzindo conflitos e otimizando o workflow CI/CD. Todas as ações de commit são registradas no log central para auditoria.
- **Sincronização automática com o Google Drive:**  
  Sempre que `rec.json` ou poster são atualizados, uma cópia é feita para o diretório correspondente do usuário no Google Drive (se disponível), garantindo redundância, persistência e fácil acesso externo aos metadados e imagens. Falhas na sincronização também são logadas.
- **Atomicidade, concorrência e log centralizado:**  
  O acesso ao buffer de commit é protegido por lock (`threading.Lock`), assegurando integridade mesmo em processamento paralelo ou múltiplos workers. Cada etapa crítica (upload, poster, commit, rec.json) é registrada via `append_log` para rastreabilidade total.
- **Poster sempre correto e rastreável:**  
  O poster utilizado é sempre movido/renomeado para o local definitivo e associado ao vídeo pelo nome (`slug`). O caminho é sincronizado tanto no repositório quanto no Drive, e o evento é registrado no log.
- **Atualização robusta do rec.json:**  
  O histórico do usuário é preenchido com todos os campos, incluindo poster, urlIframe, data, horário e tempo formatado. O padrão da estrutura JSON é rigorosamente seguido, facilitando a integração, análise e exportação dos dados. Atualizações e falhas são sempre logadas.
- **Limpeza automática de arquivos temporários:**  
  Após mover, copiar e commitar os arquivos, os temporários são removidos, mantendo o ambiente Colab limpo e eficiente, com logs de sucesso ou falha de limpeza.

---

## Como funciona o fluxo principal

1. **Faz upload do vídeo para Abyss.to** e recebe a confirmação (slug, url, urlIframe). Evento de sucesso ou falha registrado no log.
2. **Move/renomeia o poster** para o local definitivo no repositório, associando ao vídeo pelo slug. Evento registrado no log.
3. **Atualiza ou cria `rec.json`** do usuário, preenchendo todos os metadados da gravação. Evento registrado no log.
4. **Adiciona arquivos alterados ao buffer de commit** (com lock para evitar concorrência) e registra ação no log.
5. **Sincroniza** `rec.json` e poster no Google Drive, mantendo redundância e facilidade de acesso. Falhas de sync são logadas.
6. **Executa commit/push automático em lote** ao atingir o limiar definido; ao final do processamento faz o commit/push dos arquivos restantes, sempre registrando eventos no log central.
7. **Limpa arquivos temporários** garantindo eficiência, organização do ambiente e registro de sucesso/falha no log.

---

## Exemplo de uso recomendado

```python
# Após concluir o upload e gerar poster:
upload_success, abyss_response, slug = upload_to_abyss_and_update_json(
    filepath=arquivo_video,
    username="usuario",
    duration_seconds=duracao,
    poster_temp_path=caminho_poster_temp
)

# Ao final do processamento, para garantir commit dos arquivos restantes:
commit_push_restantes()
```

---

## Segurança, rastreabilidade e integração

- **Processo compatível com execução concorrente** e pipelines CI/CD.
- **Commit/push protegido contra condições de corrida**, garantindo atomicidade dos dados no repositório.
- **Sincronização Drive robusta**, ideal para ambientes colaborativos ou para garantir backup.
- **Toda ação relevante registrada no log centralizado**: upload, poster, commit, rec.json, limpeza e falhas.
- **Mensagens e logs claros** facilitam manutenção, auditoria e diagnóstico rápido em todo o pipeline XCam.

---

In [None]:
# ================================================================
# Célula 8: Upload para Abyss.to, Atualização do rec.json e Poster no Google Drive
# ================================================================
# Objetivo:
# - Fazer upload do vídeo gravado para Abyss.to e registrar corretamente os metadados.
# - Salvar gravação e poster temporariamente no Colab.
# - Renomear poster temporário com slug (no Colab temp).
# - LER/ESCREVER rec.json DIRETAMENTE no Google Drive.
# - MOVER poster renomeado do Colab temp para o Google Drive.
# - Limpar arquivos temporários locais após uso.
# - Modular, preparado para CI/CD, concorrência e integração total ao pipeline XCam.
# ================================================================

# Caminho base no Google Drive para arquivos permanentes (rec.json, posters)
DRIVE_USER_BASE = "/content/drive/MyDrive/XCam.Drive/user"

def upload_to_abyss_and_update_json(
    filepath, username, duration_seconds, poster_temp_path=None
):
    """
    Realiza upload do vídeo, atualiza rec.json do usuário (no Drive),
    renomeia poster com slug (no Colab temp) e MOVE para o Google Drive.
    - Salva gravação e poster temporariamente no Colab.
    - LÊ/ESCREVE rec.json DIRETAMENTE no Drive.
    - Renomeia poster temporário no Colab temp com o slug retornado.
    - MOVE poster renomeado do Colab temp para o Drive.
    - Limpa arquivos temporários locais após uso.
    - Toda ação relevante é registrada no log centralizado via append_log().
    """
    file_name = os.path.basename(filepath) # Nome do arquivo de vídeo renomeado (username_data_horario_tempo.mp4)
    file_type = 'video/mp4'
    print(f"⬆️ Upload de: {file_name} para Abyss.to...")

    upload_success = False
    abyss_response = "Upload falhou - Sem resposta"
    uploaded_url = None
    video_id = None
    slug = None

    # ---- Upload do vídeo para Abyss.to ----
    try:
        with open(filepath, 'rb') as f:
            files = { 'file': (file_name, f, file_type) }
            response = requests.post(ABYSS_UPLOAD_URL, files=files)
            resp_json = response.json()
            abyss_response = resp_json
            if resp_json.get('status'):
                upload_success = True
                uploaded_url = resp_json.get('url') or resp_json.get('urlIframe')
                video_id = resp_json.get('slug') or resp_json.get('video')
                slug = video_id
                print(f"📤 Upload bem-sucedido. URL: {uploaded_url} | SLUG: {slug}")
                append_log({
                    "sessao": "upload",
                    "evento": "upload_sucesso",
                    "id": username,
                    "username": username,
                    "status": "ok",
                    "detalhes": f"Arquivo {file_name} enviado para Abyss.to. URL: {uploaded_url}, SLUG: {slug}"
                })
            else:
                print(f"❌ Falha no upload. Mensagem: {resp_json.get('message','')}")
                append_log({
                    "sessao": "upload",
                    "evento": "upload_falhou",
                    "id": username,
                    "username": username,
                    "status": "erro",
                    "detalhes": f"Falha no upload. Mensagem: {resp_json.get('message','')}"
                })
    except Exception as e:
        abyss_response = f"Erro no upload: {e}"
        print(f"❌ Erro no upload: {e}")
        append_log({
            "sessao": "upload",
            "evento": "upload_falhou",
            "id": username,
            "username": username,
            "status": "erro",
            "detalhes": f"Exceção no upload: {e}"
        })

    poster_temp_renamed_path = None
    drive_json_filepath = os.path.join(DRIVE_USER_BASE, username, "rec.json")
    drive_user_dir = os.path.join(DRIVE_USER_BASE, username) # Pasta do usuário no Drive

    if upload_success and slug:
        # ---- Renomeia o poster temporário com o slug retornado (no diretório temporário do Colab) ----
        # O poster_temp_path já está em TEMP_OUTPUT_FOLDER (gerado/baixado pela Célula 7)
        if poster_temp_path and os.path.exists(poster_temp_path):
            try:
                # O novo nome será {slug}.jpg
                poster_final_name = f"{slug}.jpg"
                # A renomeação ocorre dentro do diretório TEMPORÁRIO do Colab
                poster_temp_renamed_path = os.path.join(TEMP_OUTPUT_FOLDER, poster_final_name)
                # Move (renomeia) o poster DENTRO do diretório temporário
                shutil.move(poster_temp_path, poster_temp_renamed_path)
                print(f"🖼️ Poster temporário renomeado para {poster_final_name} em {TEMP_OUTPUT_FOLDER}")
                append_log({
                    "sessao": "poster",
                    "evento": "poster_renomeado_temp",
                    "id": username,
                    "username": username,
                    "status": "ok",
                    "detalhes": f"Poster temporário renomeado para {poster_final_name} no Colab temp."
                })
            except Exception as e:
                print(f"❌ Erro ao renomear poster temporário no Colab: {e}")
                # Tenta limpar o poster temporário original se o renomeio falhar
                if os.path.exists(poster_temp_path):
                    try:
                        os.remove(poster_temp_path)
                    except Exception as clean_e:
                        print(f"⚠️ Falha ao limpar poster temporário original após erro: {clean_e}")
                poster_temp_renamed_path = None # Garante que não tentaremos mover um arquivo que não existe
                append_log({
                    "sessao": "poster",
                    "evento": "erro_renomear_poster_temp",
                    "id": username,
                    "username": username,
                    "status": "erro",
                    "detalhes": f"Erro ao renomear poster temporário no Colab: {e}"
                })
        else:
             print(f"⚠️ Poster temporário não encontrado ou inválido para renomear com slug.")
             append_log({
                "sessao": "poster",
                "evento": "poster_temp_nao_encontrado",
                "id": username,
                "username": username,
                "status": "aviso",
                "detalhes": "Poster temporário não encontrado ou inválido para renomear com slug."
            })


        # ---- Atualiza/Cria rec.json do usuário (DIRETAMENTE no Google Drive) ----
        try:
            # Caminho no Drive onde o rec.json deve estar/ser salvo
            os.makedirs(drive_user_dir, exist_ok=True) # Garante que a pasta do usuário no Drive exista

            file_base = file_name.replace('.mp4', '')
            parts = file_base.split('_')
            if len(parts) >= 4:
                json_data = parts[-3]
                json_horario = parts[-2]
                json_tempo = parts[-1]
            else:
                now = datetime.now()
                json_data = now.strftime("%d-%m-%Y")
                json_horario = now.strftime("%H-%M")
                json_tempo = format_seconds(duration_seconds)

            # A URL do poster no rec.json aponta para onde ele estará PUBLICAMENTE disponível
            # (presumindo que o conteúdo do Drive será servido ou sincronizado externamente)
            poster_url_final = f"https://db.xcam.gay/user/{username}/{slug}.jpg" if slug else ""
            url_iframe_final = f"https://short.icu/{slug}?thumbnail={poster_url_final}" if slug else ""

            new_video_entry = {
                "video": slug if slug else "ID_não_retornado",
                "title": file_base,
                "file": file_name, # O nome do arquivo de vídeo original é mantido como referência
                "url": uploaded_url if uploaded_url else "URL_não_retornada",
                "poster": poster_url_final, # Esta URL deve ser acessível publicamente
                "urlIframe": url_iframe_final, # Esta URL deve ser acessível publicamente
                "data": json_data,
                "horario": json_horario,
                "tempo": json_tempo
            }

            def zerar_base(username):
                return {
                    "username": username,
                    "records": 0,
                    "videos": []
                }

            # Carrega ou inicializa rec.json (DIRETAMENTE do Drive)
            rec_data = zerar_base(username) # Inicializa com base zero por segurança
            if os.path.exists(drive_json_filepath):
                 try:
                     with open(drive_json_filepath, 'r', encoding='utf-8') as f:
                         loaded = json.load(f)
                     # Valida se a estrutura carregada é razoável, senão cria uma nova
                     valid = (
                         isinstance(loaded, dict)
                         and "username" in loaded
                         and "records" in loaded
                         and "videos" in loaded
                         and isinstance(loaded["videos"], list)
                     )
                     rec_data = loaded if valid else zerar_base(username)
                     print(f"📝 Carregado rec.json existente do Drive para {username}")
                 except Exception as read_drive_e:
                      print(f"⚠️ Erro ao ler rec.json existente no Drive ({drive_json_filepath}), criando novo: {read_drive_e}")
                      # Se der erro na leitura, rec_data já está zerada

            # Adiciona novo vídeo ao histórico (no objeto carregado/novo)
            rec_data["records"] += 1
            rec_data["videos"].append(new_video_entry)

            # Salva rec.json (DIRETAMENTE no Drive)
            with open(drive_json_filepath, 'w', encoding='utf-8') as f:
                json.dump(rec_data, f, indent=2, ensure_ascii=False)
            print(f"✅ rec.json para {username} atualizado DIRETAMENTE no Drive: {drive_json_filepath}")

            append_log({
                "sessao": "recjson",
                "evento": "recjson_atualizado_drive",
                "id": username,
                "username": username,
                "status": "ok",
                "detalhes": f"rec.json atualizado diretamente no Drive em {drive_json_filepath}"
            })

        except Exception as e:
            print(f"❌ Erro ao atualizar rec.json no Drive: {e}")
            abyss_response = f"Upload sucesso, erro no JSON do Drive: {e}"
            # json_temp_path = None # Não existe mais json_temp_path neste fluxo
            append_log({
                "sessao": "recjson",
                "evento": "erro_atualizar_recjson_drive",
                "id": username,
                "username": username,
                "status": "erro",
                "detalhes": f"Erro ao atualizar rec.json no Drive: {e}"
            })


        # ---- MOVER poster renomeado (do Colab temp) para o Google Drive ----
        if poster_temp_renamed_path and os.path.exists(poster_temp_renamed_path):
            # O destino é a pasta do usuário no Drive
            drive_poster_filepath = os.path.join(drive_user_dir, os.path.basename(poster_temp_renamed_path))
            try:
                shutil.move(poster_temp_renamed_path, drive_poster_filepath)
                print(f"🗂️ Poster movido para o Drive: {drive_poster_filepath}")
                append_log({
                    "sessao": "poster",
                    "evento": "poster_movido_drive",
                    "id": username,
                    "username": username,
                    "status": "ok",
                    "detalhes": f"Poster movido para o Drive em {drive_poster_filepath}"
                })
            except Exception as e:
                print(f"❌ Falha ao MOVER poster para o Drive: {e}")
                append_log({
                    "sessao": "poster",
                    "evento": "erro_mover_poster_drive",
                    "id": username,
                    "username": username,
                    "status": "erro",
                    "detalhes": f"Erro ao mover poster para o Drive: {e}"
                })
        else:
             print(f"⚠️ Poster temporário renomeado não encontrado para mover para o Drive.")
             append_log({
                "sessao": "poster",
                "evento": "poster_temp_renomeado_nao_encontrado",
                "id": username,
                "username": username,
                "status": "aviso",
                "detalhes": "Poster temporário renomeado não encontrado para mover para o Drive."
            })


    # ---- Limpeza do arquivo de vídeo temporário local ----
    # Esta limpeza já estava presente no bloco finally da gravar_stream (Célula 7),
    # mas vamos garantir aqui também por segurança, caso a chamada venha de outro lugar.
    # O arquivo de vídeo renomeado está em TEMP_OUTPUT_FOLDER
    if os.path.exists(filepath): # filepath é o caminho do vídeo renomeado em TEMP_OUTPUT_FOLDER
        try:
            os.remove(filepath)
            print(f"🗑️ Arquivo de vídeo temporário local removido: {filepath}")
            append_log({
                "sessao": "cleanup",
                "evento": "remover_video_temp",
                "id": username,
                "username": username,
                "status": "ok",
                "detalhes": f"Arquivo de vídeo temporário local removido: {filepath}"
            })
        except Exception as e:
            print(f"⚠️ Não foi possível remover o arquivo de vídeo temporário local: {e}")
            append_log({
                "sessao": "cleanup",
                "evento": "erro_remover_video_temp",
                "id": username,
                "username": username,
                "status": "erro",
                "detalhes": f"Erro ao remover arquivo de vídeo temporário local: {e}"
            })

    # ---- Limpeza do diretório temporário do usuário, se estiver vazio ----
    # O diretório temporário do usuário pode não ter sido criado se o upload falhou antes.
    # TEMP_OUTPUT_FOLDER é o diretório geral. Não vamos remover subdiretórios específicos aqui.
    # A limpeza do diretório temp do usuário pode ser feita de forma mais robusta em outro local ou manualmente.
    # Manteremos a limpeza apenas dos arquivos específicos manipulados.

    return upload_success, abyss_response, slug

# A função de commit final pendente não é mais necessária, pois o commit é gerenciado externamente.
# def commit_push_restantes():
#     """
#     Esta função não é mais necessária pois o commit/push é gerenciado externamente.
#     """
#     pass # Lógica de commit/push removida

# ================================================================
# FIM DA Célula 8 — Upload, Metadados e Posters no Google Drive (com log centralizado)
# ================================================================

# Observações:
# - A gravação e o poster inicial ficam no Colab temp.
# - O rec.json é lido e escrito DIRETAMENTE no Drive.
# - O poster renomeado é MOVIDO do Colab temp para o Drive.
# - Certifique-se de que o Google Drive esteja montado antes de executar esta célula.
# - A URL do poster no rec.json (db.xcam.gay) presume que o conteúdo do Drive será servido publicamente de alguma forma.
# - O commit/push agora é gerenciado por um script externo que deve ler os arquivos do Drive.
# - Toda ação relevante registrada no log centralizado para total rastreabilidade/auditoria.

# Célula 9: Processamento Automático, Paralelismo e Supervisor Dinâmico com Blacklist

**Objetivo:**  
Controlar e orquestrar todo o pipeline do notebook, garantindo processamento contínuo, paralelo, eficiente e seguro de transmissões ao vivo. O supervisor dinâmico mantém o lote sempre cheio, respeita a blacklist temporária e o log central, e integra todas as funções críticas das células anteriores, garantindo máxima resiliência e rastreabilidade.

---

## Estratégia e melhorias implementadas

- **Paralelismo seguro e eficiente:**  
  Utiliza múltiplos processos para gravar e processar transmissões simultaneamente, otimizando o uso de recursos e acelerando o processamento em lote.
- **Supervisor dinâmico e lote sempre cheio:**  
  O supervisor monitora constantemente as vagas livres no lote e preenche em tempo real com novas transmissões válidas, evitando ociosidade e maximizando a eficiência.
- **Controle centralizado de duplicidade:**  
  Antes de processar qualquer transmissão, consulta o log central de processamento para evitar duplicidade, mesmo em ambientes concorrentes ou paralelos.
- **Respeito integral à blacklist temporária:**  
  Transmissões de usuários em blacklist não são tentadas novamente durante o ciclo vigente, economizando recursos e evitando loops problemáticos.
- **Logs robustos e detalhados:**  
  Cada etapa do processamento é registrada com timestamp, status e contexto, facilitando auditoria, troubleshooting e acompanhamento em produção.
- **Commit/push automático e seguro:**  
  Ao final do ciclo (ou quando atingido o threshold), todos os arquivos alterados são enviados ao repositório, garantindo consistência e persistência dos dados.
- **Design modular e Clean Architecture:**  
  Funções separadas para supervisão, workers, busca, commit, log, etc., facilitando manutenção, reuso e integração com CI/CD.

---

## Como funciona o fluxo principal

1. **Inicialização:**  
   - Determina o modo de operação: gravação de usuários específicos ou busca automática.
   - Calcula o tamanho do lote alvo (`LIMIT_DEFAULT` ou `API_SEARCH_LIMIT`).

2. **Preenchimento do lote:**  
   - Busca transmissões válidas (não duplicadas, não em blacklist) e lança workers para cada uma, registrando no log de processamento.
   - Utiliza funções otimizadas de busca (`buscar_proxima_transmissao_livre` e `buscar_usuarios_especificos`), integradas à blacklist e ao log.

3. **Supervisão dinâmica:**  
   - Monitora o ciclo de vida dos workers/processos.
   - Preenche imediatamente cada vaga livre com nova transmissão disponível, até esgotar as opções válidas.

4. **Respeito à blacklist:**  
   - Antes de qualquer gravação, verifica se o usuário está em blacklist temporária.
   - Usuários problemáticos nunca são tentados duas vezes no mesmo ciclo.

5. **Logs detalhados:**  
   - Todas as operações geram logs padronizados com nível (INFO, WORKER, BUSCA, ERRO, etc.) e timestamp.

6. **Finalização segura:**  
   - Ao final do processamento, executa commit/push dos arquivos pendentes, garantindo persistência e integridade do repositório.

---

## Exemplo de uso recomendado

```python
# Função principal do notebook: dispara o supervisor dinâmico
main()
```

---

## Segurança, rastreabilidade e integração

- **Pronto para execução concorrente e ambientes CI/CD.**
- **A lógica de blacklist e commit está totalmente integrada ao fluxo, garantindo máxima resiliência.**
- **Logs detalhados e arquitetura modular facilitam diagnóstico, manutenção e evolução do pipeline XCam.**

---

In [None]:
# @title
# ================================================================
# Célula 9: Supervisor Dinâmico — Execução Paralela, Lote Sempre Cheio, Blacklist e Log Centralizado (AGORA USANDO ID)
# ================================================================
# Objetivo:
# - Manter o lote de gravações sempre cheio, preenchendo vagas em tempo real com máxima eficiência e segurança.
# - Garantir que usuários problemáticos (em blacklist - por ID) não sejam tentados novamente no ciclo vigente.
# - Prevenir duplicidade consultando log central de processamento (por ID) antes de iniciar qualquer gravação.
# - Integrar-se com a lógica de blacklist, commit/push automático, limpeza de recursos e log robusto, TUDO BASEADO NO ID.
# - Modularidade e clareza, pronta para integração com pipelines CI/CD, execução concorrente e ambientes colaborativos.
# ================================================================

from multiprocessing import Process, Manager # Garantir imports

def log_supervisor(msg, level="INFO"):
    """
    Log supervisor padronizado para todas as etapas do pipeline.
    Também registra cada evento relevante no log centralizado (sessao supervisor).
    Pode incluir ID/username se relevante para o evento.
    """
    from datetime import datetime
    timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    print(f"[{timestamp}] [{level}] {msg}")
    # Registro também no log central (sessao supervisor)
    append_log({
        "sessao": "supervisor",
        "evento": level,
        "id": "global", # Evento global do supervisor
        "username": "global",
        "status": "info" if level != "ERRO" else "erro",
        "detalhes": msg
    })

# Adicionando user_id como parâmetro para o worker
def worker(user_id, username, m3u8_url, poster_path, results):
    """
    Worker dedicado: grava a stream, faz upload, atualiza rec.json/poster, integra ao log.
    Recebe o ID do usuário e o passa para a função gravar_stream (Célula 7).
    O processamento é rastreado via log central, e o status final é adicionado à lista de resultados.
    """
    # gravar_stream agora espera user_id como primeiro parâmetro
    log_supervisor(f"Iniciando gravação: '{username}' (ID: {user_id}) | URL: {m3u8_url[:50]}...", "WORKER") # Loga o ID
    result = gravar_stream(user_id, username, m3u8_url, poster_url=poster_path) # Passa user_id para gravar_stream
    log_supervisor(
        f"Finalizou gravação: '{username}' (ID: {user_id}) | Sucesso: {result.get('upload_success')} | " # Loga o ID
        f"Arquivo: {result.get('filename')} | Abyss: {result.get('abyss_response')}", "WORKER")
    results.append(result)
    # Registro do resultado no log central (já feito dentro de gravar_stream, mas reforça aqui)
    # append_log({
    #     "sessao": "supervisor",
    #     "evento": "worker_result",
    #     "id": user_id, # Usa o ID aqui
    #     "username": username,
    #     "status": "ok" if result.get("upload_success") else "erro",
    #     "detalhes": str(result)
    # })


# Supervisor dinâmico, agora usando ID para controle de estado
def supervisor_dinamico(usuarios_especificos=None):
    """
    Supervisor dinâmico de transmissões ao vivo:
    - Mantém o lote de gravações sempre cheio, preenchendo vagas em tempo real.
    - Evita duplicidade e concorrência consultando log central (sessao="processing", status="in_progress"), AGORA PELO ID.
    - Respeita blacklist centralizada (pelo ID), não processando usuários bloqueados no ciclo vigente.
    - Log detalhado e modular para diagnóstico, CI/CD e rastreabilidade.
    """

    # Determina o tamanho do lote com base no modo operacional
    pool_size = LIMIT_DEFAULT if not usuarios_especificos else API_SEARCH_LIMIT
    running = []
    results = Manager().list()
    # Não precisamos mais do seen_usernames local, pois o log central é a fonte de verdade para o estado (is_processing, is_in_blacklist)
    # seen_usernames = set()

    log_supervisor(f"Supervisor dinâmico iniciado | Lote alvo: {pool_size} | Modo: {'específico' if usuarios_especificos else 'automático'}")

    # A função atualizar_seen_usernames local não é mais necessária,
    # pois is_processing e is_in_blacklist consultam o log central diretamente.
    # def atualizar_seen_usernames():
    #     """
    #     Atualiza o conjunto de usernames já processados diretamente do log central (sessao='processing').
    #     Garante robustez em ambientes concorrentes e previne duplicidade.
    #     """
    #     entries = query_logs(sessao="processing", status="in_progress")
    #     seen_usernames.update([e["username"] for e in entries])

    def buscar_nova_transmissao():
        """
        Busca uma nova transmissão livre para preencher o lote:
        - Modo específico: busca em lista fornecida (agora retorna ID).
        - Modo automático: busca próxima transmissão livre disponível (agora retorna ID).
        - Sempre consulta blacklist (pelo ID) e log central (pelo ID) antes de liberar.
        """
        # Não precisamos mais chamar atualizar_seen_usernames() aqui.
        # A lógica dentro de is_in_blacklist e is_processing consulta o log central diretamente.

        if usuarios_especificos:
            # buscar_usuarios_especificos agora retorna lista com ID
            candidatos = buscar_usuarios_especificos(usuarios_especificos)
            for s in candidatos:
                user_id = s["id"] # Captura o ID retornado pela função de busca
                username = s["username"]
                # Verifica se o ID está em blacklist ou processando (AGORA CONSULTANDO PELO ID)
                if not is_in_blacklist(user_id) and not is_processing(user_id):
                    log_supervisor(f"Nova transmissão encontrada (específico): '{username}' (ID: {user_id})", "BUSCA") # Loga o ID
                    return s # Retorna o dicionário com id, username, src, poster_path
                else:
                    # Loga que o ID está sendo ignorado
                    status_detail = ""
                    if is_in_blacklist(user_id): status_detail += "blacklist "
                    if is_processing(user_id): status_detail += "processing "
                    log_supervisor(f"Usuário '{username}' (ID: {user_id}) já em {status_detail.strip()}, ignorando.", "BUSCA")
            log_supervisor("Nenhuma transmissão específica livre encontrada (todos em blacklist/log ou offline).", "BUSCA")
            return None
        else:
            # Busca otimizada: tenta até 10 vezes buscar próxima transmissão livre
            for tentativa in range(1, 11):
                log_supervisor(f"Buscando próxima transmissão livre: tentativa {tentativa}", "BUSCA")
                # buscar_proxima_transmissao_livre agora retorna dicionário com ID
                stream = buscar_proxima_transmissao_livre()
                if stream:
                    user_id = stream["id"] # Captura o ID retornado pela função de busca
                    username = stream["username"]
                    # Verifica se o ID está em blacklist ou processando (AGORA CONSULTANDO PELO ID)
                    if not is_in_blacklist(user_id) and not is_processing(user_id):
                        log_supervisor(f"Nova transmissão encontrada: '{username}' (ID: {user_id})", "BUSCA") # Loga o ID
                        return stream # Retorna o dicionário com id, username, src, poster_path
                    else:
                        # Loga que o ID está sendo ignorado
                        status_detail = ""
                        if is_in_blacklist(user_id): status_detail += "blacklist "
                        if is_processing(user_id): status_detail += "processing "
                        log_supervisor(f"Usuário '{username}' (ID: {user_id}) já em {status_detail.strip()}, ignorando.", "BUSCA")
                else:
                    log_supervisor(f"buscar_proxima_transmissao_livre retornou None na tentativa {tentativa}.", "BUSCA")

            log_supervisor("Nenhuma transmissão livre encontrada após tentativas (todos em blacklist/log ou offline).", "BUSCA")
            return None

    # ========== Fase 1: Preenchimento do lote inicial ==========
    log_supervisor(f"Preenchendo lote inicial com até {pool_size} transmissões...", "STARTUP")
    tentativas = 0
    max_tentativas = 100 # Limita as tentativas totais para preencher o lote inicial
    while len(running) < pool_size and tentativas < max_tentativas:
        stream = buscar_nova_transmissao() # Retorna dicionário com id, username, src, poster_path
        if not stream:
            log_supervisor("Fim das transmissões disponíveis para preencher lote inicial.", "STARTUP")
            break # Sai do loop se não encontrar mais streams

        user_id = stream["id"] # Obtém o ID do dicionário retornado
        username = stream["username"]
        m3u8_url = stream["src"]
        poster_path = stream["poster_path"] # Caminho do poster temporário válido


        # Marca no log central como em processamento para evitar duplicidade (USANDO ID)
        mark_processing(user_id, username) # Passa user_id e username

        log_supervisor(f"Lançando processo para: '{username}' (ID: {user_id}) | {len(running)+1}/{pool_size}", "STARTUP") # Loga o ID
        # Passa o user_id para a função worker
        p = Process(target=worker, args=(user_id, username, m3u8_url, poster_path, results))
        running.append(p)
        p.start()
        tentativas += 1 # Incrementa tentativas

    log_supervisor(f"Lote inicial lançado com {len(running)} transmissões.", "STARTUP")


    # ========== Fase 2: Loop dinâmico de preenchimento contínuo ==========
    # Monitora processos ativos e busca novas streams para manter o lote cheio
    while True:
        # Atualiza a lista de processos ativos
        antes = len(running)
        running = [p for p in running if p.is_alive()]
        depois = len(running)

        # Se algum processo finalizou
        if antes != depois:
            log_supervisor(f"{antes-depois} gravações finalizaram. Vagas livres: {pool_size-len(running)}", "LOOP")

        vagas_livres = pool_size - len(running)

        # Se houver vagas livres, busca novas streams para preencher
        if vagas_livres > 0:
            # Busca até o número de vagas livres, mas com limite de tentativas para não travar
            preenchidas_nesta_rodada = 0
            for _ in range(vagas_livres):
                stream = buscar_nova_transmissao() # Retorna dicionário com id, username, src, poster_path
                if not stream:
                    # Se não encontrar mais streams disponíveis após todas as tentativas internas, sai do loop de preenchimento
                    log_supervisor("Não há mais transmissões para preencher as vagas livres.", "LOOP")
                    break # Sai do loop interno de preenchimento de vagas

                user_id = stream["id"] # Obtém o ID do dicionário retornado
                username = stream["username"]
                m3u8_url = stream["src"]
                poster_path = stream["poster_path"] # Caminho do poster temporário válido

                # Marca no log central como em processamento (USANDO ID)
                mark_processing(user_id, username) # Passa user_id e username

                log_supervisor(f"Lançando nova gravação: '{username}' (ID: {user_id}) | Vaga preenchida {len(running)+1}/{pool_size}", "LOOP") # Loga o ID
                # Passa o user_id para a função worker
                p = Process(target=worker, args=(user_id, username, m3u8_url, poster_path, results))
                running.append(p)
                p.start()
                preenchidas_nesta_rodada += 1 # Conta quantas vagas foram preenchidas nesta rodada

            if preenchidas_nesta_rodada == 0 and vagas_livres > 0 and not stream:
                 # Condição para sair do loop principal: não há processos rodando E não há mais streams disponíveis
                 # (a busca_nova_transmissao retornou None após várias tentativas)
                 if not running:
                      log_supervisor("Não há processos ativos e não há mais transmissões disponíveis.", "END")
                      break


        # Se não houver processos rodando e não conseguimos preencher nenhuma vaga nesta rodada,
        # significa que todas as transmissões disponíveis já foram processadas ou estão em blacklist/processing.
        # A condição `if not stream:` dentro do loop de vagas + `if not running:` fora do loop de vagas
        # já lida com isso, mas podemos adicionar uma checagem explícita.
        # if not running and vagas_livres == pool_size and stream is None:
        #      log_supervisor("Todas as transmissões possíveis já foram processadas ou estão bloqueadas.", "END")
        #      break


        # Log de status periódico
        log_supervisor(
            f"Transmissões ativas: {len(running)} | Lote alvo: {pool_size} | Buffer de resultados: {len(results)}",
            "STATUS"
        )

        # Aguarda um pouco antes de verificar novamente
        time.sleep(5) # Aumentado o sleep para reduzir a frequência da busca quando o lote está cheio

        # Condição de saída mais robusta: se não há processos rodando E a última busca não encontrou streams
        if not running and (stream is None or (isinstance(stream, list) and len(stream) == 0)):
             log_supervisor("Não há processos ativos e a última busca não encontrou transmissões.", "END")
             break


    # ========== Fase 3: Finalização ==========
    log_supervisor(f"Processamento dinâmico concluído! Total de transmissões gravadas/processadas: {len(results)}", "RESUMO")
    # A chamada para commit_push_restantes() foi removida pois o commit é gerenciado externamente.
    log_supervisor("Supervisor dinâmico finalizado.", "END")


# Função principal para iniciar o supervisor
def main():
    """
    Função principal: inicia o notebook perguntando se o usuário quer gravar transmissões específicas ou automáticas.
    Dispara o supervisor dinâmico na modalidade selecionada.
    """
    # Certificar-se que as variáveis globais essenciais da Célula 1 estão carregadas
    # Isso é feito executando a Célula 1 antes desta.
    if 'LOG_PATH' not in globals():
        print("⚠️ Variáveis globais da Célula 1 não carregadas. Execute a Célula 1 primeiro.")
        return # Sai se a Célula 1 não foi executada

    usuarios_especificos = perguntar_transmissoes_especificas() # perguntar_transmissoes_especificas está na Célula 1
    log_supervisor("Iniciando busca e gravação de streams (supervisor dinâmico)...", "MAIN")
    supervisor_dinamico(usuarios_especificos=usuarios_especificos)


if __name__ == '__main__':
    # Garante que as funções de log da Célula 1 estejam disponíveis
    # Em um notebook, geralmente as células são executadas em ordem,
    # então Célula 1 já teria definido append_log, query_logs, etc.
    # Se rodando como script Python, precisaria importar ou definir as funções de log aqui.
    # Para o contexto do Colab, assume-se que Célula 1 já rodou.

    # Adicionando um try-except para garantir que main() seja chamada
    # apenas se estiver em um ambiente interativo como Colab/IPython
    try:
        if 'google.colab' in str(get_ipython()):
            main()
        else:
            print("Não está rodando em Colab/IPython. Execute main() manualmente se desejar.")
    except NameError:
        print("Não está rodando em Colab/IPython. Execute main() se desejar.")


# ================================================================
# FIM DA CÉLULA 9 — Supervisor Dinâmico, Lote Cheio e Blacklist Centralizados (AGORA USANDO ID)
# ================================================================

# Observações e recomendações:
# - Toda lógica de blacklist, processamento e falhas agora se baseia no ID único do usuário no log centralizado para máxima rastreabilidade.
# - O log central é a fonte de verdade para sincronização entre workers/processos.
# - Modularidade, logs claros e tratamento de erro garantem manutenção e evolução seguras.
# - Pronto para ambientes colaborativos (Colab, CI/CD, pipelines paralelos).
# - Certifique-se de executar as Células 1, 3, 6, 7 e 8 antes desta.

# Célula XX: Limpeza do Arquivo de Log Central do Google Drive

**Objetivo:**\
Esta célula permite remover o arquivo de log central (`xcam_master.log`) do Google Drive. É uma operação útil para limpar um log corrompido que esteja causando erros (como `JSONDecodeError` ou `UnicodeDecodeError`) ou simplesmente para iniciar o registro de eventos do zero.

## Principais pontos e funcionalidades

- **Remoção segura:** Verifica se o arquivo de log existe antes de tentar removê-lo.
- **Tratamento de erros:** Inclui um bloco `try-except` para capturar e reportar quaisquer problemas que possam ocorrer durante a remoção do arquivo.
- **Feedback claro:** Imprime mensagens indicando se o arquivo foi removido com sucesso, se houve um erro ou se o arquivo não foi encontrado.
- **Utilidade para depuração:** Essencial para resetar o estado do log quando ele se corrompe devido a falhas inesperadas de escrita ou outros problemas de sistema de arquivos.

* * *

## Como funciona a célula

- **Define o caminho** completo para o arquivo de log central no Google Drive.
- **Verifica** se o arquivo existe nesse local.
- **Tenta remover** o arquivo.
- **Imprime** o resultado da operação (sucesso, erro ou arquivo não encontrado).

* * *

## Exemplo de execução

In [None]:
import os

log_file_drive = '/content/drive/MyDrive/XCam.Drive/logs/xcam_master.log'
if os.path.exists(log_file_drive):
    try:
        os.remove(log_file_drive)
        print(f"Arquivo de log do Drive removido: {log_file_drive}")
    except Exception as e:
        print(f"Erro ao remover arquivo de log do Drive: {e}")
else:
    print(f"Arquivo de log do Drive não encontrado: {log_file_drive}")