<a href="https://colab.research.google.com/github/SamuelPassamani/XCam/blob/main/xcam-colab/XCam_REC_V4.4.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Célula 1: Configuração Global, Parâmetros e Log Único Estruturado

**Objetivo:**  
Esta célula inicializa e centraliza todas as variáveis e parâmetros essenciais para o funcionamento do notebook XCam, além de fornecer um sistema robusto para log centralizado e estruturado.  
Seu propósito é garantir controle total sobre limites, caminhos, thresholds, rastreabilidade das execuções e facilidade de manutenção, promovendo padronização e transparência em todas as operações.

---

## O que esta célula faz?

- **Monta e garante o diretório de logs no Google Drive:**  
  Todos os registros do notebook são salvos em um arquivo único (`xcam_master.log`) dentro do Drive, facilitando backup, compartilhamento e auditoria.
- **Define parâmetros globais editáveis:**  
  Limites de processamento, controle de gravação, thresholds e caminhos são definidos de forma clara e centralizada, podendo ser facilmente ajustados conforme a necessidade do projeto ou do ambiente.
- **Propaga variáveis para todo o notebook:**  
  Com um único comando, todos os parâmetros são disponibilizados globalmente, evitando inconsistências e facilitando o uso em qualquer célula subsequente.
- **Implementa um sistema de log único e modular (JSONL):**  
  Todas as operações relevantes (busca, gravação, blacklist, falha, sucesso, commit, erro, etc.) são registradas em entradas padronizadas no arquivo de log, incluindo informações como sessão, evento, id, username, status, detalhes e timestamp.
- **Fornece funções utilitárias para manipular o log:**  
  Inclui funções para adicionar, buscar, atualizar e remover registros do log de maneira fácil e segura – atuando como um “banco de dados” simples para rastreamento e auditoria.
- **Cria mecanismo de blacklist e controle por identificador:**  
  O controle de falhas, blacklist, reprocessamento e auditoria é feito sempre por `id` (e `id_username`), garantindo unicidade e evitando erros comuns de duplicidade ou conflito de dados.
- **Inclui função interativa para seleção de transmissões específicas:**  
  Permite ao usuário informar manualmente nomes de usuários de transmissões para processamento prioritário.

---

## Exemplos de uso prático

### 1. Ajustando parâmetros globais

Se desejar processar apenas 30 transmissões por rodada, basta alterar:
```python
LIMIT_DEFAULT = 30
```
Ou para aumentar o tempo máximo de gravação:
```python
RECORD_SECONDS = 14400  # 4 horas
```

### 2. Registrando um evento no log

Ao iniciar a gravação de uma transmissão:
```python
append_log({
    "sessao": "gravação",
    "evento": "iniciado",
    "id": "tx123",
    "username": "StreamerExemplo",
    "status": "ok",
    "detalhes": "URL válida e gravação iniciada"
})
```

### 3. Consultando registros de blacklist

Para buscar todas as transmissões atualmente banidas:
```python
logs_blacklist = query_logs(sessao="blacklist", status="blacklisted")
print(logs_blacklist)
```

### 4. Removendo registros expirados

Para limpar eventos de blacklist que já venceram:
```python
from datetime import datetime, timedelta

def expirou(entry):
    ts = datetime.fromisoformat(entry["timestamp"].replace("Z", ""))
    return (datetime.utcnow() - ts) > timedelta(seconds=BLACKLIST_TIMEOUT)

remove_logs(lambda entry: entry["sessao"] == "blacklist" and expirou(entry), log_path=LOG_PATH)
```

### 5. Atualizando status de uma entrada

Para promover o status de uma transmissão após sucesso:
```python
update_log_entry(
    lambda e: e["id"] == "tx123" and e["sessao"] == "gravação",
    lambda e: e.update({"status": "success"})
)
```

### 6. Selecionando transmissões específicas manualmente

O notebook pode perguntar:
```
Deseja gravar alguma transmissão específica? (sim/não):
```
Se sim, você informa os nomes separados por vírgula, por exemplo:
```
StreamerA, StreamerB
```
E o notebook irá priorizar esses nomes na próxima execução.

---

## Estrutura detalhada do log (`xcam_master.log`)

Cada linha do arquivo é um JSON no formato:
```json
{
  "timestamp": "2025-06-06T06:15:00Z",
  "sessao": "busca|gravação|blacklist|processing|failure|success|commit|erro|...",
  "evento": "iniciado|finalizado|expirado|banido|...",
  "id": "identificador_unico",
  "username": "nome_para_exibicao",
  "id_username": "identificador_unico:nome_para_exibicao",
  "status": "ok|erro|blacklisted|expirado|success|...",
  "detalhes": "informações adicionais, motivo, paths, etc"
}
```

Exemplo real:
```json
{
  "timestamp": "2025-06-15T20:00:00Z",
  "sessao": "blacklist",
  "evento": "banido",
  "id": "tx987",
  "username": "StreamerB",
  "id_username": "tx987:StreamerB",
  "status": "blacklisted",
  "detalhes": "3 falhas consecutivas na gravação"
}
```

---

## Segurança, rastreabilidade e manutenção

- **Consistência:** Todos os parâmetros críticos estão centralizados e propagados globalmente.
- **Rastreabilidade:** Cada operação é registrada de forma padronizada, permitindo reprocessamento, auditoria e debugging facilitados.
- **Facilidade de ajuste:** Qualquer valor relevante pode ser alterado em um só lugar e imediatamente refletido em todo o notebook.
- **Manutenção simplificada:** Funções bem documentadas e exemplos práticos permitem evolução fácil por toda a equipe, mesmo para novos membros.

---

## Recomendações

- Sempre execute a célula 1 antes de qualquer processamento.
- Ao ajustar limites, thresholds ou caminhos, faça isso apenas nesta célula.
- Consulte e manipule o log usando as funções fornecidas, evitando manipulação manual do arquivo.
- Utilize o Google Drive para garantir o backup dos logs e facilitar a colaboração.
- Siga os exemplos para registrar corretamente eventos e manter o histórico de execuções completo.

---

In [None]:
# ================================================================
# Célula 1: Configuração Global, Parâmetros e Log Único Estruturado
# ================================================================
# Objetivo:
# - Centralizar configurações globais e thresholds
# - Definir e montar caminhos do notebook
# - Fornecer utilitário robusto para LOG ÚNICO MODULAR (JSONL)
#   => Todas as células e funções usarão este log para registrar, consultar e manipular eventos
# - Garantir padronização, rastreabilidade, unicidade e fácil manutenção futura
#
# Estratégia:
# - Log único estruturado (JSONL): sessão, evento, id, username, id_username, timestamps, status, detalhes
# - Funções CRUD para log: adicionar, buscar, atualizar, remover (para blacklist, processing, falhas, auditoria)
# - Blacklist e controles baseados em id (com username apenas para exibição)
# - Parâmetros globais facilmente editáveis e propagados via globals()
# - Uso consistente de "sessao" para diferenciar tipos de registros
# ================================================================

from google.colab import drive
drive.mount('/content/drive')

import os
import json

# ============================
# PARÂMETROS GLOBAIS EDITÁVEIS
# ============================
# Modifique abaixo conforme necessidade do ambiente ou processamento

# Limites e thresholds principais de processamento
LIMIT_DEFAULT = 100             # Máximo de transmissões processadas por rodada
PAGE_DEFAULT = 1               # Página padrão para busca na API
RECORD_SECONDS = 12780         # Duração máxima da gravação (em segundos)
RECORD_SECONDS_MIN = 420       # Duração mínima válida (em segundos)
API_SEARCH_LIMIT = 3333        # Limite ao buscar usuários específicos
# COMMIT_PUSH_THRESHOLD removido pois o commit/push é gerenciado externamente

# Caminhos de arquivos principais
BASE_PATH = '/content' # Mantido para referência, mas LOG_PATH vai para o Drive
DRIVE_BASE_LOG_PATH = '/content/drive/MyDrive/XCam.Drive/logs' # Novo caminho base para logs no Drive
LOG_PATH = f"{DRIVE_BASE_LOG_PATH}/xcam_master.log"          # Arquivo único de log central MOVIDO PARA O DRIVE
BLACKLIST_TIMEOUT = 15 * 60                        # Blacklist: tempo de expiração (segundos)
BLACKLIST_MAX_FAILURES = 3                         # Blacklist: falhas para banimento temporário

# Garante que o diretório de logs no Drive exista
os.makedirs(DRIVE_BASE_LOG_PATH, exist_ok=True)
print(f"Diretório de logs no Drive garantido: {DRIVE_BASE_LOG_PATH}")


# ============================
# ATUALIZAÇÃO GLOBAL DOS PARÂMETROS
# ============================
# Propaga parâmetros como globais do notebook
globals().update({
    'LIMIT_DEFAULT': LIMIT_DEFAULT,
    'PAGE_DEFAULT': PAGE_DEFAULT,
    'RECORD_SECONDS': RECORD_SECONDS,
    'RECORD_SECONDS_MIN': RECORD_SECONDS_MIN,
    'API_SEARCH_LIMIT': API_SEARCH_LIMIT,
    'LOG_PATH': LOG_PATH, # Atualizado para o caminho do Drive
    'BLACKLIST_TIMEOUT': BLACKLIST_TIMEOUT,
    'BLACKLIST_MAX_FAILURES': BLACKLIST_MAX_FAILURES
})

# =============================================================================
# UTILITÁRIO DE LOG ÚNICO MODULAR (JSONL) — Clean Architecture
# -----------------------------------------------------------------------------
# Cada entrada: {
#   "timestamp": "2025-06-06T06:15:00Z",
#   "sessao": "busca|gravação|blacklist|processing|failure|commit|erro|...",
#   "evento": "...",
#   "id": "...",               # identificador primário (ex: id da transmissão)
#   "username": "...",         # apenas referência humana
#   "id_username": "...",      # padrão "{id}:{username}" para fácil leitura/humano
#   "status": "...",           # ok|erro|blacklisted|expirado|...
#   "detalhes": "...",         # informações adicionais/motivo/paths
# }
# =============================================================================

from datetime import datetime

def now_iso():
    """Retorna timestamp UTC em formato ISO."""
    return datetime.utcnow().isoformat() + "Z"

def make_id_username(id, username):
    """Gera o identificador de referência padrão para logs: '{id}:{username}'."""
    return f"{id}:{username}"

def append_log(entry, log_path=LOG_PATH):
    """
    Adiciona uma nova entrada ao log central (JSONL).
    Campos obrigatórios: sessao, evento, id, username, status.
    - 'id' DEVE ser chave primária (único por transmissão/processo).
    - 'username' é apenas referência humana.
    - 'id_username' sempre gerado para facilitar auditoria/consulta.
    - 'sessao' obrigatório e padronizado para facilitar filtros e consultas.
    """
    entry.setdefault("timestamp", now_iso())
    for field in ["sessao", "evento", "id", "username", "status"]:
        entry.setdefault(field, "")
    # Padrão de referência único e fácil busca
    entry["id_username"] = make_id_username(entry["id"], entry["username"])
    # Evitar duplicidade de id+sessao+evento (unicidade lógica)
    logs = []
    # Verifica se o arquivo existe ANTES de tentar ler
    if os.path.exists(log_path):
        try:
            with open(log_path, "r", encoding="utf-8") as f:
                # Lê linha por linha e tenta parsear JSON. Ignora linhas inválidas com aviso.
                for line in f:
                    line = line.strip()
                    if line:
                        try:
                            logs.append(json.loads(line))
                        except json.JSONDecodeError as e:
                            print(f"⚠️ Aviso: Linha inválida no log '{log_path}', ignorada: {line} - Erro: {e}")
        except Exception as e:
             print(f"❌ Erro inesperado ao ler log '{log_path}', inicializando lista vazia: {e}")
             logs = []


    # Checa unicidade apenas para eventos que não podem ser duplicados (ex: processing, blacklist, etc)
    if entry["sessao"] in {"processing", "blacklist", "failure", "success"}:
        key = (entry["id"], entry["sessao"], entry["evento"])
        # Encontra o índice da entrada existente, se houver
        existing_index = next((i for i, e in enumerate(logs) if (e.get("id"), e.get("sessao"), e.get("evento")) == key), -1)

        if existing_index != -1:
            # Atualiza o registro existente ao invés de duplicar
            logs[existing_index].update(entry)
            # Escreve o arquivo completo de volta (substitui)
            try:
                with open(log_path, "w", encoding="utf-8") as f:
                    for l in logs:
                        f.write(json.dumps(l, ensure_ascii=False) + "\n")
                return # Retorna após atualizar
            except Exception as e:
                print(f"❌ Erro ao reescrever log '{log_path}' após atualização: {e}")
                # Em caso de erro ao reescrever, tenta apenas append abaixo como fallback?
                # Ou seria melhor parar? Por segurança, vamos tentar append (pode gerar duplicidade temporária)
                pass # Continua para o append abaixo em caso de erro ao reescrever

    # Se não existe ou se houve erro ao reescrever, apenas append a nova entrada
    try:
        with open(log_path, "a", encoding="utf-8") as f:
            f.write(json.dumps(entry, ensure_ascii=False) + "\n")
    except Exception as e:
        print(f"❌ Erro ao adicionar entrada ao log '{log_path}': {e}")


def read_logs(log_path=LOG_PATH):
    """Lê todas as entradas do log central."""
    if not os.path.exists(log_path):
        return []
    logs = []
    try:
        with open(log_path, "r", encoding="utf-8") as f:
            for line in f:
                line = line.strip()
                if line:
                    try:
                        logs.append(json.loads(line))
                    except json.JSONDecodeError as e:
                         print(f"⚠️ Aviso: Linha inválida no log '{log_path}', ignorada: {line} - Erro: {e}")
    except Exception as e:
         print(f"❌ Erro inesperado ao ler log '{log_path}': {e}")
         return []
    return logs


def query_logs(sessao=None, id=None, username=None, id_username=None, evento=None, status=None, after=None, before=None, log_path=LOG_PATH):
    """
    Consulta entradas do log por filtros opcionais.
    Filtros disponíveis: sessao, id, username, id_username, evento, status, after, before.
    - after/before: string ISO ou datetime
    """
    logs = read_logs(log_path)
    result = []
    for entry in logs:
        if sessao and entry.get("sessao") != sessao:
            continue
        if id and entry.get("id") != id:
            continue
        if username and entry.get("username") != username:
            continue
        if id_username and entry.get("id_username") != id_username:
            continue
        if evento and entry.get("evento") != evento:
            continue
        if status and entry.get("status") != status:
            continue
        ts = entry.get("timestamp")
        if after:
            after_val = after if isinstance(after, str) else after.isoformat()
            if ts < after_val:
                continue
        if before:
            before_val = before if isinstance(before, str) else before.isoformat()
            if ts > before_val:
                continue
        result.append(entry)
    return result

def remove_logs(condition_fn, log_path=LOG_PATH):
    """
    Remove do log central todas as entradas que satisfaçam condition_fn(entry).
    Útil para expurgar logs expirados, blacklists vencidas, eventos processados, etc.
    """
    logs = read_logs(log_path)
    kept = [entry for entry in logs if not condition_fn(entry)]
    # Só reescreve se houve remoção ou se o arquivo existia e agora está vazio
    if len(kept) < len(logs) or (len(logs) > 0 and len(kept) == 0):
        try:
            with open(log_path, "w", encoding="utf-8") as f:
                for entry in kept:
                    f.write(json.dumps(entry, ensure_ascii=False) + "\n")
            print(f"✅ {len(logs) - len(kept)} entradas removidas do log '{log_path}'.")
            return len(logs) - len(kept)
        except Exception as e:
            print(f"❌ Erro ao reescrever log '{log_path}' após remoção: {e}")
            return 0 # Não podemos confirmar quantas foram removidas no arquivo
    else:
         print(f"ℹ️ Nenhuma entrada satisfez a condição de remoção no log '{log_path}'.")
         return 0


def update_log_entry(match_fn, update_fn, log_path=LOG_PATH):
    """
    Atualiza entradas do log central: se match_fn(entry)==True, aplica update_fn(entry).
    Exemplo: promover status de "pending" para "ok".
    """
    logs = read_logs(log_path)
    updated = 0
    # Cria uma cópia para iterar enquanto modifica a original (ou uma nova lista)
    new_logs = []
    made_changes = False
    for entry in logs:
        # Cria uma cópia da entrada para modificar, se necessário
        entry_copy = entry.copy()
        if match_fn(entry_copy):
            update_fn(entry_copy)
            updated += 1
            made_changes = True
        new_logs.append(entry_copy)

    if made_changes:
        try:
            with open(log_path, "w", encoding="utf-8") as f:
                for entry in new_logs:
                    f.write(json.dumps(entry, ensure_ascii=False) + "\n")
            print(f"✅ {updated} entradas atualizadas no log '{log_path}'.")
        except Exception as e:
             print(f"❌ Erro ao reescrever log '{log_path}' após atualização: {e}")

    return updated

# Exemplos de uso (para as próximas células):
# append_log({"sessao":"processing", "evento":"iniciado", "id":"123456", "username":"Manugic_", "status":"ok", "detalhes":"URL válida"})
# logs_blacklist = query_logs(sessao="blacklist", status="blacklisted")
# remove_logs(lambda entry: entry["sessao"]=="processing" and expirou(entry), log_path=LOG_PATH)
# update_log_entry(lambda e: e["id"]=="123456" and e["sessao"]=="processing", lambda e: e.update({"status":"ok"}))

# =============================================================================
# FUNÇÃO INTERATIVA (opcional) PARA ESCOLHA DE TRANSMISSÕES ESPECÍFICAS
# =============================================================================
def perguntar_transmissoes_especificas():
    """
    Pergunta ao usuário se deseja informar transmissões específicas para gravar,
    recebendo nomes de usuário separados por vírgula e retornando lista limpa.
    Retorna lista vazia caso não deseje selecionar usuários.
    """
    resp = input('Deseja gravar alguma transmissão específica? (sim/não): ').strip().lower()
    if resp.startswith('s'):
        usuarios = input('Informe o(s) nome(s) de usuário, separados por vírgula (ex: userNovo234, jovemPT): ')
        usuarios_lista = [u.strip() for u in usuarios.split(',') if u.strip()]
        return usuarios_lista
    return []

# =============================================================================
# DICAS DE USO EM OUTRAS CÉLULAS:
# - Para registrar evento: append_log({...})
# - Para consultar blacklist: query_logs(sessao="blacklist", status="blacklisted")
# - Para remover registros expirados: remove_logs(lambda e: ...)
# - Para atualizar status: update_log_entry(lambda e: ..., lambda e: ...)
# - Sempre use o id como chave primária e id_username para referência em relatórios/auditoria
# =============================================================================

# ============================
# FIM DA CÉLULA 1
# ============================

# Célula 2: Instalação e Validação do ffmpeg

**Objetivo:**  
Esta célula é responsável por garantir que o utilitário `ffmpeg` esteja instalado, atualizado e disponível no ambiente de execução do notebook XCam (Google Colab ou qualquer sistema baseado em Linux). O ffmpeg é indispensável para todas as etapas de gravação de vídeos e processamento de mídia do pipeline.

---

## Principais pontos e melhorias implementadas

- **Verificação automática e idempotente:**  
  Antes de qualquer instalação, verifica se o `ffmpeg` já está disponível no PATH do sistema. Assim, evita reinstalações desnecessárias e torna o processo seguro para múltiplas execuções.
- **Instalação automatizada via apt-get:**  
  Caso o `ffmpeg` não esteja instalado, realiza a instalação automatizada usando `apt-get`, garantindo compatibilidade com ambientes Google Colab e servidores Linux.
- **Validação e exibição da versão instalada:**  
  Após a instalação (ou confirmação prévia), exibe a versão do `ffmpeg` instalada, contribuindo para rastreabilidade e diagnóstico de ambiente.
- **Mensagens de log detalhadas:**  
  Cada etapa da checagem, instalação e validação fornece feedback detalhado ao usuário, facilitando a identificação de problemas e tornando o notebook mais transparente para uso individual ou colaborativo.
- **Design modular e pronto para CI/CD:**  
  A estrutura da célula foi desenhada para integração fácil em pipelines automatizados, garantindo robustez em ambientes colaborativos, notebooks, scripts e CI/CD.

---

## Como funciona a célula

1. **Checagem inicial:**  
   Usa a função `is_ffmpeg_installed()` para verificar se o comando `ffmpeg` está disponível no ambiente.
2. **Instalação automática (se necessário):**  
   Caso `ffmpeg` não esteja presente, executa `install_ffmpeg()`, realizando atualização dos pacotes e instalação silenciosa para manter o log limpo.
3. **Validação final e rastreabilidade:**  
   Exibe a versão instalada com `show_ffmpeg_version()` para garantir que a instalação foi bem-sucedida.
4. **Tratamento de erros:**  
   Em caso de falha na instalação, exibe mensagens de erro detalhadas e interrompe a execução, evitando inconsistências futuras no pipeline.

---

## Exemplo de uso das funções desta célula

```python
if not is_ffmpeg_installed():
    install_ffmpeg()
show_ffmpeg_version()
```
Ou, de forma automatizada e segura (como implementado):
```python
if not is_ffmpeg_installed():
    print("[WARN] ffmpeg não encontrado no ambiente.")
    try:
        install_ffmpeg()
    except Exception:
        raise RuntimeError("[ERRO] Falha ao instalar o ffmpeg. Verifique permissões ou tente novamente.")
    if not is_ffmpeg_installed():
        raise RuntimeError("[ERRO] Falha ao instalar o ffmpeg. Verifique permissões, root ou tente novamente.")
    else:
        print("[OK] ffmpeg instalado e pronto para uso.")
else:
    print("[OK] ffmpeg já está instalado no ambiente.")

show_ffmpeg_version()
```

---

## Segurança, rastreabilidade e manutenção

- **Robustez:** Garante que o ambiente está sempre pronto para gravação e processamento de mídia, mesmo após resets ou novas execuções.
- **Transparência:** Mensagens informativas em cada etapa ajudam a equipe a identificar rapidamente problemas de ambiente, permissões ou compatibilidade.
- **Modularidade:** Célula pronta para ser reutilizada em outros projetos, pipelines ou ambientes CI/CD do ecossistema XCam, bastando adaptar comandos de instalação para outros sistemas se necessário.
- **Idempotência:** Pode ser executada múltiplas vezes sem efeitos colaterais ou duplicação de instalações, tornando o setup seguro e confiável.

---

## Observações técnicas

- O ffmpeg deve estar disponível no PATH do sistema para todas as etapas do pipeline XCam.
- Para obter o caminho absoluto do executável:  
  ```python
  subprocess.run(['which', 'ffmpeg'], capture_output=True, text=True).stdout.strip()
  ```
- A célula pode ser adaptada para outros sistemas de gerenciamento de pacotes se necessário (exemplo: yum, brew, choco).
- Recomenda-se executar esta célula sempre antes de iniciar qualquer processamento de mídia.

---

In [None]:
# ================================================================
# Célula 2: Instalação e Validação do FFMPEG no Colab e Linux
# ================================================================
# Objetivo:
# - Garantir que o utilitário ffmpeg está instalado e disponível no ambiente (Colab ou Linux)
# - Validar a instalação e exibir a versão instalada para rastreabilidade
# - Tornar a etapa idempotente, evitando instalações desnecessárias (safe to rerun)
# - Fornecer feedback detalhado e logs a cada etapa para diagnóstico rápido
#
# Estratégia aplicada:
# - Checa se ffmpeg está disponível no PATH do sistema
# - Caso não esteja, instala automaticamente via apt-get (compatível Colab/Linux)
# - Valida a instalação e exibe a versão instalada
# - Modularidade e robustez para uso em pipelines, CI/CD e ambientes colaborativos
# ================================================================

import subprocess   # Importação obrigatória para checagem e instalação do ffmpeg
import sys

def is_ffmpeg_installed():
    """
    Verifica se o ffmpeg está instalado e disponível no PATH do sistema.
    Retorna True se estiver, False caso contrário.
    """
    try:
        result = subprocess.run(["ffmpeg", "-version"], capture_output=True, text=True)
        return result.returncode == 0
    except Exception:
        return False

def install_ffmpeg():
    """
    Instala o ffmpeg via apt-get caso não esteja presente.
    Somente para sistemas baseados em Debian/Ubuntu (inclui Google Colab).
    """
    print("[INFO] Iniciando instalação do ffmpeg via apt-get...")
    try:
        # Atualiza pacotes e instala ffmpeg de forma silenciosa para logs limpos
        subprocess.run("apt-get update -y", shell=True, check=True, stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
        subprocess.run("apt-get install -y ffmpeg", shell=True, check=True, stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
        print("[INFO] ffmpeg instalado com sucesso.")
    except subprocess.CalledProcessError as e:
        print(f"[ERRO] Falha ao instalar ffmpeg via apt-get: {e}")
        print("🔴 Tente rodar manualmente ou verifique permissões/root.")
        raise

def show_ffmpeg_version():
    """
    Exibe a versão instalada do ffmpeg, se disponível.
    Mostra as duas primeiras linhas para rastreabilidade.
    """
    print("[INFO] Versão do ffmpeg instalada:")
    try:
        result = subprocess.run(["ffmpeg", "-version"], capture_output=True, text=True)
        if result.returncode == 0:
            linhas = result.stdout.strip().split('\n')
            for l in linhas[:2]:
                print(l)
        else:
            print("[ERRO] ffmpeg instalado, mas não foi possível obter a versão.")
    except Exception as e:
        print(f"[ERRO] Não foi possível exibir a versão do ffmpeg: {e}")

# ================================================================
# EXECUÇÃO DA ETAPA DE SETUP — Sempre idempotente e segura
# ================================================================

if not is_ffmpeg_installed():
    print("[WARN] ffmpeg não encontrado no ambiente.")
    try:
        install_ffmpeg()
    except Exception:
        raise RuntimeError("[ERRO] Falha ao instalar o ffmpeg. Verifique permissões ou tente novamente.")
    if not is_ffmpeg_installed():
        # Última checagem após instalação
        raise RuntimeError("[ERRO] Falha ao instalar o ffmpeg. Verifique permissões, root ou tente novamente.")
    else:
        print("[OK] ffmpeg instalado e pronto para uso.")
else:
    print("[OK] ffmpeg já está instalado no ambiente.")

show_ffmpeg_version()

# ================================================================
# FIM DA CÉLULA 2 — Instalação e Validação do ffmpeg
# ================================================================
#
# Observações técnicas:
# - ffmpeg deve estar disponível para todas as etapas do pipeline XCam.
# - Para obter o caminho absoluto: subprocess.run(['which', 'ffmpeg'], capture_output=True, text=True).stdout.strip()
# - Célula idempotente: pode ser executada múltiplas vezes sem efeitos colaterais.
# - Pronta para uso em pipelines, scripts automatizados e ambientes colaborativos.

# Célula 3: Imports Essenciais, Utilitários e Preparação do Ambiente

**Objetivo:**  
Esta célula prepara o ambiente de execução do notebook XCam, realizando todos os imports essenciais de bibliotecas Python necessárias e centralizando funções utilitárias robustas para formatação de tempo, exibição de progresso, download e geração de posters (thumbnails) das transmissões.  
Toda a lógica de rastreabilidade, fallback, tratamento de exceções e integração com o log centralizado é garantida, promovendo modularidade, clareza e segurança para as próximas etapas do pipeline.

---

## Principais pontos e melhorias implementadas

- **Imports essenciais agrupados:**  
  Todos os módulos básicos e avançados utilizados ao longo do notebook são importados em um só lugar, incluindo manipulação de arquivos, requests HTTP, processamento paralelo, datas, subprocessos, matemática, expressões regulares, shutil, threading e integração com IPython.
- **Funções utilitárias padronizadas e seguras:**  
  As funções fornecem utilitários para:
  - Formatar segundos em tempo legível
  - Exibir progresso detalhado da gravação de transmissões
  - Download robusto de posters remotos ou uso direto de arquivos locais
  - Geração automática de poster a partir de stream (.m3u8) usando ffmpeg, com múltiplas tentativas, tratamento de falha, log centralizado e fallback inteligente para placeholder
  - Validação do arquivo de poster gerado
- **Integração total ao log centralizado:**  
  Todas as falhas, erros e eventos relevantes durante o download ou geração de posters são registrados no log único do sistema (definido na Célula 1), eliminando a necessidade de logs temporários dispersos.
- **Fallbacks inteligentes e robustez:**  
  Se não for possível gerar um poster com ffmpeg, a função gera uma imagem placeholder personalizada para manter a experiência e rastreabilidade, registrando o evento no log.
- **Pronto para uso concorrente e distribuído:**  
  As funções foram desenhadas para suportar execução paralela, controle de exceções e integração transparente com processos multi-thread/multi-processo.

---

## Funções utilitárias disponíveis nesta célula

- **`format_seconds(seconds)`**  
  Formata um valor em segundos em string legível (ex: "1h23m45s"), facilitando exibição de progresso.
- **`log_progress(username, elapsed_seconds, total_seconds)`**  
  Exibe no console o progresso detalhado da gravação de cada transmissão, incluindo minutos gravados, minutos restantes e percentual concluído.
- **`download_and_save_poster(poster_url, username, temp_folder)`**  
  Faz download do poster a partir de uma URL remota (HTTP/HTTPS) ou retorna o caminho local se já existir. Salva o arquivo no diretório temporário indicado e fornece feedback detalhado em caso de erro.
- **`generate_poster_with_ffmpeg(m3u8_url, username, temp_folder, tries, timeout)`**  
  Gera um poster automaticamente a partir de uma stream `.m3u8` usando ffmpeg, tentando múltiplos pontos no vídeo e registrando todas as tentativas, falhas e sucessos no log central. Em caso de falha total, gera um poster placeholder com feedback visual e registro no log.
- **`is_poster_valid(poster_path)`**  
  Verifica se o poster existe e não está vazio, garantindo que apenas imagens válidas sejam usadas no pipeline.

---

## Exemplos de uso prático

```python
# Formatar segundos em string legível
tempo = format_seconds(5421)   # "1h30m21s"

# Exibir progresso detalhado de gravação
log_progress("StreamerExemplo", 385, 12780)

# Fazer download do poster da transmissão
poster_path = download_and_save_poster("https://exemplo.com/poster.jpg", "StreamerExemplo", "/content/temp")

# Gerar poster automaticamente via ffmpeg (caso o download falhe ou não seja válido)
if not is_poster_valid(poster_path):
    poster_path = generate_poster_with_ffmpeg("https://exemplo.com/stream.m3u8", "StreamerExemplo", "/content/temp")
```

---

## Segurança, rastreabilidade e manutenção

- Todas as funções são protegidas contra erros, possuem logs detalhados e fallback inteligente para manter o pipeline funcionando mesmo em cenários adversos.
- O log único centralizado substitui qualquer necessidade de arquivos dispersos para rastreabilidade de processamento, blacklist ou falhas.
- Comentários e organização clara facilitam a compreensão, manutenção e evolução do notebook por toda a equipe XCam, inclusive para novos membros ou ambientes colaborativos.
- O código está pronto para execução concorrente e pode ser facilmente integrado a pipelines CI/CD ou ambientes distribuídos.

---

## Recomendações

- Utilize sempre as funções utilitárias fornecidas nesta célula para qualquer tarefa de formatação, progresso, download ou geração de poster.
- Consulte e integre o log centralizado para rastreabilidade de todos os eventos relevantes.
- Mantenha o diretório temporário organizado e monitore os logs para auditoria e diagnóstico.
- Em caso de erros na geração de poster, utilize o placeholder automático para não interromper o pipeline.

---

In [None]:
# ================================================================
# Célula 3: Imports Essenciais, Utilitários e Preparação do Ambiente
# ================================================================
# Objetivo:
# - Importar bibliotecas essenciais para todo o notebook
# - Centralizar funções auxiliares de formatação, download e geração de poster
# - Remover dependências de logs temporários dispersos, integrando ao log único do sistema (LOG_PATH)
# - Garantir robustez, clareza e modularidade para as próximas células
#
# Estratégia aplicada:
# - Apenas os imports necessários para o funcionamento do notebook
# - Funções auxiliares adaptadas para Clean Architecture e integração com o log centralizado (Célula 1)
# - Função de geração de poster com ffmpeg robusta, com múltiplas tentativas e fallback
# - Modularidade: funções isoladas, reusáveis, prontas para testes e integração
# ================================================================

import os
import requests
from multiprocessing import Manager, Process
from datetime import datetime
import json
import time
import subprocess
import math
import re
import shutil
import threading

from IPython import get_ipython
from IPython.display import display

# ============================
# UTILITÁRIOS DE FORMATAÇÃO E PROGRESSO
# ============================

def format_seconds(seconds):
    """
    Formata segundos em string legível (e.g., 1h23m45s).
    """
    total_seconds = int(seconds)
    hours = total_seconds // 3600
    minutes = (total_seconds % 3600) // 60
    seconds = total_seconds % 60
    parts = []
    if hours > 0:
        parts.append(f"{hours}h")
    if minutes > 0 or (hours == 0 and seconds > 0):
        parts.append(f"{minutes}m")
    if seconds > 0 or total_seconds == 0:
        parts.append(f"{seconds}s")
    return "".join(parts) if parts else "0s"

def log_progress(username, elapsed_seconds, total_seconds):
    """
    Exibe progresso da gravação de cada transmissão em tempo real.
    """
    percent = min((elapsed_seconds / total_seconds) * 100, 100)
    tempo = format_seconds(elapsed_seconds)
    minutos_gravados = math.floor(elapsed_seconds / 60)
    minutos_restantes = max(0, math.ceil((total_seconds - elapsed_seconds) / 60))
    print(f"⏱️ [{username}] Gravados: {minutos_gravados} min | Restantes: {minutos_restantes} min | Tempo total: {tempo} — 📊 {percent:.1f}% concluído")

# ============================
# UTILITÁRIO PARA DOWNLOAD DE POSTER
# ============================

def download_and_save_poster(poster_url, username, temp_folder):
    """
    Baixa e salva o poster (thumbnail) a partir de uma URL HTTP/HTTPS.
    Se for um caminho local existente, retorna esse caminho.
    Retorna o caminho do arquivo salvo, ou None em caso de erro.
    """
    # Se for um caminho local válido, retorna diretamente
    if os.path.exists(poster_url):
        return poster_url
    # Download de URL HTTP/HTTPS
    if isinstance(poster_url, str) and (poster_url.startswith("http://") or poster_url.startswith("https://")):
        try:
            response = requests.get(poster_url, timeout=15)
            response.raise_for_status()
            ext = os.path.splitext(poster_url)[1].lower()
            if ext not in [".jpg", ".jpeg", ".png"]:
                ext = ".jpg"
            poster_temp_path = os.path.join(temp_folder, f"{username}_poster_temp{ext}")
            with open(poster_temp_path, "wb") as f:
                f.write(response.content)
            print(f"🖼️ Poster baixado em: {poster_temp_path}")
            return poster_temp_path
        except Exception as e:
            print(f"❌ Erro ao baixar poster {poster_url}: {e}")
            return None
    else:
        print(f"❌ poster_url inválido ou não encontrado: {poster_url}")
        return None

# ============================
# UTILITÁRIO PARA GERAR POSTER COM FFMPEG (com fallback e log central)
# ============================

def generate_poster_with_ffmpeg(m3u8_url, username, temp_folder, tries=(3, 1, 7, 15, 30), timeout=30):
    """
    Gera um poster (screenshot) usando ffmpeg a partir da URL .m3u8 da transmissão.
    Tenta múltiplos pontos no vídeo caso haja erro (robustez).
    Integra ao log centralizado via append_log em caso de falha.
    Retorna o caminho do arquivo gerado ou None em caso de erro.
    """
    from IPython.display import clear_output
    import requests # Garantir requests está importado aqui

    # --- Checa se a URL está acessível antes de rodar ffmpeg ---
    try:
        # Usar um timeout curto para a checagem inicial
        head_resp = requests.head(m3u8_url, timeout=5)
        if not head_resp.ok:
            msg = f"Stream offline ou não disponível para {username} (status {head_resp.status_code})"
            print(f"⚠️ {msg}")
            # Registrar falha de conexão no log central
            if "register_failure" in globals():
                 register_failure(username, msg)
            return None # Retorna None imediatamente se a stream não estiver acessível
    except requests.exceptions.RequestException as e:
        msg = f"Erro de conexão ao acessar stream de {username}: {e}"
        print(f"❌ {msg}")
        # Registrar falha de conexão no log central
        if "register_failure" in globals():
             register_failure(username, msg)
        return None # Retorna None imediatamente em caso de erro de conexão
    except Exception as e:
        msg = f"Erro inesperado na checagem de stream para {username}: {e}"
        print(f"❌ {msg}")
        # Registrar falha genérica na checagem
        if "register_failure" in globals():
             register_failure(username, msg)
        return None # Retorna None em caso de qualquer outra exceção na checagem


    # --- Tenta gerar poster com ffmpeg (se a checagem inicial passou) ---
    for frame_time in tries:
        poster_ffmpeg_path = os.path.join(temp_folder, f"{username}_poster_ffmpeg_{frame_time}.jpg")
        command = [
            "ffmpeg",
            "-y",
            "-analyzeduration", "10M",
            "-probesize", "50M",
            "-ss", str(frame_time),
            "-i", m3u8_url,
            "-vframes", "1",
            "-q:v", "2",
            poster_ffmpeg_path
        ]
        try:
            print(f"🎬 Tentando gerar poster para {username} com ffmpeg no segundo {frame_time}...")
            result = subprocess.run(
                command,
                stdout=subprocess.PIPE,
                stderr=subprocess.PIPE,
                timeout=timeout
            )
            if result.returncode == 0 and os.path.exists(poster_ffmpeg_path) and os.path.getsize(poster_ffmpeg_path) > 0:
                print(f"🖼️ Poster gerado via ffmpeg: {poster_ffmpeg_path}")
                # Limpa falhas relacionadas a poster/ffmpeg se a geração for bem-sucedida
                if "clear_failure" in globals():
                    clear_failure(username)
                return poster_ffmpeg_path
            else:
                msg = f"ffmpeg não conseguiu gerar poster para {username} no segundo {frame_time}. Código: {result.returncode}"
                print(f"❌ {msg}\nSTDOUT:\n{result.stdout.decode(errors='ignore')}\nSTDERR:\n{result.stderr.decode(errors='ignore')}")
                # Registrar falha específica de ffmpeg no log central
                if "append_log" in globals():
                    append_log({
                        "sessao": "poster",
                        "evento": "erro_ffmpeg_frame",
                        "id": username,
                        "username": username,
                        "status": "erro",
                        "detalhes": f"{msg} | stdout: {result.stdout.decode(errors='ignore')[:200]} | stderr: {result.stderr.decode(errors='ignore')[:200]}"
                    })

        except subprocess.TimeoutExpired:
            msg = f"Tempo excedido ao tentar gerar poster para {username} via ffmpeg (segundo {frame_time})."
            print(f"⏰ {msg}")
            # Registrar timeout de ffmpeg no log central
            if "append_log" in globals():
                append_log({
                    "sessao": "poster",
                    "evento": "timeout_ffmpeg",
                    "id": username,
                    "username": username,
                    "status": "erro",
                    "detalhes": msg
                })
        except Exception as e:
            msg = f"Erro inesperado ao rodar ffmpeg para poster ({username}, segundo {frame_time}): {e}"
            print(f"❌ {msg}")
            # Registrar exceção de ffmpeg no log central
            if "append_log" in globals():
                append_log({
                    "sessao": "poster",
                    "evento": "excecao_ffmpeg",
                    "id": username,
                    "username": username,
                    "status": "erro",
                    "detalhes": msg
                })


    # --- Fallback: gera um poster placeholder se todas as tentativas falharem ---
    placeholder_path = os.path.join(temp_folder, f"{username}_placeholder.jpg")
    try:
        from PIL import Image, ImageDraw
        img = Image.new('RGB', (640, 360), color=(80, 80, 80))
        d = ImageDraw.Draw(img)
        d.text((10, 150), f"Poster indisponível\n{username}", fill=(255, 255, 255))
        img.save(placeholder_path)
        print(f"⚠️ Poster placeholder gerado para {username}: {placeholder_path}")
        # Registrar geração de placeholder no log central
        if "append_log" in globals():
             append_log({
                 "sessao": "poster",
                 "evento": "placeholder_gerado",
                 "id": username,
                 "username": username,
                 "status": "aviso",
                 "detalhes": f"Poster placeholder gerado após falha no ffmpeg."
             })
        return placeholder_path
    except Exception as e:
        msg = f"Erro ao gerar placeholder para {username}: {e}"
        print(f"❌ {msg}")
        # Registrar falha na geração de placeholder no log central
        if "append_log" in globals():
             append_log({
                 "sessao": "poster",
                 "evento": "erro_placeholder",
                 "id": username,
                 "username": username,
                 "status": "erro",
                 "detalhes": msg
             })
        return None

# ============================
# VALIDAÇÃO DE POSTER
# ============================

def is_poster_valid(poster_path):
    """
    Verifica se o poster existe e não está vazio.
    """
    return poster_path and os.path.exists(poster_path) and os.path.getsize(poster_path) > 0

# ============================
# FIM DA CÉLULA 3
# ============================

# Observações:
# - Todas as funções de logging, blacklist, falha e auditoria devem ser feitas via utilitário de log centralizado (Célula 1).
# - LOG_PROCESSAMENTO_PATH, BLACKLIST_PATH, FAILURE_LOG_PATH e outros logs dispersos não devem mais ser usados.
# - O pipeline está pronto para Clean Architecture, máxima rastreabilidade e integração.
# - Funções aqui são modulares, reusáveis e preparadas para tratamento de exceções e logging detalhado.

# Célula 4: Clonagem do Repositório GitHub no Colab e Google Drive

**Objetivo:**  
Esta célula tem como finalidade garantir que o repositório do projeto XCam esteja sempre disponível, atualizado e sincronizado para uso tanto no ambiente temporário do Google Colab quanto, se disponível, de forma persistente no Google Drive.  
A célula prepara todo o ambiente para gravação, processamento, versionamento de código e integrações externas, promovendo reprodutibilidade, rastreabilidade e facilidade de manutenção em todo o pipeline.

---

## Descrição detalhada das etapas e funcionalidades

- **Configuração dos dados do repositório GitHub:**  
  Define as variáveis globais de usuário, nome do repositório, branch e token pessoal de acesso para autenticação e operações seguras de clone e push.
- **Geração automática da URL autenticada:**  
  Monta dinamicamente a URL de acesso ao repositório já com autenticação embutida, garantindo que operações automatizadas (clone/push) funcionem mesmo em ambientes CI/CD ou sessões reiniciadas.
- **Clonagem limpa para o ambiente Colab:**  
  Antes de clonar, remove qualquer vestígio do repositório anterior no diretório `/content`. Isso evita conflitos de arquivos, branches corrompidos e resíduos de execuções antigas, criando um ambiente limpo para cada nova execução.
- **Preparação e criação de diretórios temporários de gravação:**  
  Cria automaticamente a pasta `/content/temp_recordings` para armazenar gravações temporárias, garantindo que o pipeline não falhe por falta de estrutura de diretórios.
- **Duplicação persistente no Google Drive:**  
  Se o Drive estiver montado, remove o repositório antigo do Drive e executa o clone atualizado para `/content/drive/MyDrive/XCam.Drive/XCam`. Isso garante persistência dos arquivos entre sessões e protege dados relevantes de reinicializações do ambiente Colab.
- **Mensagens informativas e feedback visual:**  
  O usuário é informado em cada etapa do processo por mensagens claras, incluindo alertas caso o Drive não esteja montado, sucesso na clonagem e nos preparos de diretórios, e possíveis erros de autenticação ou permissão.
- **Configuração de endpoint para integrações externas:**  
  Define e exporta a variável `ABYSS_UPLOAD_URL`, já pronta para integrações futuras com serviços de upload ou armazenamento externo, como o Abyss.
- **Exportação de todas as variáveis de ambiente:**  
  Por meio do `globals().update()`, todas as configurações (paths, URLs, tokens, pastas) são exportadas para uso global e consistente em qualquer célula do notebook, promovendo reuso e evitando duplicidade de código.

---

## Parâmetros globais definidos e exportados

- **`GITHUB_USER`**, **`GITHUB_REPO`**, **`GITHUB_BRANCH`**, **`GITHUB_TOKEN`**: Dados do repositório GitHub e autenticação.
- **`repo_url`**: URL autenticada para operações Git automatizadas.
- **`TEMP_OUTPUT_FOLDER`**: Pasta temporária para gravações no ambiente Colab.
- **`BASE_REPO_FOLDER`**: Caminho do repositório clonado no ambiente Colab.
- **`DRIVE_MOUNT`**, **`DRIVE_REPO_FOLDER`**: Caminhos no Google Drive para persistência dos dados e do repositório.
- **`ABYSS_UPLOAD_URL`**: Endpoint de integração externa para uploads ou automações.

---

## Funcionamento passo a passo

1. **Limpa o ambiente:**  
   Remove o repositório antigo e diretórios temporários do Colab e, se disponível, do Google Drive. Isso evita conflitos, arquivos órfãos e histórico inconsistente.
2. **Clona o repositório para o ambiente temporário:**  
   Realiza o clone autenticado do repositório XCam para `/content`, permitindo edição, execução e versionamento imediato do código.
3. **Cria a estrutura de diretórios temporários:**  
   Garante que a pasta de gravações temporárias esteja sempre pronta para uso (evita erros de "diretório não encontrado").
4. **Clona o repositório para o Drive (persistência):**  
   Se o Drive estiver disponível, executa o clone também para o diretório persistente. Isso permite que dados e código sobrevivam a reinicializações ou resets do ambiente Colab.
5. **Define endpoints e exporta variáveis globais:**  
   Torna todos os parâmetros relevantes disponíveis para qualquer célula do notebook, facilitando integrações, uploads e futuras automações.

---

## Exemplos práticos de uso das variáveis exportadas

```python
print(BASE_REPO_FOLDER)        # Exibe o caminho do repositório clonado no Colab
print(DRIVE_REPO_FOLDER)       # Exibe o caminho do repositório persistente no Drive (se montado)
print(TEMP_OUTPUT_FOLDER)      # Exibe a pasta temporária destinada a gravações
print(ABYSS_UPLOAD_URL)        # Exibe a URL de upload para integrações externas (Abyss, etc)
```

---

## Segurança, rastreabilidade e boas práticas

- **Ambiente 100% previsível:** Cada execução parte de um estado limpo, evitando bugs difíceis de rastrear e facilitando o debug.
- **Persistência e backup automático:** A duplicação do repositório e dados no Drive protege contra perdas acidentais e facilita colaboração entre membros do time.
- **Pronto para automações e CI/CD:** O uso de token, URL autenticada e exportação de variáveis prepara o notebook para automações, integrações com pipelines externos, deploys e uploads automáticos.
- **Comentário e organização didática:** Cada bloco e etapa é documentada, tornando a célula autoexplicativa para manutenção, auditoria e treinamento de novos membros.

---

## Recomendações de uso

- **Execute esta célula sempre que iniciar uma nova sessão, trocar de branch, atualizar token ou preparar ambiente para gravação/execução.**
- **Garanta que o Google Drive esteja montado antes de rodar a célula, caso deseje persistência de dados e backup automático.**
- **Utilize as variáveis globais exportadas para padronizar caminhos, URLs e integrações em qualquer etapa do pipeline.**

---

In [None]:
# ================================================================
# Célula 4: Clonagem do Repositório GitHub no Colab e no Google Drive
# ================================================================
# Objetivo:
# - Garantir ambiente limpo e sincronizado para o repositório XCam em todas as execuções
# - Clonar o repositório tanto para o ambiente efêmero do Colab quanto para o Google Drive (persistência)
# - Preparar diretórios de trabalho para gravações e processamento temporário
# - Fornecer feedback claro sobre o status da operação
#
# Estratégia aplicada:
# - Remove repositórios antigos antes de clonar (evita conflitos e arquivos órfãos)
# - Utiliza token pessoal para autenticação segura e push futuro (CI/CD)
# - Cria estrutura de diretórios padronizada (módulos, gravações, cache, etc.)
# - Valida se o Drive está montado antes de tentar operações persistentes
# - Comentários detalhados para fácil manutenção e evolução
# ================================================================

# ============================
# CONFIGURAÇÕES DO GITHUB
# ============================
GITHUB_USER = "SamuelPassamani"
GITHUB_REPO = "XCam"
GITHUB_BRANCH = "main"
GITHUB_TOKEN = "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"

repo_url = f"https://{GITHUB_USER}:{GITHUB_TOKEN}@github.com/{GITHUB_USER}/{GITHUB_REPO}.git"

# ============================
# CLONAGEM PARA O COLAB
# ============================
print(f"⏳ Limpando ambiente e clonando '{GITHUB_REPO}' para o Colab...")
!rm -rf {GITHUB_REPO}
!git clone -b {GITHUB_BRANCH} {repo_url}
print(f"✅ Repositório clonado em /content/{GITHUB_REPO}")

# ============================
# ESTRUTURA DE DIRETÓRIOS TEMPORÁRIOS
# ============================
TEMP_OUTPUT_FOLDER = "/content/temp_recordings"  # Para gravações temporárias
os.makedirs(TEMP_OUTPUT_FOLDER, exist_ok=True)
BASE_REPO_FOLDER = f"/content/{GITHUB_REPO}"

# ============================
# CLONAGEM PARA O GOOGLE DRIVE (PERSISTÊNCIA)
# ============================
DRIVE_MOUNT = "/content/drive/MyDrive/XCam.Drive"
DRIVE_REPO_FOLDER = f"{DRIVE_MOUNT}/{GITHUB_REPO}"

if os.path.exists(DRIVE_MOUNT):
    print(f"⏳ Limpando repositório antigo no Drive (se existir)...")
    !rm -rf "{DRIVE_REPO_FOLDER}"
    print(f"⏳ Clonando '{GITHUB_REPO}' para o Drive em {DRIVE_REPO_FOLDER} ...")
    !git clone -b {GITHUB_BRANCH} {repo_url} "{DRIVE_REPO_FOLDER}"
    print(f"✅ Repositório também clonado no Drive: {DRIVE_REPO_FOLDER}")
else:
    print(f"⚠️ Google Drive não está montado em {DRIVE_MOUNT}.\nℹ️ Use a célula de montagem antes de prosseguir para garantir persistência.")

# ============================
# CONFIGURAÇÃO DE ENDPOINTS DE UPLOAD/INTEGRAÇÃO
# ============================
ABYSS_UPLOAD_URL = 'http://up.hydrax.net/0128263f78f0b426d617bb61c2a8ff43'
globals().update({
    'GITHUB_USER': GITHUB_USER,
    'GITHUB_REPO': GITHUB_REPO,
    'GITHUB_BRANCH': GITHUB_BRANCH,
    'GITHUB_TOKEN': GITHUB_TOKEN,
    'repo_url': repo_url,
    'TEMP_OUTPUT_FOLDER': TEMP_OUTPUT_FOLDER,
    'BASE_REPO_FOLDER': BASE_REPO_FOLDER,
    'DRIVE_MOUNT': DRIVE_MOUNT,
    'DRIVE_REPO_FOLDER': DRIVE_REPO_FOLDER,
    'ABYSS_UPLOAD_URL': ABYSS_UPLOAD_URL
})

# ============================
# FIM DA CÉLULA 4
# ============================

# Observações:
# - Os caminhos globais são exportados via globals().update() para uso em todo o notebook.
# - Recomenda-se sempre rodar esta célula após alterar tokens ou trocar branches para garantir ambiente limpo e sincronizado.
# - O endpoint ABYSS_UPLOAD_URL pode ser atualizado conforme integrações futuras.

# Célula 5: Commit e Push Automáticos (rec.json, posters, etc.)

**Objetivo:**  
Automatizar o processo de versionamento e sincronização dos arquivos modificados no pipeline XCam, como `rec.json`, imagens de poster e demais artefatos, realizando commit e push seguros e auditáveis para o repositório GitHub.  
Esta célula garante que as alterações sejam rastreadas, publicadas e disponíveis para todo o time, promovendo integração contínua (CI/CD) e minimizando riscos de perda ou inconsistência de dados.

---

## Descrição técnica e recursos implementados

- **Função modular e robusta para commit e push:**  
  Estrutura pronta para aceitar tanto um caminho de arquivo único (string) quanto uma lista de arquivos (batch), permitindo estratégias flexíveis de commit, seja por evento ou em lote (threshold/batch commit).
- **Validação rigorosa do ambiente e dos arquivos:**  
  Antes do commit, valida a existência do repositório local (`repo_dir`) e verifica a existência de cada arquivo listado. Arquivos inexistentes são ignorados com aviso explícito, evitando falhas desnecessárias e facilitando troubleshooting.
- **Configuração automatizada do usuário do Git:**  
  Define usuário e e-mail padrão para os commits, garantindo rastreabilidade e conformidade com políticas de auditoria e automação (essencial para ambientes CI/CD).
- **Suporte a commit vazio (`--allow-empty`):**  
  Permite commits mesmo sem alterações detectadas, assegurando que etapas do pipeline não sejam interrompidas por ausência de mudanças (importante para sincronizações automáticas e pipelines que dependem de triggers de commit).
- **Push autenticado via token pessoal:**  
  Utiliza o token do GitHub definido em variáveis globais para push seguro, sem necessidade de intervenção manual, pronto para uso em automações, jobs e ambientes colaborativos.
- **Mensagens detalhadas e tratamento de erros:**  
  Todo o processo é acompanhado por mensagens claras sobre sucesso, falha ou condição especial (como arquivo ausente), facilitando rastreabilidade, auditoria e manutenção.
- **Design extensível para integração com logs e automação:**  
  A função está pronta para ser conectada ao log centralizado do notebook (Célula 1), garantindo rastreabilidade total de cada operação de commit/push e facilitando integração com webhooks, jobs ou triggers externos.

---

## Parâmetros e variáveis globais utilizados

- **`GITHUB_USER`**, **`GITHUB_REPO`**, **`GITHUB_TOKEN`**: Variáveis globais para autenticação e configuração, definidas nas etapas iniciais do notebook.
- **`repo_dir`**: Caminho absoluto do repositório clonado no ambiente Colab, utilizado como diretório de trabalho para comandos git.
- **`file_paths`**: String (arquivo único) ou lista de strings (múltiplos arquivos), indicando os arquivos a serem commitados e enviados.
- **`commit_message`**: Mensagem de commit, customizável conforme a operação realizada para maximizar a clareza e o histórico de versionamento.

---

## Fluxo operacional detalhado

1. **Validação do repositório local:**  
   Confirma que o diretório do repositório clonado está disponível no ambiente. Caso contrário, aborta a operação com mensagem de erro explícita.
2. **Preparação dos arquivos para commit:**  
   Aceita tanto arquivo único quanto lista. Apenas arquivos que realmente existem são adicionados ao staging, com logs de aviso para ausentes.
3. **Configuração do usuário e e-mail do git:**  
   Garante autoria rastreável e compatível com pipelines automáticos, configurando user/email antes do commit.
4. **Execução do commit (`--allow-empty`):**  
   Realiza o commit das alterações, permitindo commits vazios para garantir continuidade do pipeline quando necessário.
5. **Push autenticado para o repositório remoto:**  
   Usa a URL autenticada via token para enviar as alterações ao repositório GitHub, tornando-as imediatamente disponíveis para o time e sistemas integrados.
6. **Mensagens e tratamento de falhas:**  
   Todo erro ou condição especial (ex: arquivo não encontrado) é logado e apresentado ao usuário, facilitando o diagnóstico e a evolução do pipeline.

---

## Exemplo de uso técnico

```python
# Commit e push de um único arquivo modificado
git_commit_and_push("data/rec.json", "Atualiza rec.json de gravação")

# Commit e push em lote de múltiplos arquivos (ex. posters atualizados)
git_commit_and_push([
    "data/rec.json",
    "posters/user1_poster.jpg",
    "posters/user2_poster.jpg"
], "Batch commit de múltiplos arquivos")
```

---

## Segurança, rastreabilidade e integração contínua

- **Total rastreabilidade:** Mensagens de commit claras e integração recomendada com o log centralizado garantem histórico completo e auditável de todas as operações.
- **Atomicidade:** Commits em lote evitam inconsistências, garantindo que conjuntos de arquivos relacionados sejam versionados juntos.
- **Pronto para CI/CD:** Design compatível com automações, pipelines, webhooks e integrações externas, minimizando intervenção manual e acelerando entregas.
- **Diagnóstico facilitado:** Tratamento de falhas e mensagens detalhadas reduzem tempo de troubleshooting e aumentam a confiabilidade do processo.

---

## Observações e práticas recomendadas

- **A lógica de commit/push foi movida para script externo:**  
  Esta célula serve como referência e documentação da estratégia recomendada. Certifique-se de que seu script externo implementa as validações, mensagens e práticas aqui descritas.
- **Monitore os logs do seu script externo** para garantir que todas as operações sejam executadas corretamente e sem perdas.
- **Mantenha variáveis globais atualizadas** (token, caminhos, etc) para evitar falhas de autenticação ou inconsistências de ambiente.

---

In [None]:
# ================================================================
# Célula 5: Commit e Push Automáticos (rec.json, posters, etc.)
# ================================================================
# Objetivo:
# - Automatizar o processo de commit e push dos arquivos modificados (rec.json, posters, etc.) para o repositório GitHub
# - Suportar tanto commit de arquivo único como em lote, permitindo estratégia de batch commit baseada em thresholds
# - Garantir rastreabilidade, atomicidade e integração segura (CI/CD)
#
# Estratégia aplicada:
# - Função modular e robusta, preparada para integração com logs e auditoria
# - Permite commit vazio por segurança, evitando falhas em pipelines sincronizados
# - Mensagens e tratamento de erros detalhados para facilitar troubleshooting
# - Utilização de variáveis globais para caminhos, usuário e token definidos nas células anteriores
# - Design pronto para evolução, reuso e integração com ferramentas externas (ex: webhooks, jobs, etc.)
# ================================================================

# A lógica de commit e push agora é gerenciada por um script externo.
# Esta célula foi mantida para referência, mas a função git_commit_and_push
# foi removida pois não será mais executada internamente.

# def git_commit_and_push(file_paths, commit_message="Atualiza rec.json"):
#     """
#     Realiza git add, commit e push dos arquivos especificados.
#     - file_paths pode ser uma string (arquivo único) ou uma lista de arquivos.
#     - commit_message é a mensagem de commit utilizada.

#     Estratégia:
#     - Ajusta diretório para o repositório local clonado no Colab
#     - Configura usuário e e-mail do git (necessários para CI/CD)
#     - Adiciona arquivos ao staging (aceita múltiplos arquivos)
#     - Realiza commit (permite commit vazio)
#     - Realiza push autenticado via token
#     """
#     # ============================
#     # VALIDAÇÃO E AJUSTE DE ENTRADAS
#     # ============================
#     repo_dir = f"/content/{GITHUB_REPO}"
#     if not os.path.exists(repo_dir):
#         raise FileNotFoundError(f"Repositório '{repo_dir}' não encontrado. Verifique se a célula de clonagem foi executada.")
#     os.chdir(repo_dir)

#     # Aceita string ou lista de arquivos
#     if isinstance(file_paths, str):
#         file_paths = [file_paths]
#     elif not isinstance(file_paths, list):
#         raise ValueError("file_paths deve ser uma string ou uma lista de caminhos.")

#     # ============================
#     # CONFIGURAÇÃO DO USUÁRIO GIT (CI/CD)
#     # ============================
#     subprocess.run(["git", "config", "user.email", "contato@aserio.work"], check=True)
#     subprocess.run(["git", "config", "user.name", "SamuelPassamani"], check=True)

#     # ============================
#     # ADIÇÃO DOS ARQUIVOS AO STAGING
#     # ============================
#     for file_path in file_paths:
#         # Verifica se o arquivo existe antes de adicionar
#         if not os.path.exists(file_path):
#             print(f"⚠️ Aviso: arquivo '{file_path}' não existe e será ignorado no commit.")
#             continue
#         subprocess.run(["git", "add", file_path], check=True)

#     # ============================
#     # COMMIT (PERMITE COMMIT VAZIO)
#     # ============================
#     try:
#         subprocess.run(
#             ["git", "commit", "-m", commit_message, "--allow-empty"],
#             check=False  # Não força erro se não houver mudanças
#         )
#     except Exception as e:
#         print(f"❌ Erro ao tentar realizar commit: {e}")

#     # ============================
#     # PUSH PARA O REPOSITÓRIO REMOTO (AUTENTICADO)
#     # ============================
#     try:
#         remote_url = f"https://{GITHUB_USER}:{GITHUB_TOKEN}@github.com/{GITHUB_USER}/{GITHUB_REPO}.git"
#         subprocess.run(
#             ["git", "push", remote_url],
#             check=True
#         )
#         print(f"✅ Push realizado com sucesso! ({commit_message})")
#     except Exception as e:
#         print(f"❌ Erro ao tentar realizar push: {e}")

# ============================
# FIM DA CÉLULA 5
# ============================

# Dicas e melhores práticas:
# - A lógica de commit e push agora é gerenciada por um script externo.
# - Certifique-se de que seu script externo gerencie corretamente o commit e push
#   dos arquivos alterados (como o rec.json e os posters).
# - Monitore os logs do seu script externo para verificar o status dos commits e pushes.

# Célula 6: Busca de Transmissões na API XCam com Blacklist, Controle de Falhas e Processamento Centralizados por ID — Log Único

**Objetivo:**  
Automatizar a busca e seleção de transmissões ao vivo na API da XCam utilizando um sistema centralizado de controle de blacklist temporária, falhas e marcação de processamento, todos operando exclusivamente via log único (`xcam_master.log`) e com base no identificador único (`id`) da API.  
Garante máxima rastreabilidade, elimina arquivos dispersos, permite fallback inteligente via `/liveInfo`, e assegura a presença de poster válido para cada transmissão.

---

## Estratégia, arquitetura e diferenciais técnicos

- **Controle total por ID:**  
  Todas as operações de blacklist, contagem de falhas e marcação de processamento (início/fim) são indexadas pelo `id` único do usuário retornado pela API XCam, eliminando ambiguidade e aumentando a precisão no ciclo de vida de cada transmissão.
- **Log único e centralizado:**  
  Toda consulta e alteração de estado (blacklist, falha, processamento, auditoria) é feita via funções utilitárias do log centralizado — `append_log`, `query_logs`, `remove_logs` — eliminando completamente o uso de arquivos dispersos, facilitando CI/CD, rastreabilidade e manutenção.
- **Blacklist e falhas temporárias com expiração automática:**  
  Usuários são bloqueados temporariamente ao atingir o limite de falhas (`BLACKLIST_MAX_FAILURES`), com expiração e remoção automatizadas das entradas antigas para máxima performance e precisão.
- **Fallback automatizado para streams sem src:**  
  Se uma transmissão não possui `src` direto na API principal, o sistema utiliza fallback inteligente via endpoint `/liveInfo`, tentando obter o stream e garantir a cobertura máxima do lote.
- **Poster sempre garantido:**  
  Para cada transmissão, o sistema valida se há poster válido (baixado ou gerado via ffmpeg). Caso contrário, registra falha e pula para o próximo, garantindo consistência visual e integridade para etapas posteriores do pipeline.
- **Execução paralela e pronta para automação:**  
  Funções desenhadas para suportar execução concorrente, integração com pipelines CI/CD, jobs automatizados e auditoria detalhada de todas as ações por timestamp, id, username e status.
- **Design modular e Clean Architecture:**  
  Cada bloco funcional é isolado: controle de blacklist, falha, processamento, busca em lote, busca específica e busca unificada, facilitando manutenção, testes e evolução do sistema.

---

## Descrição técnica das funções principais

- **Funções de Blacklist, Falha e Processamento (todas por id):**
  - `is_in_blacklist(user_id)`: Verifica se o usuário está bloqueado, expira e remove automaticamente as entradas antigas.
  - `add_to_blacklist(user_id, username)`: Adiciona o usuário ao blacklist temporário, registrando evento e detalhes no log.
  - `get_failures(user_id)`: Conta falhas recentes e ignora/expira registros antigos.
  - `register_failure(user_id, username, details)`: Registra falha, promove a blacklist se atingir o limite, limpa registros após blacklisting.
  - `clear_failure(user_id)`: Remove todos os registros de falha do usuário.
  - `is_processing(user_id)`: Verifica se o usuário está marcado como “em processamento ativo”.
  - `mark_processing(user_id, username)`: Marca transmissão como em processamento no log.
  - `unmark_processing(user_id)`: Remove marcação de processamento.
- **Busca de transmissões (com fallback e validação de poster):**
  - `get_broadcasts(limit, ...)`: Retorna lote de transmissões válidas (com poster), respeitando blacklist, falhas, processamento e evitando duplicidades, com fallback para `/liveInfo` e registro detalhado no log.
  - `buscar_usuarios_especificos(usuarios_lista, ...)`: Busca apenas os usuários informados (por username), protegendo por blacklist/falha/processamento e realizando fallback se necessário.
  - `buscar_proxima_transmissao_livre(...)`: Busca a próxima transmissão livre e válida, pronta para processamento imediato, com validação completa e integração ao log único.

---

## Fluxo operacional — passo a passo

1. **Consulta à API XCam:**  
   Obtém lista de transmissões ativas, extrai `id`, `username`, `src` e poster.
2. **Filtragem centralizada:**  
   Elimina transmissões já em processamento, blacklist ou com excesso de falhas, sempre via consulta ao log único e pelo `id`.
3. **Validação e fallback de poster:**  
   Garante que cada transmissão só será considerada se houver poster válido; caso contrário, tenta geração via ffmpeg. Se ainda assim não for possível, registra falha no log e segue para o próximo.
4. **Fallback via liveInfo:**  
   Para transmissões sem src na API principal, executa fallback via `/liveInfo`, tentando maximizar o preenchimento do lote ou encontrar usuários específicos.
5. **Registro e limpeza automáticos:**  
   Toda falha, blacklist ou status de processamento é registrada no log, com limpeza automática de entradas expiradas e atualização por evento.

---

## Exemplos de uso técnico

```python
# Buscar lote completo de transmissões válidas (com blacklist, falha e poster garantidos)
streams = get_broadcasts(limit=LIMIT_DEFAULT)

# Buscar apenas usuários específicos (com proteção centralizada e fallback)
streams_especificos = buscar_usuarios_especificos(["user1", "user2"])

# Buscar a próxima transmissão livre, pronta para processamento (máxima rastreabilidade)
proxima_stream = buscar_proxima_transmissao_livre()
```

---

## Segurança, rastreabilidade e manutenção

- **Rastreabilidade total:**  
  Todos os eventos críticos são registrados no log único, com campos padronizados (`sessao`, `evento`, `id`, `username`, `status`, `detalhes`, `timestamp`).
- **Eliminação de arquivos dispersos:**  
  Não há mais arquivos auxiliares para blacklist, falha, processamento — tudo é centralizado e padronizado.
- **Execução concorrente e CI/CD-ready:**  
  Funções preparadas para paralelismo, automação e integração contínua.
- **Tratamento de erros robusto:**  
  Falhas de API, poster, liveInfo e demais eventos são tratados com exceções, mensagens claras e registro detalhado para auditoria e manutenção.

---

## Recomendações

- Utilize sempre as funções centralizadas para garantir consistência, rastreabilidade e segurança.
- Monitore o log único (`xcam_master.log`) para auditoria, troubleshooting e tuning de parâmetros como timeout e thresholds.
- Adapte os limites e parâmetros conforme o volume de transmissões, mantendo sempre o controle por `id` e log centralizado.

---

In [None]:
# ================================================================
# Célula 6: Busca de Transmissões com Blacklist Temporária e Controle de Falhas Centralizados
# ================================================================
# Objetivo:
# - Buscar transmissões ao vivo na API XCam, considerando blacklist e controle de falhas por usuário, ambos centralizados no log único (xcam_master.log)
# - Evitar loops infinitos e tentativas repetidas em usuários problemáticos via sessões de blacklist/falha no log único
# - Garantir sempre poster válido (via download ou ffmpeg) antes de liberar qualquer transmissão para processamento
# - Modularização robusta, integração total com log único, sem leitura/escrita direta em arquivos dispersos
# - CAPTURAR E USAR O "id" ÚNICO DO USUÁRIO DA API PARA CONTROLE NO LOG
#
# Estratégia aplicada:
# - Toda a lógica de blacklist e falhas opera via funções utilitárias do log centralizado (Célula 1), AGORA USANDO O 'id'
# - Sessões do log: "blacklist" (usuários banidos temporariamente), "failure" (falhas por usuário), "processing" (transmissão em processamento)
# - Cada evento registrado no log contém: sessao, evento, id (AGORA ID ÚNICO DA API), username, status, detalhes, timestamp
# - Não existe mais uso de arquivos como BLACKLIST_PATH, FAILURE_LOG_PATH ou LOG_PROCESSAMENTO_PATH
# ================================================================

# ============================
# FUNÇÕES DE BLACKLIST E FALHAS CENTRALIZADAS NO LOG (AGORA BASEADO EM ID)
# ============================

# As funções abaixo usarão o 'id' do usuário como chave primária para consultar/manipular o log central.

def is_in_blacklist(user_id, now=None):
    """
    Verifica se o usuário (pelo ID) está atualmente na blacklist (sessao='blacklist' e status='blacklisted' e não expirado).
    Remove automaticamente entradas expiradas.
    """
    now = now or time.time()
    # Busca todos eventos atuais de blacklist desse ID de usuário
    entries = query_logs(sessao="blacklist", id=user_id, status="blacklisted")
    for entry in entries:
        ts_log = entry.get("timestamp")
        # timestamp ISO para epoch
        try:
            ts_epoch = datetime.fromisoformat(ts_log.replace("Z", "+00:00")).timestamp() if ts_log else 0
        except ValueError: # Tratar possíveis erros de formato ISO
            ts_epoch = 0
            print(f"⚠️ Aviso: Formato de timestamp inválido no log para entrada blacklist (id: {user_id}): {ts_log}")

        # Verifica expiração
        if now - ts_epoch < BLACKLIST_TIMEOUT:
            return True
        else:
            # Remove entrada expirada (usando id e timestamp para garantir unicidade na remoção)
            removed_count = remove_logs(lambda e: e.get("sessao") == "blacklist" and e.get("id") == user_id and e.get("timestamp") == ts_log)
            # print(f"ℹ️ Removidas {removed_count} entradas de blacklist expiradas para ID {user_id}") # O remove_logs já loga
    return False

def add_to_blacklist(user_id, username):
    """
    Adiciona usuário (pelo ID) à blacklist temporária via log central.
    Registra também o username para referência.
    """
    # Primeiro, limpa entradas antigas de blacklist para este ID (garante que só haja uma ativa)
    remove_logs(lambda e: e.get("sessao") == "blacklist" and e.get("id") == user_id)

    entry = {
        "sessao": "blacklist",
        "evento": "add_blacklist",
        "id": user_id,
        "username": username, # Mantém username para referência
        "status": "blacklisted",
        "detalhes": f"Banido temporariamente por atingir o limite de falhas ({BLACKLIST_MAX_FAILURES})"
    }
    append_log(entry)
    print(f"⚠️ Usuário '{username}' (ID: {user_id}) adicionado à blacklist temporária (registrado no log centralizado).")

def get_failures(user_id):
    """
    Conta o número de falhas registradas para o usuário (pelo ID) (sessao='failure' e status='erro' não expiradas).
    """
    # Busca falhas nos últimos BLACKLIST_TIMEOUT segundos (expira junto com blacklist)
    now = time.time()
    entries = query_logs(sessao="failure", id=user_id, status="erro")
    valid_failures = []
    for entry in entries:
        ts_log = entry.get("timestamp")
        try:
            ts_epoch = datetime.fromisoformat(ts_log.replace("Z", "+00:00")).timestamp() if ts_log else 0
        except ValueError: # Tratar possíveis erros de formato ISO
            ts_epoch = 0
            print(f"⚠️ Aviso: Formato de timestamp inválido no log para entrada failure (id: {user_id}): {ts_log}")

        if now - ts_epoch < BLACKLIST_TIMEOUT:
            valid_failures.append(entry)
        else:
            # Remove entrada expirada (usando id e timestamp para garantir unicidade na remoção)
            removed_count = remove_logs(lambda e: e.get("sessao") == "failure" and e.get("id") == user_id and e.get("timestamp") == ts_log)
            # print(f"ℹ️ Removidas {removed_count} entradas de falha expiradas para ID {user_id}") # O remove_logs já loga
    return len(valid_failures)

def register_failure(user_id, username, details=""):
    """
    Registra uma falha para o usuário (pelo ID). Move para blacklist se exceder o limite.
    Registra também o username para referência.
    """
    # Limpa falhas antigas expiradas antes de adicionar uma nova para este ID
    now = time.time()
    remove_logs(lambda e: e.get("sessao") == "failure" and e.get("id") == user_id and (datetime.fromisoformat(e.get("timestamp","").replace("Z", "+00:00")).timestamp() if e.get("timestamp") else 0) < now - BLACKLIST_TIMEOUT)

    append_log({
        "sessao": "failure",
        "evento": "registrar_falha",
        "id": user_id,
        "username": username, # Mantém username para referência
        "status": "erro",
        "detalhes": details
    })
    failures = get_failures(user_id)
    print(f"❌ Falha registrada para '{username}' (ID: {user_id}). Total de falhas recentes: {failures}/{BLACKLIST_MAX_FAILURES}")

    if failures >= BLACKLIST_MAX_FAILURES:
        add_to_blacklist(user_id, username)
        # Limpa falhas após blacklisting para este ID
        remove_logs(lambda e: e.get("sessao") == "failure" and e.get("id") == user_id)
        print(f"✅ Falhas limpas para ID {user_id} após blacklisting.")


def clear_failure(user_id):
    """
    Limpa todas as falhas registradas para o usuário (pelo ID).
    """
    removed = remove_logs(lambda e: e.get("sessao") == "failure" and e.get("id") == user_id)
    if removed > 0:
        # Podemos adicionar um log de sucesso de limpeza aqui, se necessário
        # append_log({"sessao": "failure", "evento": "limpar_falhas", "id": user_id, "status": "ok", "detalhes": f"{removed} falhas limpas"})
        print(f"✅ {removed} falhas limpas para ID {user_id}.")
    # else:
    #     print(f"ℹ️ Nenhuma falha encontrada para limpar para ID {user_id}.") # remove_logs já loga se nada foi removido


def is_processing(user_id):
    """
    Verifica se o usuário (pelo ID) está marcado como em processamento ativo.
    """
    # Procura por entrada de processamento 'in_progress' para este ID
    entries = query_logs(sessao="processing", id=user_id, status="in_progress")
    return len(entries) > 0

def mark_processing(user_id, username):
    """
    Marca o usuário/transmissão (pelo ID) como em processamento ativo via log central.
    Registra também o username para referência.
    """
    # Remove entradas antigas de processamento para este ID antes de adicionar a nova (garante unicidade)
    remove_logs(lambda e: e.get("sessao") == "processing" and e.get("id") == user_id)

    append_log({
        "sessao": "processing",
        "evento": "iniciar",
        "id": user_id,
        "username": username, # Mantém username para referência
        "status": "in_progress",
        "detalhes": ""
    })
    # print(f"ℹ️ Usuário '{username}' (ID: {user_id}) marcado como 'in_progress' no log.")


def unmark_processing(user_id):
    """
    Remove marcação de processamento ativo para o usuário (pelo ID).
    """
    # Remove entradas de processamento 'in_progress' para este ID
    removed = remove_logs(lambda e: e.get("sessao") == "processing" and e.get("id") == user_id and e.get("status") == "in_progress")
    # if removed > 0:
    #     print(f"ℹ️ Marcação 'in_progress' removida para ID {user_id}.")
    # else:
    #      print(f"ℹ️ Nenhuma marcação 'in_progress' encontrada para remover para ID {user_id}.") # remove_logs já loga se nada foi removido


# ============================
# BUSCA DE TRANSMISSÕES NA API XCAM (AGORA CAPTURANDO O ID E USANDO NO CONTROLE)
# ============================

def get_broadcasts(limit=LIMIT_DEFAULT, page=PAGE_DEFAULT, usuarios_especificos=None, temp_folder="/content"):
    """
    Busca transmissões ao vivo, respeitando blacklist (por ID), falhas (por ID) e log de processamento (por ID) via log centralizado.
    Garante poster válido (download ou ffmpeg) e faz fallback automático.
    RETORNA LISTA DE DICIONÁRIOS INCLUINDO O 'id' DA API.
    """
    # Coleta IDs de usuários atualmente em processamento ou blacklist
    ids_em_proc_ou_blacklist = {e["id"] for e in query_logs(sessao="processing", status="in_progress")} | \
                               {e["id"] for e in query_logs(sessao="blacklist", status="blacklisted")}


    if usuarios_especificos:
        # Note: Buscar por username específico na API e depois filtrar por ID no log é necessário
        # A API principal não parece permitir busca por lista de IDs diretamente
        api_url_main = f"https://api.xcam.gay/?limit={API_SEARCH_LIMIT}&page=1" # Ainda busca um lote grande para encontrar específicos
        print(f"🌐 Acessando API principal (buscando usuários específicos) em: {api_url_main}")
    else:
        # Busca um lote grande para ter mais chances de encontrar usuários disponíveis
        api_url_main = f"https://api.xcam.gay/?limit=3333"
        print(f"🌐 Acessando API principal (buscando todas transmissões online) em: {api_url_main}")

    streams_candidates = [] # streams que tem src ou que precisam de liveInfo
    streams_without_preview = [] # streams sem src na API principal

    try:
        response_main = requests.get(api_url_main)
        response_main.raise_for_status()
        data_main = response_main.json()
        broadcasts_data = data_main.get("broadcasts")
        if not broadcasts_data:
            print("⚠️ Chave 'broadcasts' não encontrada na resposta da API principal.")
            return []
        items = broadcasts_data.get("items")
        if not isinstance(items, list):
            print(f"⚠️ Chave 'items' não encontrada ou não é uma lista em 'broadcasts'.")
            return []

        print(f"API principal retornou {len(items)} transmissões.")

        for item in items:
            # ** CAPTURA O ID AQUI **
            user_id = str(item.get("id")) # Garante que o ID seja string
            username = item.get("username", "desconhecido")
            preview = item.get("preview") or {}
            src = preview.get("src")
            poster = preview.get("poster")

            # Ignora se já está em processamento ou blacklist (AGORA VERIFICA PELO ID)
            if user_id in ids_em_proc_ou_blacklist:
                # print(f"ℹ️ Usuário '{username}' (ID: {user_id}) já processado/em blacklist/processing, ignorando.")
                continue

            # Ignora se está buscando específicos e este usuário/ID não está na lista
            if usuarios_especificos and username not in usuarios_especificos: # Continua filtrando por username se especificado
                 # Poderíamos também adicionar uma lista de IDs específicos, se a API permitisse buscar por ID.
                continue

            stream_info = {
                 "id": user_id, # Inclui o ID
                 "username": username,
                 "src": src,
                 "poster": poster # Isso pode ser URL ou None
            }

            if src:
                streams_candidates.append(stream_info) # Adiciona streams com src para processar/validar poster
            else:
                 streams_without_preview.append(stream_info) # Adiciona streams sem src para tentar liveInfo

        print(f"✅ {len(streams_candidates)} transmissões com URL na API principal, {len(streams_without_preview)} sem URL.")

    except Exception as e:
        print(f"❌ Erro ao acessar API principal: {e}")
        # Registrar erro de busca no log
        if "append_log" in globals():
             append_log({
                 "sessao": "busca",
                 "evento": "erro_api_principal",
                 "id": "global", # Erro global de API
                 "username": "global",
                 "status": "erro",
                 "detalhes": f"Erro ao acessar API principal: {e}"
             })
        return [] # Retorna vazio em caso de erro na API principal

    # Fallback: busca via liveInfo para streams sem URL na API principal
    streams_from_liveinfo = []
    if streams_without_preview:
        print(f"🔁 Buscando liveInfo para {len(streams_without_preview)} streams sem URL na API principal...")
        for stream_info in streams_without_preview:
            user_id = stream_info["id"] # Usa o ID capturado
            username = stream_info["username"]

            # Verifica novamente se entrou em proc/blacklist enquanto processávamos a lista
            if user_id in ids_em_proc_ou_blacklist:
                 # print(f"ℹ️ Usuário '{username}' (ID: {user_id}) já processado/em blacklist/processing durante fallback, ignorando.")
                 continue

            api_url_liveinfo = f"https://api.xcam.gay/user/{username}/liveInfo" # LiveInfo ainda usa username na URL
            try:
                response_liveinfo = requests.get(api_url_liveinfo)
                response_liveinfo.raise_for_status()
                data_liveinfo = response_liveinfo.json()
                m3u8_url = data_liveinfo.get("cdnURL") or data_liveinfo.get("edgeURL")
                if m3u8_url:
                    # Adiciona stream encontrada via liveInfo aos candidatos
                    streams_from_liveinfo.append({
                        "id": user_id, # Inclui o ID
                        "username": username,
                        "src": m3u8_url,
                        "poster": None # Poster do liveInfo geralmente não é direto, será gerado
                    })
                else:
                    print(f"⚠️ liveInfo de '{username}' (ID: {user_id}) não retornou cdnURL/edgeURL (usuário possivelmente offline).")
                    # Registrar falha no liveInfo no log (AGORA USA ID)
                    if "register_failure" in globals():
                         register_failure(user_id, username, "liveInfo sem cdnURL/edgeURL.")

            except Exception as ex:
                print(f"❌ Erro ao buscar liveInfo para '{username}' (ID: {user_id}): {ex}")
                 # Registrar erro de liveInfo no log (AGORA USA ID)
                if "register_failure" in globals():
                     register_failure(user_id, username, f"Erro ao buscar liveInfo: {ex}")

            time.sleep(0.2) # Pequeno delay entre chamadas de liveInfo

    # Junta candidatos da API principal e liveInfo.
    # Antes de adicionar à lista final, valida poster e evita duplicidade/blacklist FINAL.
    final_streams_list = []
    seen_ids = set() # Usa um set de IDs para controlar duplicidade na lista final
    all_candidates = streams_candidates + streams_from_liveinfo

    print(f"Validando poster e filtrando {len(all_candidates)} candidatos...")

    for stream in all_candidates:
        user_id = stream["id"]
        username = stream["username"]
        src = stream["src"]
        poster_info = stream["poster"] # Pode ser URL ou None

        # Verifica pela ÚLTIMA VEZ se o ID já foi adicionado à lista final,
        # ou se entrou em processamento/blacklist desde a consulta inicial da API.
        if user_id in seen_ids or user_id in ids_em_proc_ou_blacklist:
            continue

        poster_path = None
        try:
            # Tenta baixar poster original se existir
            if poster_info and isinstance(poster_info, str) and poster_info.strip():
                poster_path = download_and_save_poster(poster_info, username, temp_folder) # download_and_save_poster não precisa de ID

            # Se poster baixado for inválido OU não havia poster original, gera com ffmpeg
            if not is_poster_valid(poster_path):
                poster_path = generate_poster_with_ffmpeg(src, username, temp_folder) # generate_poster_with_ffmpeg não precisa de ID

            # Se mesmo após todas as tentativas o poster for inválido
            if not is_poster_valid(poster_path):
                # Registrar falha de poster no log (AGORA USA ID)
                if "register_failure" in globals():
                     register_failure(user_id, username, "Poster inválido após todas tentativas.")
                continue # Pula para o próximo stream se o poster for inválido

            # Se o poster é válido, limpa falhas relacionadas a poster/ffmpeg/conexão para este ID
            if "clear_failure" in globals():
                 clear_failure(user_id) # Limpa falhas pelo ID

            # Adiciona à lista final e marca ID como visto
            final_streams_list.append({
                "id": user_id, # Inclui o ID único no resultado final
                "username": username,
                "src": src,
                "poster_path": poster_path # Passa o caminho LOCAL do poster válido
            })
            seen_ids.add(user_id)

            # Quebra o loop se atingiu o limite desejado
            if len(final_streams_list) >= limit:
                break

        except Exception as e:
            msg = f"Falha inesperada durante validação de poster/stream para '{username}' (ID: {user_id}): {e}"
            print(f"❌ {msg}")
            # Registrar falha genérica no log (AGORA USA ID)
            if "register_failure" in globals():
                 register_failure(user_id, username, msg)


    print(f"🔎 Selecionadas {len(final_streams_list)} streams válidas (com poster) após fallback (respeitando limit={limit}).")
    return final_streams_list

# ============================
# BUSCA DE USUÁRIOS ESPECÍFICOS (AGORA COM ID)
# ============================

def buscar_usuarios_especificos(usuarios_lista, temp_folder="/content"):
    """
    Busca usuários específicos via API (por username), agora respeitando blacklist (por ID)
    e controle de falhas (por ID) via log central. Inclui fallback via liveInfo e valida poster.
    RETORNA LISTA DE DICIONÁRIOS INCLUINDO O 'id' DA API.
    """
    # Coleta IDs de usuários em processamento ou blacklist
    ids_em_proc_ou_blacklist = {e["id"] for e in query_logs(sessao="processing", status="in_progress")} | \
                               {e["id"] for e in query_logs(sessao="blacklist", status="blacklisted")}

    # Primeiro, tenta encontrar os usuários na lista na API principal (limite alto para pegar todos se online)
    api_url = f"https://api.xcam.gay/?limit={API_SEARCH_LIMIT}&page=1"
    print(f"🔍 Buscando usuários específicos ({len(usuarios_lista)}) em {api_url}")
    found_candidates = []
    users_not_found_in_main = set(usuarios_lista) # Acompanha quem não foi encontrado na API principal

    try:
        response = requests.get(api_url)
        response.raise_for_status()
        data = response.json()
        items = data.get("broadcasts", {}).get("items", [])

        for item in items:
            user_id = str(item.get("id")) # ** CAPTURA O ID **
            username = item.get("username", "")

            if username in usuarios_lista: # Verifica se este é um dos usuários que procuramos
                 users_not_found_in_main.discard(username) # Remove da lista de não encontrados

                 # Verifica se o ID está em proc/blacklist (AGORA VERIFICA PELO ID)
                 if user_id in ids_em_proc_ou_blacklist:
                     # print(f"ℹ️ Usuário '{username}' (ID: {user_id}) já processado/em blacklist/processing, ignorando.")
                     continue

                 preview = item.get("preview") or {}
                 src = preview.get("src")
                 poster = preview.get("poster") # Pode ser URL ou None

                 if src:
                     # Adiciona como candidato se tiver SRC (validação de poster depois)
                     found_candidates.append({
                         "id": user_id, # Inclui o ID
                         "username": username,
                         "src": src,
                         "poster": poster # Pode ser URL ou None
                     })
                 else:
                     # Marca para tentar via liveInfo se não tiver SRC principal
                     # Adiciona a lista de streams_without_preview para liveinfo fallback
                     found_candidates.append({
                        "id": user_id, # Inclui o ID
                        "username": username,
                        "src": None, # Indica que precisa de liveInfo
                        "poster": None
                    })


        print(f"Encontrados {len(found_candidates)} dos {len(usuarios_lista)} usuários especificados na API principal (antes de fallback).")

    except Exception as e:
        print(f"❌ Erro ao buscar usuários específicos na API principal: {e}")
        # Registrar erro de busca no log (AGORA USA ID ou Global)
        if "append_log" in globals():
             append_log({
                 "sessao": "busca",
                 "evento": "erro_api_especificos",
                 "id": "global", # Erro global de API
                 "username": "global",
                 "status": "erro",
                 "detalhes": f"Erro ao buscar usuários específicos na API principal: {e}"
             })
        # Em caso de erro na API principal, tenta buscar cada usuário individualmente via liveInfo?
        # Para simplificar, se a API principal falha, retornamos o que conseguimos ou vazio.
        # Se o erro é grave, talvez não haja mais o que fazer.

    # Fallback: busca via liveInfo para usuários especificados que não tinham SRC na API principal
    streams_from_liveinfo = []
    # Filtra os candidatos que precisam de liveInfo
    candidates_for_liveinfo = [c for c in found_candidates if c.get("src") is None]
    # Adiciona usuários que NÃO foram encontrados na API principal mas estavam na lista original
    # Assume que se não foi encontrado na lista grande da API principal, está offline ou precisa de liveInfo direto
    # Isso pode gerar falsos positivos se o usuário estiver offline
    for uname in users_not_found_in_main:
        # Tenta obter o ID antes de tentar liveInfo? LiveInfo não retorna ID...
        # Se o usuário não foi encontrado na API principal (com limite alto), é provável que esteja offline.
        # Buscar liveInfo sem ter um ID é menos robusto.
        # Vamos focar no fallback APENAS para usuários ENCONTRADOS na API principal mas sem SRC.
        # Se o usuário da lista específica não apareceu na busca grande, assumimos offline por enquanto.
        print(f"⚠️ Usuário '{uname}' especificado não encontrado na busca da API principal. Assumindo offline ou inacessível.")


    if candidates_for_liveinfo:
        print(f"🔁 Buscando liveInfo para {len(candidates_for_liveinfo)} usuários específicos sem URL na API principal...")
        for stream_info in candidates_for_liveinfo:
            user_id = stream_info["id"] # Usa o ID capturado da API principal
            username = stream_info["username"]

            # Verifica novamente se entrou em proc/blacklist
            if user_id in ids_em_proc_ou_blacklist:
                 # print(f"ℹ️ Usuário '{username}' (ID: {user_id}) já processado/em blacklist/processing durante fallback, ignorando.")
                 continue

            api_url_liveinfo = f"https://api.xcam.gay/user/{username}/liveInfo"
            try:
                response_liveinfo = requests.get(api_url_liveinfo)
                response_liveinfo.raise_for_status()
                data_liveinfo = response_liveinfo.json()
                m3u8_url = data_liveinfo.get("cdnURL") or data_liveinfo.get("edgeURL")
                if m3u8_url:
                    # Adiciona stream encontrada via liveInfo
                    streams_from_liveinfo.append({
                        "id": user_id, # Inclui o ID
                        "username": username,
                        "src": m3u8_url,
                        "poster": None # Poster do liveInfo geralmente não é direto, será gerado
                    })
                else:
                    print(f"⚠️ liveInfo de '{username}' (ID: {user_id}) não retornou cdnURL/edgeURL (usuário possivelmente offline).")
                    # Registrar falha no liveInfo no log (AGORA USA ID)
                    if "register_failure" in globals():
                         register_failure(user_id, username, "liveInfo sem cdnURL/edgeURL.")

            except Exception as ex:
                print(f"❌ Erro ao buscar liveInfo para '{username}' (ID: {user_id}): {ex}")
                # Registrar erro de liveInfo no log (AGORA USA ID)
                if "register_failure" in globals():
                     register_failure(user_id, username, f"Erro ao buscar liveInfo: {ex}")

            time.sleep(0.2) # Pequeno delay

    # Junta candidatos que tinham SRC e os encontrados via liveInfo.
    # Antes de adicionar à lista final, valida poster e evita duplicidade/blacklist FINAL.
    final_streams_list = []
    seen_ids = set() # Usa um set de IDs para controlar duplicidade na lista final
    # Filtra os candidatos que TINHAM SRC na API principal
    candidates_with_src = [c for c in found_candidates if c.get("src") is not None]
    all_candidates_post_fallback = candidates_with_src + streams_from_liveinfo

    print(f"Validando poster e filtrando {len(all_candidates_post_fallback)} candidatos após fallback...")


    for stream in all_candidates_post_fallback:
        user_id = stream["id"]
        username = stream["username"]
        src = stream["src"]
        poster_info = stream["poster"] # Pode ser URL ou None

        # Verifica pela ÚLTIMA VEZ se o ID já foi adicionado à lista final,
        # ou se entrou em processamento/blacklist desde a consulta inicial.
        if user_id in seen_ids or user_id in ids_em_proc_ou_blacklist:
            continue

        poster_path = None
        try:
            # Tenta baixar poster original se existir
            if poster_info and isinstance(poster_info, str) and poster_info.strip():
                poster_path = download_and_save_poster(poster_info, username, temp_folder)

            # Se poster baixado for inválido OU não havia poster original, gera com ffmpeg
            if not is_poster_valid(poster_path):
                poster_path = generate_poster_with_ffmpeg(src, username, temp_folder)

            # Se mesmo após todas as tentativas o poster for inválido
            if not is_poster_valid(poster_path):
                 # Registrar falha de poster no log (AGORA USA ID)
                if "register_failure" in globals():
                     register_failure(user_id, username, "Poster inválido após todas tentativas.")
                continue # Pula para o próximo stream

            # Se o poster é válido, limpa falhas relacionadas a poster/ffmpeg/conexão para este ID
            if "clear_failure" in globals():
                 clear_failure(user_id) # Limpa falhas pelo ID

            # Adiciona à lista final e marca ID como visto
            final_streams_list.append({
                "id": user_id, # Inclui o ID único no resultado final
                "username": username,
                "src": src,
                "poster_path": poster_path # Passa o caminho LOCAL do poster válido
            })
            seen_ids.add(user_id)

            # No modo específico, buscamos todos da lista, então não há limite de "len(final_streams_list) >= limit" aqui.
            # Poderíamos adicionar um limite se quiséssemos parar após encontrar N dos específicos.

        except Exception as e:
            msg = f"Falha inesperada durante validação de poster/stream para '{username}' (ID: {user_id}): {e}"
            print(f"❌ {msg}")
            # Registrar falha genérica no log (AGORA USA ID)
            if "register_failure" in globals():
                 register_failure(user_id, username, msg)

    print(f"🔎 Encontrados e validados {len(final_streams_list)} dos {len(usuarios_lista)} usuários especificados.")
    return final_streams_list


# ============================
# BUSCA DA PRÓXIMA TRANSMISSÃO DISPONÍVEL (AGORA COM ID)
# ============================

def buscar_proxima_transmissao_livre(temp_folder="/content"):
    """
    Busca a próxima transmissão ao vivo não processada, com poster válido e ignorando blacklist (por ID), tudo centralizado no log.
    RETORNA DICIONÁRIO INCLUINDO O 'id' DA API, OU None.
    """
    # Coleta IDs de usuários em processamento ou blacklist
    ids_em_proc_ou_blacklist = {e["id"] for e in query_logs(sessao="processing", status="in_progress")} | \
                               {e["id"] for e in query_logs(sessao="blacklist", status="blacklisted")}


    api_url_main = f"https://api.xcam.gay/?limit=3333&page=1" # Busca um lote grande para encontrar o próximo rápido
    print(f"🔎 Buscando próxima transmissão livre em: {api_url_main}")
    try:
        response_main = requests.get(api_url_main)
        response_main.raise_for_status()
        data_main = response_main.json()
        items = data_main.get("broadcasts", {}).get("items", [])
        print(f"API principal retornou {len(items)} transmissões.")

        # Primeiro, itera sobre os itens da API principal que têm SRC
        for item in items:
            # ** CAPTURA O ID AQUI **
            user_id = str(item.get("id")) # Garante que o ID seja string
            username = item.get("username", "desconhecido")
            preview = item.get("preview") or {}
            src = preview.get("src")
            poster_info = preview.get("poster") # Pode ser URL ou None

            # Ignora se já está em processamento ou blacklist (AGORA VERIFICA PELO ID)
            if user_id in ids_em_proc_ou_blacklist:
                # print(f"ℹ️ Usuário '{username}' (ID: {user_id}) já processado/em blacklist/processing, ignorando.")
                continue

            if src:
                 # Se tem SRC e não está em proc/blacklist, valida poster
                poster_path = None
                try:
                    # Tenta baixar poster original se existir
                    if poster_info and isinstance(poster_info, str) and poster_info.strip():
                        poster_path = download_and_save_poster(poster_info, username, temp_folder)

                    # Se poster baixado for inválido OU não havia poster original, gera com ffmpeg
                    if not is_poster_valid(poster_path):
                        poster_path = generate_poster_with_ffmpeg(src, username, temp_folder)

                    # Se o poster é válido, limpa falhas relacionadas a poster/ffmpeg/conexão e retorna
                    if is_poster_valid(poster_path):
                        if "clear_failure" in globals():
                             clear_failure(user_id) # Limpa falhas pelo ID
                        print(f"🎯 Transmissão livre encontrada: '{username}' (ID: {user_id})")
                        return {
                            "id": user_id, # Inclui o ID único no resultado
                            "username": username,
                            "src": src,
                            "poster_path": poster_path # Passa o caminho LOCAL do poster válido
                        }
                    else:
                         # Se poster inválido, registra falha e continua buscando
                         if "register_failure" in globals():
                             register_failure(user_id, username, "Poster inválido após todas tentativas (busca próxima).")
                         continue # Pula para o próximo item

                except Exception as e:
                    msg = f"Falha inesperada durante validação de poster/stream para '{username}' (ID: {user_id}) na busca próxima: {e}"
                    print(f"❌ {msg}")
                    # Registrar falha genérica no log (AGORA USA ID)
                    if "register_failure" in globals():
                         register_failure(user_id, username, msg)
                    continue # Pula para o próximo item


        # Se chegou aqui, nenhum item com SRC foi encontrado/validado na busca grande.
        # Agora, itera sobre os itens sem SRC para tentar liveInfo
        print("Nenhuma transmissão livre com SRC encontrada, tentando liveInfo para os demais...")
        for item in items:
             user_id = str(item.get("id")) # ** CAPTURA O ID **
             username = item.get("username", "desconhecido")
             preview = item.get("preview") or {}
             src = preview.get("src") # Re-verifica SRC

             # Ignora se tem SRC (já processado acima) ou se já está em proc/blacklist
             if src or user_id in ids_em_proc_ou_blacklist:
                  continue

             # Se não tem SRC e não está em proc/blacklist, tenta liveInfo
             api_url_liveinfo = f"https://api.xcam.gay/user/{username}/liveInfo"
             try:
                 response_liveinfo = requests.get(api_url_liveinfo)
                 response_liveinfo.raise_for_status()
                 data_liveinfo = response_liveinfo.json()
                 m3u8_url = data_liveinfo.get("cdnURL") or data_liveinfo.get("edgeURL")
                 if m3u8_url:
                      # Se encontrou URL via liveInfo, valida poster e retorna
                      poster_path = generate_poster_with_ffmpeg(m3u8_url, username, temp_folder)

                      if is_poster_valid(poster_path):
                           if "clear_failure" in globals():
                                clear_failure(user_id) # Limpa falhas pelo ID
                           print(f"🎯 Transmissão livre (pelo liveInfo) encontrada: '{username}' (ID: {user_id})")
                           return {
                               "id": user_id, # Inclui o ID único no resultado
                               "username": username,
                               "src": m3u8_url,
                               "poster_path": poster_path # Passa o caminho LOCAL do poster válido
                           }
                      else:
                           # Se poster inválido, registra falha e continua buscando
                           if "register_failure" in globals():
                                register_failure(user_id, username, "Poster inválido (busca próxima liveInfo).")
                           continue # Pula para o próximo item
                 else:
                      print(f"⚠️ liveInfo de '{username}' (ID: {user_id}) não retornou cdnURL/edgeURL.")
                      # Registrar falha no liveInfo no log (AGORA USA ID)
                      if "register_failure" in globals():
                           register_failure(user_id, username, "liveInfo sem cdnURL/edgeURL (busca próxima).")


             except Exception as ex:
                 msg = f"Erro ao buscar liveInfo para '{username}' (ID: {user_id}) na busca próxima: {ex}"
                 print(f"❌ {msg}")
                 # Registrar erro de liveInfo no log (AGORA USA ID)
                 if "register_failure" in globals():
                      register_failure(user_id, username, msg)

             time.sleep(0.2) # Pequeno delay


        # Se nenhum stream foi encontrado/validado após varrer toda a lista da API (com SRC e liveInfo)
        print("🚫 Nenhuma transmissão livre encontrada após varrer todas online.")
        return None # Retorna None se nenhum stream livre foi encontrado após todas as tentativas

    except Exception as e:
        msg = f"❌ Erro ao buscar transmissões online (busca próxima): {e}"
        print(f"❌ {msg}")
        # Registrar erro de busca no log (AGORA USA ID ou Global)
        if "append_log" in globals():
             append_log({
                 "sessao": "busca",
                 "evento": "erro_api_proxima",
                 "id": "global", # Erro global de API
                 "username": "global",
                 "status": "erro",
                 "detalhes": msg
             })
        return None # Retorna None em caso de erro na API

# ================================================================
# FIM DA CÉLULA 6 — BUSCA, BLACKLIST E CONTROLE DE FALHAS CENTRALIZADOS (AGORA COM ID)
# ================================================================

# Observações:
# - Toda manipulação de blacklist, falha e processamento agora é feita via funções do log centralizado (Célula 1), USANDO O ID ÚNICO DA API.
# - O username é mantido nos registros de log para referência humana, mas a lógica de controle se baseia no 'id'.
# - Nenhum uso de arquivos dispersos. Consultas e remoções são sempre via query_logs, append_log, remove_logs.
# - Para máxima rastreabilidade, todos os eventos relevantes estão registrados no log único.

# Célula 7: Gravação Automática de Transmissão, Log Centralizado por ID, Limpeza e Blacklist Inteligente

**Objetivo:**  
Automatizar a gravação de transmissões ao vivo usando ffmpeg, com controle rigoroso e centralizado de status, falhas, blacklist temporária e limpeza de recursos via log único (`xcam_master.log`), utilizando sempre o identificador único (`id`) da API XCam para rastreabilidade.  
Esta célula garante gerenciamento seguro do processamento, tratamento automático de falhas, integração com blacklist escalonável e limpeza completa de arquivos temporários, pronta para execução concorrente, CI/CD e auditoria.

---

## Estratégia técnica e diferenciais implementados

- **Controle centralizado e seguro por ID:**  
  O usuário é registrado no log centralizado (`sessao="processing"`, `status="in_progress"`) com seu `id` único antes do início da gravação, e removido ao final (sucesso ou erro), prevenindo duplicidade e concorrência indevida. Todos os eventos (início, erro, exceção, duração insuficiente, sucesso, limpeza) são registrados com rastreabilidade completa.
- **Poster sempre garantido:**  
  O sistema tenta baixar o poster informado. Se ausente ou inválido, gera automaticamente uma imagem via ffmpeg, garantindo que toda transmissão processada tenha um poster válido associado.
- **Validação robusta da gravação:**  
  Após a execução do ffmpeg, a duração real do vídeo é aferida com ffprobe. Se o arquivo for muito curto ou inválido, tanto o vídeo quanto o poster são descartados, e uma falha é registrada para o usuário no log, escalando para blacklist temporária se necessário.
- **Tratamento e escalonamento de falhas:**  
  Falhas de ffmpeg, duração insuficiente, ou outras exceções são registradas no log central por id. O usuário é automaticamente escalonado para a blacklist temporária ao atingir o limite de falhas (`BLACKLIST_MAX_FAILURES`), protegendo o pipeline contra tentativas repetidas e recursos desperdiçados.
- **Limpeza automatizada de recursos:**  
  Qualquer arquivo temporário (vídeo, poster) é removido logo após o upload ou erro, mantendo o ambiente limpo e evitando acúmulo de resíduos no Colab.
- **Feedback detalhado e rastreabilidade:**  
  Todas as etapas críticas são logadas e exibidas em tempo real no console, e o log único pode ser consultado para auditoria, troubleshooting ou integração CI/CD.
- **Modularidade e documentação detalhada:**  
  O código é segmentado em blocos lógicos, com comentários explicativos, facilitando manutenção, revisão e evolução pela equipe.

---

## Fluxo operacional detalhado

1. **Registra o usuário no log central (processing/in_progress)**, por id, antes de iniciar a gravação.
2. **Garante poster válido**, baixando ou gerando automaticamente.
3. **Executa ffmpeg** para gravar a transmissão, monitora o progresso e exibe logs em tempo real.
4. **Valida a gravação**:
   - Se ffmpeg falhar, registra erro no log e incrementa contador de falhas do usuário (por id).
   - Se a gravação for curta demais, descarta vídeo/poster e registra falha.
   - Se sucesso, limpa contador de falhas e registra evento positivo.
5. **Upload e integração externa:**  
   Realiza upload do vídeo (e poster) e atualiza o banco de dados, logando sucesso ou erro.
6. **Limpeza e finalização:**  
   Remove a marcação de processamento do usuário (por id) no log central e apaga arquivos temporários, registrando todos os eventos de limpeza.

---

## Exemplo de uso técnico

```python
resultado = gravar_stream(
    user_id="123456",
    username="user123",
    m3u8_url="https://cdn.xcam.gay/m3u8/...",
    poster_url="https://api.xcam.gay/poster/..."
)
if resultado['upload_success']:
    print("Gravação e upload realizados com sucesso!")
else:
    print("Falha na gravação ou upload:", resultado['abyss_response'])
```

---

## Segurança, rastreabilidade e integração

- **Execução concorrente e pronta para CI/CD:**  
  O controle centralizado por id e blacklist temporária garante execução paralela segura e rastreável em pipelines automatizados.
- **Integração total com as funções globais do log:**  
  Utiliza as funções de status, falha e blacklist da Célula 6, dispensando arquivos auxiliares e promovendo padronização.
- **Auditoria e diagnóstico facilitados:**  
  Mensagens e logs detalhados em cada etapa, todos centralizados no log único (`xcam_master.log`), prontos para consulta, auditoria ou troubleshooting.

---

## Observações técnicas

- Toda manipulação de status, falha, blacklist e processamento é feita exclusivamente via funções do log centralizado, sempre por id.
- A arquitetura é preparada para paralelismo, manutenção e evolução do pipeline, protegendo contra duplicidade e inconsistência.
- O sistema garante que nenhum usuário problemático trave o pipeline, graças ao escalonamento automatizado para blacklist temporária.

---

In [None]:
# ================================================================
# Célula 7: Gravação Automática de Transmissão, Controle de Log Centralizado, Limpeza e Blacklist Inteligente (AGORA USANDO ID)
# ================================================================
# Objetivo:
# - Gravar transmissões ao vivo utilizando ffmpeg, com controle rigoroso e centralizado de log de processamento, tratamento de falhas e integração com blacklist temporária (log único).
# - Garantir que cada transmissão seja registrada no log central no início e removida ao final (sucesso ou erro), evitando duplicidade/processamento concorrente (sessao="processing").
# - Registrar falhas (ffmpeg, duração insuficiente, poster inválido), escalando usuários para a blacklist temporária via log central ao atingir o limite de tentativas, AGORA USANDO O ID.
# - Assegurar limpeza robusta de arquivos temporários e rastreabilidade total via eventos no log único e mensagens detalhadas.
# - Modular, preparado para integração com pipelines CI/CD, paralelismo e auditoria centralizada.
# ================================================================

def get_video_duration(filepath):
    """
    Retorna a duração real do arquivo mp4, em segundos, utilizando ffprobe.
    Retorna None em caso de erro ou se o arquivo não existir.
    """
    try:
        if not os.path.exists(filepath):
            print(f"⚠️ Arquivo para ffprobe não encontrado: {filepath}")
            return None
        cmd = [
            "ffprobe", "-v", "error",
            "-show_entries", "format=duration",
            "-of", "json",
            filepath
        ]
        result = subprocess.run(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE, text=True)
        info = json.loads(result.stdout)
        duration = float(info["format"]["duration"])
        return int(round(duration))
    except Exception as e:
        print(f"⚠️ Não foi possível obter duração via ffprobe para {filepath}: {e}")
        return None

# Adicionando user_id como parâmetro
def gravar_stream(user_id, username, m3u8_url, poster_url=None, poster_frame_time=7):
    """
    Grava a transmissão ao vivo do usuário (pelo ID) usando ffmpeg, com controle de erros, log centralizado e integração à blacklist.
    - Registra no log centralizado (sessao="processing") no início (status="in_progress"), USANDO O ID.
    - Remove do log ao finalizar, independentemente do resultado, USANDO O ID.
    - Em caso de falha do ffmpeg ou gravação muito curta, registra falha do usuário no log (sessao="failure"), USANDO O ID.
    - Ao atingir N falhas consecutivas, usuário entra na blacklist (funções de log centralizado), USANDO O ID.
    - Limpa arquivos temporários ao final.
    - Garante poster válido: baixa da poster_url ou gera automaticamente com ffmpeg.
    - poster_frame_time: segundo do vídeo onde a captura do poster será feita, se necessário.
    """
    # --- Registro no log centralizado: PROCESSAMENTO INICIADO (USANDO ID) ---
    # As funções mark_processing, unmark_processing, register_failure, clear_failure
    # na Célula 6 já foram ajustadas para aceitar e usar user_id.
    mark_processing(user_id, username) # Passa user_id e username

    start_time_dt = datetime.now()
    data_str = start_time_dt.strftime("%d-%m-%Y")
    horario_str = start_time_dt.strftime("%H-%M")
    temp_filename = f"{username}_{start_time_dt.strftime('%Y%m%d_%H%M%S')}_temp.mp4"
    filepath = os.path.join(TEMP_OUTPUT_FOLDER, temp_filename)
    append_log({
        "sessao": "processing",
        "evento": "iniciar_gravacao",
        "id": user_id, # Usa o ID
        "username": username,
        "status": "in_progress",
        "detalhes": f"Gravação iniciada para '{username}' (ID: {user_id}) em {filepath}" # Adiciona ID nos detalhes
    })

    print(f"\n🎬 Iniciando gravação de: '{username}' (ID: {user_id}) | URL: {m3u8_url}) em {filepath}") # Adiciona ID no print

    # --- Garante poster válido ---
    # As funções de poster (download_and_save_poster, generate_poster_with_ffmpeg)
    # não precisam do ID para funcionar, apenas o username para o nome do arquivo temporário.
    poster_temp_path = None
    if poster_url:
        poster_temp_path = download_and_save_poster(poster_url, username, TEMP_OUTPUT_FOLDER)
    # generate_poster_with_ffmpeg já foi ajustada na Célula 3 para usar a tupla de tries correta
    if not is_poster_valid(poster_temp_path) and m3u8_url:
        poster_temp_path = generate_poster_with_ffmpeg(m3u8_url, username, TEMP_OUTPUT_FOLDER, frame_time=poster_frame_time)


    ffmpeg_cmd = [
        "ffmpeg", "-i", m3u8_url,
        "-t", str(RECORD_SECONDS),
        "-c", "copy", "-y", filepath
    ]

    start_time_process = time.time()
    process = None

    try:
        process = subprocess.Popen(
            ffmpeg_cmd,
            stdout=subprocess.PIPE,
            stderr=subprocess.STDOUT,
            text=True,
            bufsize=1,
            universal_newlines=True
        )

        # --- Monitoramento de progresso do ffmpeg (logs em tempo real) ---
        # log_progress usa apenas username
        elapsed_seconds = 0
        last_log_minute = -1
        while True:
            line = process.stdout.readline()
            if not line and process.poll() is not None:
                break
            if "time=" in line:
                try:
                    match = re.search(r"time=(\d+):(\d+):(\d+)", line)
                    if match:
                        h, m, s = map(int, match.groups())
                        elapsed_seconds = h * 3600 + m * 60 + s
                        if elapsed_seconds // 60 != last_log_minute:
                            log_progress(username, elapsed_seconds, RECORD_SECONDS)
                            last_log_minute = elapsed_seconds // 60
                except Exception:
                    pass

        process.wait()
        end_time_process = time.time()
        elapsed_seconds_proc = round(end_time_process - start_time_process)
        log_progress(username, elapsed_seconds_proc, RECORD_SECONDS)

        # --- Se FFmpeg falhou, registra no log central e retorna erro (USANDO ID) ---
        if process.returncode != 0:
            msg = f"FFmpeg falhou para '{username}' (ID: {user_id}). Código de saída: {process.returncode}" # Adiciona ID na mensagem
            print(f"❌ {msg}")
            append_log({
                "sessao": "processing",
                "evento": "erro_ffmpeg",
                "id": user_id, # Usa o ID
                "username": username,
                "status": "erro",
                "detalhes": msg
            })
            register_failure(user_id, username, "Erro FFmpeg") # Passa user_id e username
            return {
                'user_id': user_id, # Inclui user_id no resultado
                'username': username,
                'filename': temp_filename,
                'filepath': filepath,
                'upload_success': False,
                'abyss_response': msg
            }

        # --- Validação pelo tempo real do arquivo gravado (robusta) ---
        elapsed_seconds_real = get_video_duration(filepath)
        if elapsed_seconds_real is not None:
            print(f"✅ Duração real do arquivo gravado: {elapsed_seconds_real}s (ffprobe)")
        else:
            print(f"⚠️ Não foi possível aferir duração real, usando a do processo: {elapsed_seconds_proc}s")
            elapsed_seconds_real = elapsed_seconds_proc

        if elapsed_seconds_real < RECORD_SECONDS_MIN:
            msg = f"Gravação muito curta para '{username}' (ID: {user_id}). Duração gravada ({elapsed_seconds_real}s) menor que o mínimo ({RECORD_SECONDS_MIN}s). Arquivo descartado." # Adiciona ID
            print(f"⏩ {msg}")
            append_log({
                "sessao": "processing",
                "evento": "erro_duracao",
                "id": user_id, # Usa o ID
                "username": username,
                "status": "erro",
                "detalhes": msg
            })
            register_failure(user_id, username, "Gravação muito curta") # Passa user_id e username
            if os.path.exists(filepath): os.remove(filepath)
            if poster_temp_path and os.path.exists(poster_temp_path): os.remove(poster_temp_path)
            return {
                'user_id': user_id, # Inclui user_id no resultado
                'username': username,
                'filename': temp_filename,
                'filepath': filepath,
                'upload_success': False,
                'abyss_response': "Gravação muito curta (descartada)"
            }

        # --- Sucesso: limpa falhas acumuladas do usuário no log central (USANDO ID) ---
        clear_failure(user_id) # Passa user_id
        tempo_formatado = format_seconds(elapsed_seconds_real)
        final_filename = f"{username}_{data_str}_{horario_str}_{tempo_formatado}.mp4"
        final_filepath = os.path.join(TEMP_OUTPUT_FOLDER, final_filename)

        try:
            os.rename(filepath, final_filepath)
            print(f"✅ Arquivo renomeado para: {final_filename}")
            filepath_for_upload = final_filepath
            filename_for_upload = final_filename
        except Exception as e:
            print(f"❌ Erro ao renomear arquivo {temp_filename} para {final_filename}: {e}")
            filepath_for_upload = filepath
            filename_for_upload = temp_filename

        # --- Realiza upload e atualização do banco de dados (json) ---
        # upload_to_abyss_and_update_json (Célula 8) precisará receber o user_id
        success, abyss_resp, slug = upload_to_abyss_and_update_json(
            filepath_for_upload, user_id, username, elapsed_seconds_real, # Passa user_id e username
            poster_temp_path=poster_temp_path
        )

        # --- Loga sucesso de gravação no log central (USANDO ID) ---
        append_log({
            "sessao": "processing",
            "evento": "sucesso_gravacao",
            "id": user_id, # Usa o ID
            "username": username,
            "status": "ok",
            "detalhes": f"Arquivo {filename_for_upload} gravado e enviado com sucesso para '{username}' (ID: {user_id}). Duração: {elapsed_seconds_real}s" # Adiciona ID
        })

        return {
            'user_id': user_id, # Inclui user_id no resultado
            'username': username,
            'filename': filename_for_upload,
            'filepath': filepath_for_upload,
            'upload_success': success,
            'abyss_response': abyss_resp,
            'slug': slug
        }

    except FileNotFoundError:
        msg = "Comando 'ffmpeg' não encontrado. Certifique-se de que foi instalado corretamente."
        print(f"❌ {msg}")
        # Registrar falha de ffmpeg não encontrado (USANDO ID)
        if 'register_failure' in globals(): # Verifica se a função existe
             register_failure(user_id, username, msg) # Passa user_id e username
        append_log({
            "sessao": "processing",
            "evento": "erro_ffmpeg_nao_encontrado",
            "id": user_id, # Usa o ID
            "username": username,
            "status": "erro",
            "detalhes": msg
        })
        return {
            'user_id': user_id, # Inclui user_id no resultado
            'username': username,
            'filename': None,
            'filepath': None,
            'upload_success': False,
            'abyss_response': msg
        }
    except Exception as e:
        msg = f"Erro inesperado durante a execução do FFmpeg para '{username}' (ID: {user_id}): {e}" # Adiciona ID
        print(f"❌ {msg}")
        # Registrar falha de execução de ffmpeg (USANDO ID)
        if 'register_failure' in globals(): # Verifica se a função existe
             register_failure(user_id, username, msg) # Passa user_id e username
        append_log({
            "sessao": "processing",
            "evento": "erro_execucao_ffmpeg",
            "id": user_id, # Usa o ID
            "username": username,
            "status": "erro",
            "detalhes": msg
        })
        return {
            'user_id': user_id, # Inclui user_id no resultado
            'username': username,
            'filename': None,
            'filepath': None,
            'upload_success': False,
            'abyss_response': msg
        }
    finally:
        # --- Remove marcação de processamento ativo no log central (USANDO ID) ---
        unmark_processing(user_id) # Passa user_id

        # --- Limpeza do arquivo de vídeo pós-upload ---
        if 'filepath_for_upload' in locals() and os.path.exists(filepath_for_upload):
            try:
                os.remove(filepath_for_upload)
                print(f"🗑️ Arquivo de vídeo temporário local removido do Colab: {filepath_for_upload}")
                # Log de limpeza
                if 'append_log' in globals():
                     append_log({
                         "sessao": "cleanup",
                         "evento": "remover_video_temp",
                         "id": user_id, # Usa o ID
                         "username": username,
                         "status": "ok",
                         "detalhes": f"Arquivo de vídeo temporário local removido: {filepath_for_upload}"
                     })
            except Exception as e:
                print(f"⚠️ Não foi possível remover o arquivo de vídeo temporário local: {e}")
                # Log de erro de limpeza
                if 'append_log' in globals():
                     append_log({
                         "sessao": "cleanup",
                         "evento": "erro_remover_video_temp",
                         "id": user_id, # Usa o ID
                         "username": username,
                         "status": "erro",
                         "detalhes": f"Erro ao remover arquivo de vídeo temporário local: {e}"
                     })


        # --- Limpeza do poster temporário ---
        # poster_temp_path é o caminho ANTES da renomeação com slug
        if poster_temp_path and os.path.exists(poster_temp_path):
            try:
                os.remove(poster_temp_path)
                # print(f"🗑️ Poster temporário original removido: {poster_temp_path}") # Já logado na Célula 8 se movido
            except Exception as e:
                # print(f"⚠️ Não foi possível remover o poster temporário original: {e}") # Já logado na Célula 8 se movido
                pass # A Célula 8 lida com a limpeza do poster renomeado/movido


# ================================================================
# Fim da Célula 7 — Gravação, Log Centralizado e Blacklist Inteligente (AGORA USANDO ID)
# ================================================================

# Observações e recomendações:
# - Toda manipulação de status, falha, blacklist e processamento é feita via funções do log centralizado (Célula 1 e 6), AGORA USANDO O ID.
# - Mensagens claras e detalhadas e logging estruturado garantem rastreabilidade, CI/CD e manutenção.
# - Pronto para execução concorrente, pipelines e auditoria centralizada no XCam.

# Célula 8: Upload para Abyss.to, Atualização do rec.json e Poster no Google Drive — Log Centralizado, Persistência e Sincronização

**Objetivo:**  
Gerenciar de forma automatizada e robusta o pós-processamento da gravação: upload do vídeo gravado para o serviço Abyss.to, atualização e persistência dos metadados no arquivo `rec.json` do usuário diretamente no Google Drive, manipulação segura do poster associado ao vídeo, manutenção da integridade dos arquivos e limpeza consistente dos temporários.  
Toda ação relevante é registrada no log centralizado (`xcam_master.log`) para máxima rastreabilidade, suporte a auditoria, diagnóstico rápido de falhas e compatibilidade total com execução concorrente e pipelines CI/CD.

---

## Estratégia técnica, fluxos e diferenciais implementados

- **Upload seguro e transacional para Abyss.to:**  
  O vídeo é enviado via POST multipart para Abyss.to, recebendo como resposta um JSON padronizado contendo status, slug (identificador único do vídeo), e URLs públicas do vídeo, iframe e poster. O slug serve como vínculo entre o vídeo, o poster e os metadados. O processo é tolerante a falhas, com tratamento de exceções e registro detalhado em caso de upload mal-sucedido ou resposta inesperada da API.
- **Renomeação e movimentação do poster com vínculo ao slug:**  
  O poster temporário é renomeado para `{slug}.jpg` no diretório temporário do Colab, garantindo unicidade e rastreabilidade. Em seguida, é movido para a pasta definitiva do usuário no Google Drive, permitindo sincronização, backup e fácil acesso externo. A URL do poster no `rec.json` é construída para refletir o caminho público presumido (ex: `https://db.xcam.gay/user/{username}/{slug}.jpg`).
- **Atualização segura e incremental do rec.json:**  
  O arquivo `rec.json` é lido e atualizado diretamente no Google Drive (sem cópias locais intermediárias), garantindo persistência e integridade dos registros históricos do usuário. Cada entrada adicionada inclui: slug, nome do arquivo, URLs públicas, poster, urlIframe, data, horário e duração formatada. Estrutura JSON validada para evitar corrupção do histórico.
- **Registro detalhado no log centralizado:**  
  Cada etapa crítica (upload, renomeação/movimentação de poster, atualização do rec.json, limpeza de arquivos) é registrada no log único com informações como evento, id/username, status e detalhes. Isso garante rastreabilidade completa, facilita auditoria, troubleshooting e geração de relatórios históricos.
- **Limpeza automática e segura dos arquivos temporários:**  
  Ao final do ciclo, o vídeo temporário e o poster remanescentes no Colab são removidos, liberando espaço e evitando acúmulo de resíduos. Falhas na limpeza são também registradas no log.
- **Sincronização consistente com Google Drive:**  
  Os artefatos permanentes são organizados em `/content/drive/MyDrive/XCam.Drive/user/{username}/`. A estrutura facilita backup, versionamento externo e integração com outros sistemas de armazenamento ou distribuição.
- **Pronto para integração CI/CD, concorrência e expansão:**  
  O fluxo é compatível com execução concorrente de múltiplos workers, pipelines automatizados e futuras integrações, pois não depende de arquivos temporários ou operações não transacionais.
- **Segurança e redundância:**  
  Toda persistência é feita diretamente no Drive, reduzindo riscos de perda por falhas do ambiente Colab ou interrupções inesperadas do notebook.

---

## Detalhes técnicos dos campos e operações

- **Campos gravados no rec.json:**  
  - `video`: slug/identificador único do vídeo no Abyss.to.
  - `title`: nome base do arquivo de vídeo (sem extensão).
  - `file`: nome do arquivo .mp4 original.
  - `url`: URL pública do vídeo em Abyss.to.
  - `poster`: URL pública do poster (presume acesso externo ao Drive ou CDN).
  - `urlIframe`: URL do player incorporável com thumbnail.
  - `data`, `horario`, `tempo`: metadados temporais e duração formatada.
- **Estrutura do rec.json:**  
  Cada usuário possui um arquivo rec.json com os campos `username`, `records` (total de vídeos) e `videos` (lista de entradas como acima).  
  O arquivo é validado antes de cada escrita para garantir integridade.
- **Tratamento robusto de falhas:**  
  Qualquer falha (upload, leitura/gravação do JSON, movimentação de poster, limpeza) é capturada, logada e não impede a execução das outras etapas, reduzindo impacto no pipeline.
- **Visibilidade e rastreamento:**  
  O log centralizado permite identificar rapidamente uploads com falha, problemas de sincronização, arquivos que não foram limpos, e relatórios detalhados por usuário.

---

## Fluxo operacional detalhado

1. **Upload do vídeo para Abyss.to:**  
   O vídeo .mp4 é enviado via POST para o endpoint, recebendo slug, URL, urlIframe e status. Evento é logado.
2. **Renomeação/movimentação do poster:**  
   Poster temporário é renomeado para `{slug}.jpg` e transferido para o Drive. URLs públicas são calculadas e logadas.
3. **Atualização do rec.json no Drive:**  
   O JSON do usuário é lido/validado, nova entrada é adicionada, e o arquivo salvo de volta no Drive. Evento de sucesso ou falha é sempre registrado.
4. **Limpeza dos arquivos temporários:**  
   Após movimentação, vídeo e poster temporários no Colab são removidos. Falhas na limpeza são tratadas e logadas.
5. **(Commit/push externo):**  
   O gerenciamento de commit/push do Drive para o repositório remoto é feito por script externo, garantindo atomicidade e evitando conflitos.

---

## Exemplo de uso técnico

```python
upload_success, abyss_response, slug = upload_to_abyss_and_update_json(
    filepath=arquivo_video,
    username="usuario",
    duration_seconds=duracao,
    poster_temp_path=caminho_poster_temp
)
# Após processamento em lote, execute o commit externo dos arquivos do Drive, se necessário.
```

---

## Segurança, rastreabilidade e integração

- **Execução concorrente e CI/CD-ready:**  
  Não depende de arquivos temporários após o término, e toda persistência é feita diretamente no Drive para máxima segurança.
- **Rastreabilidade total:**  
  Todas as etapas (upload, poster, rec.json, limpeza) são logadas detalhadamente para auditoria, reporting e troubleshooting.
- **Design modular e resiliente:**  
  Funções com robusto tratamento de exceções, logs claros, validação de estrutura JSON e fluxo pronto para expansão futura.
- **Integração garantida com o pipeline XCam:**  
  Estrutura, nomenclatura e fluxo de dados padronizados, compatíveis com as demais células e necessidades de manutenção/evolução.

---

## Observações e recomendações

- Certifique-se de que o Google Drive está montado antes de executar esta célula.
- O commit/push final dos arquivos no Drive deve ser feito por script externo, preferencialmente ao final do processamento em lote.
- A URL do poster no rec.json presume que o conteúdo do Drive estará disponível publicamente via CDN, servidor web ou integração adequada.
- Recomenda-se monitorar e analisar o log centralizado para garantir integridade do processo, detectar falhas precocemente e gerar relatórios de uso.

---

In [None]:
# ================================================================
# Célula 8: Upload para Abyss.to, Atualização do rec.json e Poster no Google Drive
# ================================================================
# Objetivo:
# - Fazer upload do vídeo gravado para Abyss.to e registrar corretamente os metadados.
# - Salvar gravação e poster temporariamente no Colab.
# - Renomear poster temporário com slug (no Colab temp).
# - LER/ESCREVER rec.json DIRETAMENTE no Google Drive.
# - MOVER poster renomeado do Colab temp para o Google Drive.
# - Limpar arquivos temporários locais após uso.
# - Modular, preparado para CI/CD, concorrência e integração total ao pipeline XCam.
# ================================================================

# Caminho base no Google Drive para arquivos permanentes (rec.json, posters)
DRIVE_USER_BASE = "/content/drive/MyDrive/XCam.Drive/user"

def upload_to_abyss_and_update_json(
    filepath, username, duration_seconds, poster_temp_path=None
):
    """
    Realiza upload do vídeo, atualiza rec.json do usuário (no Drive),
    renomeia poster com slug (no Colab temp) e MOVE para o Google Drive.
    - Salva gravação e poster temporariamente no Colab.
    - LÊ/ESCREVE rec.json DIRETAMENTE no Drive.
    - Renomeia poster temporário no Colab temp com o slug retornado.
    - MOVE poster renomeado do Colab temp para o Drive.
    - Limpa arquivos temporários locais após uso.
    - Toda ação relevante é registrada no log centralizado via append_log().
    """
    file_name = os.path.basename(filepath) # Nome do arquivo de vídeo renomeado (username_data_horario_tempo.mp4)
    file_type = 'video/mp4'
    print(f"⬆️ Upload de: {file_name} para Abyss.to...")

    upload_success = False
    abyss_response = "Upload falhou - Sem resposta"
    uploaded_url = None
    video_id = None
    slug = None

    # ---- Upload do vídeo para Abyss.to ----
    try:
        with open(filepath, 'rb') as f:
            files = { 'file': (file_name, f, file_type) }
            response = requests.post(ABYSS_UPLOAD_URL, files=files)
            resp_json = response.json()
            abyss_response = resp_json
            if resp_json.get('status'):
                upload_success = True
                uploaded_url = resp_json.get('url') or resp_json.get('urlIframe')
                video_id = resp_json.get('slug') or resp_json.get('video')
                slug = video_id
                print(f"📤 Upload bem-sucedido. URL: {uploaded_url} | SLUG: {slug}")
                append_log({
                    "sessao": "upload",
                    "evento": "upload_sucesso",
                    "id": username,
                    "username": username,
                    "status": "ok",
                    "detalhes": f"Arquivo {file_name} enviado para Abyss.to. URL: {uploaded_url}, SLUG: {slug}"
                })
            else:
                print(f"❌ Falha no upload. Mensagem: {resp_json.get('message','')}")
                append_log({
                    "sessao": "upload",
                    "evento": "upload_falhou",
                    "id": username,
                    "username": username,
                    "status": "erro",
                    "detalhes": f"Falha no upload. Mensagem: {resp_json.get('message','')}"
                })
    except Exception as e:
        abyss_response = f"Erro no upload: {e}"
        print(f"❌ Erro no upload: {e}")
        append_log({
            "sessao": "upload",
            "evento": "upload_falhou",
            "id": username,
            "username": username,
            "status": "erro",
            "detalhes": f"Exceção no upload: {e}"
        })

    poster_temp_renamed_path = None
    drive_json_filepath = os.path.join(DRIVE_USER_BASE, username, "rec.json")
    drive_user_dir = os.path.join(DRIVE_USER_BASE, username) # Pasta do usuário no Drive

    if upload_success and slug:
        # ---- Renomeia o poster temporário com o slug retornado (no diretório temporário do Colab) ----
        # O poster_temp_path já está em TEMP_OUTPUT_FOLDER (gerado/baixado pela Célula 7)
        if poster_temp_path and os.path.exists(poster_temp_path):
            try:
                # O novo nome será {slug}.jpg
                poster_final_name = f"{slug}.jpg"
                # A renomeação ocorre dentro do diretório TEMPORÁRIO do Colab
                poster_temp_renamed_path = os.path.join(TEMP_OUTPUT_FOLDER, poster_final_name)
                # Move (renomeia) o poster DENTRO do diretório temporário
                shutil.move(poster_temp_path, poster_temp_renamed_path)
                print(f"🖼️ Poster temporário renomeado para {poster_final_name} em {TEMP_OUTPUT_FOLDER}")
                append_log({
                    "sessao": "poster",
                    "evento": "poster_renomeado_temp",
                    "id": username,
                    "username": username,
                    "status": "ok",
                    "detalhes": f"Poster temporário renomeado para {poster_final_name} no Colab temp."
                })
            except Exception as e:
                print(f"❌ Erro ao renomear poster temporário no Colab: {e}")
                # Tenta limpar o poster temporário original se o renomeio falhar
                if os.path.exists(poster_temp_path):
                    try:
                        os.remove(poster_temp_path)
                    except Exception as clean_e:
                        print(f"⚠️ Falha ao limpar poster temporário original após erro: {clean_e}")
                poster_temp_renamed_path = None # Garante que não tentaremos mover um arquivo que não existe
                append_log({
                    "sessao": "poster",
                    "evento": "erro_renomear_poster_temp",
                    "id": username,
                    "username": username,
                    "status": "erro",
                    "detalhes": f"Erro ao renomear poster temporário no Colab: {e}"
                })
        else:
             print(f"⚠️ Poster temporário não encontrado ou inválido para renomear com slug.")
             append_log({
                "sessao": "poster",
                "evento": "poster_temp_nao_encontrado",
                "id": username,
                "username": username,
                "status": "aviso",
                "detalhes": "Poster temporário não encontrado ou inválido para renomear com slug."
            })


        # ---- Atualiza/Cria rec.json do usuário (DIRETAMENTE no Google Drive) ----
        try:
            # Caminho no Drive onde o rec.json deve estar/ser salvo
            os.makedirs(drive_user_dir, exist_ok=True) # Garante que a pasta do usuário no Drive exista

            file_base = file_name.replace('.mp4', '')
            parts = file_base.split('_')
            if len(parts) >= 4:
                json_data = parts[-3]
                json_horario = parts[-2]
                json_tempo = parts[-1]
            else:
                now = datetime.now()
                json_data = now.strftime("%d-%m-%Y")
                json_horario = now.strftime("%H-%M")
                json_tempo = format_seconds(duration_seconds)

            # A URL do poster no rec.json aponta para onde ele estará PUBLICAMENTE disponível
            # (presumindo que o conteúdo do Drive será servido ou sincronizado externamente)
            poster_url_final = f"https://db.xcam.gay/user/{username}/{slug}.jpg" if slug else ""
            url_iframe_final = f"https://short.icu/{slug}?thumbnail={poster_url_final}" if slug else ""

            new_video_entry = {
                "video": slug if slug else "ID_não_retornado",
                "title": file_base,
                "file": file_name, # O nome do arquivo de vídeo original é mantido como referência
                "url": uploaded_url if uploaded_url else "URL_não_retornada",
                "poster": poster_url_final, # Esta URL deve ser acessível publicamente
                "urlIframe": url_iframe_final, # Esta URL deve ser acessível publicamente
                "data": json_data,
                "horario": json_horario,
                "tempo": json_tempo
            }

            def zerar_base(username):
                return {
                    "username": username,
                    "records": 0,
                    "videos": []
                }

            # Carrega ou inicializa rec.json (DIRETAMENTE do Drive)
            rec_data = zerar_base(username) # Inicializa com base zero por segurança
            if os.path.exists(drive_json_filepath):
                 try:
                     with open(drive_json_filepath, 'r', encoding='utf-8') as f:
                         loaded = json.load(f)
                     # Valida se a estrutura carregada é razoável, senão cria uma nova
                     valid = (
                         isinstance(loaded, dict)
                         and "username" in loaded
                         and "records" in loaded
                         and "videos" in loaded
                         and isinstance(loaded["videos"], list)
                     )
                     rec_data = loaded if valid else zerar_base(username)
                     print(f"📝 Carregado rec.json existente do Drive para {username}")
                 except Exception as read_drive_e:
                      print(f"⚠️ Erro ao ler rec.json existente no Drive ({drive_json_filepath}), criando novo: {read_drive_e}")
                      # Se der erro na leitura, rec_data já está zerada

            # Adiciona novo vídeo ao histórico (no objeto carregado/novo)
            rec_data["records"] += 1
            rec_data["videos"].append(new_video_entry)

            # Salva rec.json (DIRETAMENTE no Drive)
            with open(drive_json_filepath, 'w', encoding='utf-8') as f:
                json.dump(rec_data, f, indent=2, ensure_ascii=False)
            print(f"✅ rec.json para {username} atualizado DIRETAMENTE no Drive: {drive_json_filepath}")

            append_log({
                "sessao": "recjson",
                "evento": "recjson_atualizado_drive",
                "id": username,
                "username": username,
                "status": "ok",
                "detalhes": f"rec.json atualizado diretamente no Drive em {drive_json_filepath}"
            })

        except Exception as e:
            print(f"❌ Erro ao atualizar rec.json no Drive: {e}")
            abyss_response = f"Upload sucesso, erro no JSON do Drive: {e}"
            # json_temp_path = None # Não existe mais json_temp_path neste fluxo
            append_log({
                "sessao": "recjson",
                "evento": "erro_atualizar_recjson_drive",
                "id": username,
                "username": username,
                "status": "erro",
                "detalhes": f"Erro ao atualizar rec.json no Drive: {e}"
            })


        # ---- MOVER poster renomeado (do Colab temp) para o Google Drive ----
        if poster_temp_renamed_path and os.path.exists(poster_temp_renamed_path):
            # O destino é a pasta do usuário no Drive
            drive_poster_filepath = os.path.join(drive_user_dir, os.path.basename(poster_temp_renamed_path))
            try:
                shutil.move(poster_temp_renamed_path, drive_poster_filepath)
                print(f"🗂️ Poster movido para o Drive: {drive_poster_filepath}")
                append_log({
                    "sessao": "poster",
                    "evento": "poster_movido_drive",
                    "id": username,
                    "username": username,
                    "status": "ok",
                    "detalhes": f"Poster movido para o Drive em {drive_poster_filepath}"
                })
            except Exception as e:
                print(f"❌ Falha ao MOVER poster para o Drive: {e}")
                append_log({
                    "sessao": "poster",
                    "evento": "erro_mover_poster_drive",
                    "id": username,
                    "username": username,
                    "status": "erro",
                    "detalhes": f"Erro ao mover poster para o Drive: {e}"
                })
        else:
             print(f"⚠️ Poster temporário renomeado não encontrado para mover para o Drive.")
             append_log({
                "sessao": "poster",
                "evento": "poster_temp_renomeado_nao_encontrado",
                "id": username,
                "username": username,
                "status": "aviso",
                "detalhes": "Poster temporário renomeado não encontrado para mover para o Drive."
            })


    # ---- Limpeza do arquivo de vídeo temporário local ----
    # Esta limpeza já estava presente no bloco finally da gravar_stream (Célula 7),
    # mas vamos garantir aqui também por segurança, caso a chamada venha de outro lugar.
    # O arquivo de vídeo renomeado está em TEMP_OUTPUT_FOLDER
    if os.path.exists(filepath): # filepath é o caminho do vídeo renomeado em TEMP_OUTPUT_FOLDER
        try:
            os.remove(filepath)
            print(f"🗑️ Arquivo de vídeo temporário local removido: {filepath}")
            append_log({
                "sessao": "cleanup",
                "evento": "remover_video_temp",
                "id": username,
                "username": username,
                "status": "ok",
                "detalhes": f"Arquivo de vídeo temporário local removido: {filepath}"
            })
        except Exception as e:
            print(f"⚠️ Não foi possível remover o arquivo de vídeo temporário local: {e}")
            append_log({
                "sessao": "cleanup",
                "evento": "erro_remover_video_temp",
                "id": username,
                "username": username,
                "status": "erro",
                "detalhes": f"Erro ao remover arquivo de vídeo temporário local: {e}"
            })

    # ---- Limpeza do diretório temporário do usuário, se estiver vazio ----
    # O diretório temporário do usuário pode não ter sido criado se o upload falhou antes.
    # TEMP_OUTPUT_FOLDER é o diretório geral. Não vamos remover subdiretórios específicos aqui.
    # A limpeza do diretório temp do usuário pode ser feita de forma mais robusta em outro local ou manualmente.
    # Manteremos a limpeza apenas dos arquivos específicos manipulados.

    return upload_success, abyss_response, slug

# A função de commit final pendente não é mais necessária, pois o commit é gerenciado externamente.
# def commit_push_restantes():
#     """
#     Esta função não é mais necessária pois o commit/push é gerenciado externamente.
#     """
#     pass # Lógica de commit/push removida

# ================================================================
# FIM DA Célula 8 — Upload, Metadados e Posters no Google Drive (com log centralizado)
# ================================================================

# Observações:
# - A gravação e o poster inicial ficam no Colab temp.
# - O rec.json é lido e escrito DIRETAMENTE no Drive.
# - O poster renomeado é MOVIDO do Colab temp para o Drive.
# - Certifique-se de que o Google Drive esteja montado antes de executar esta célula.
# - A URL do poster no rec.json (db.xcam.gay) presume que o conteúdo do Drive será servido publicamente de alguma forma.
# - O commit/push agora é gerenciado por um script externo que deve ler os arquivos do Drive.
# - Toda ação relevante registrada no log centralizado para total rastreabilidade/auditoria.

# Célula 9: Supervisor Dinâmico — Execução Paralela, Lote Sempre Cheio, Blacklist Centralizada e Log por ID

**Objetivo:**  
Orquestrar e controlar automaticamente todo o pipeline de gravação de transmissões ao vivo, garantindo execução paralela robusta, processamento contínuo, máxima eficiência no preenchimento do lote e total segurança contra duplicidade, concorrência indevida e usuários problemáticos.  
A célula implementa um supervisor dinâmico que mantém o lote sempre cheio, preenche vagas em tempo real com transmissões válidas, consulta e respeita a blacklist temporária centralizada (por ID), previne duplicidade de gravação consultando o log central de processamento, e integra-se a todas as rotinas críticas do pipeline XCam (gravação, upload, rec.json, poster, limpeza, commit), promovendo rastreabilidade, resiliência e escalabilidade.

---

## Estratégia técnica, arquitetura e diferenciais

- **Execução paralela segura via multiprocessing:**  
  Utiliza múltiplos processos (`multiprocessing.Process`) para gravação simultânea, acelerando o throughput do pipeline e melhorando o aproveitamento de recursos computacionais (CPU, I/O).
- **Supervisor dinâmico e lote sempre cheio:**  
  O supervisor monitora ativamente as vagas livres no lote alvo (`pool_size`) e lança novas gravações assim que houver disponibilidade, evitando períodos ociosos e maximizando a produtividade.
- **Controle centralizado de blacklist e processamento por ID:**  
  Antes de iniciar qualquer gravação, consulta o log centralizado para verificar se o usuário (por `id`) está em blacklist temporária (sessao="blacklist", status="blacklisted") ou já está em processamento ativo (sessao="processing", status="in_progress"), evitando duplicidade e reprocessamento indevido.
- **Busca inteligente, seleção e escalonamento:**  
  Utiliza funções otimizadas para buscar transmissões válidas, tanto para listas específicas de usuários quanto para busca automática. Sempre respeita blacklist, status de processamento e disponibilidade da transmissão.
- **Worker modular e integrado:**  
  Cada worker processa a gravação de uma transmissão (por ID), realiza upload, atualização do rec.json/poster, limpeza de arquivos temporários, e integra-se ao log central. O status de cada operação é registrado detalhadamente.
- **Logs robustos, padronizados e detalhados:**  
  Todas as etapas críticas (início, finalização, busca, erro, status, preenchimento de vagas) geram logs com timestamp, contexto, nível e detalhes, tanto no console quanto no log centralizado (`xcam_master.log`).  
  Eventos são classificados por nível (INFO, WORKER, BUSCA, ERRO, STATUS, RESUMO, END) e incluem sempre o ID do usuário quando relevante.
- **Respeito rigoroso à blacklist temporária:**  
  Usuários que atingiram o limite de falhas são bloqueados temporariamente por ID e não são reprocessados até expiração da blacklist, otimizando recursos e evitando loops problemáticos.
- **Design modular, extensível e pronto para CI/CD:**  
  Código segmentado em funções (supervisor, worker, busca, log), com separação clara de responsabilidades, facilitando manutenção, reuso, testes e integração com pipelines automáticos ou ambientes colaborativos (ex: Google Colab, runners de CI).

---

## Fluxo operacional detalhado

1. **Inicialização e configuração:**  
   - Determina modo operacional: gravação de usuários específicos (lista) ou busca automática.
   - Calcula tamanho do lote alvo (`pool_size`), define variáveis globais e inicializa estruturas compartilhadas (ex: results via `Manager().list()`).
   - Loga início do supervisor.

2. **Preenchimento do lote inicial:**  
   - Busca e seleciona transmissões livres, preenchendo o lote até atingir o tamanho alvo ou esgotar opções válidas.
   - Para cada transmissão válida (não duplicada, não em blacklist, não em processamento), marca o usuário como "in_progress" no log centralizado (por ID) e lança um worker dedicado.

3. **Supervisão dinâmica e ciclo de preenchimento contínuo:**  
   - Monitora, em loop, o número de processos ativos (gravações em andamento).
   - Assim que uma gravação finaliza, imediatamente busca e lança nova transmissão para preencher a vaga, mantendo o lote sempre cheio até esgotar transmissões disponíveis.
   - Cada ciclo de busca e preenchimento é protegido contra duplicidade por consultas ao log de blacklist/processamento (por ID).

4. **Logs e controle detalhados:**  
   - Cada ação relevante (início/fim de gravação, erros, busca, preenchimento, status periódico) é logada com timestamp, nível e detalhes no log central e no console.
   - Resultados de cada worker são armazenados e podem ser analisados ao final do processamento.

5. **Encerramento e resumo:**  
   - Quando não há mais transmissões disponíveis e todos os processos finalizam, supervisor encerra o ciclo e registra resumo dos resultados.
   - Commit/push dos arquivos permanentes é gerenciado externamente, promovendo atomicidade e consistência.

---

## Exemplo de uso técnico

```python
# Função principal para disparar o supervisor dinâmico (interativo para escolha do modo)
main()
```

---

## Detalhes técnicos e recomendações

- **Fonte de verdade centralizada:**  
  Toda lógica de blacklist, falhas, processamento ativo e controle de duplicidade é baseada no log centralizado e no ID único do usuário, promovendo consistência, rastreabilidade e integridade em ambientes paralelos.
- **Pronto para execução concorrente e ambientes colaborativos:**  
  Compatível com Google Colab, runners de CI/CD, servidores multiusuário e pipelines automáticos.
- **Diagnóstico e manutenção facilitados:**  
  Logs detalhados, estrutura modular e documentação clara facilitam troubleshooting, evolução e integração de novos recursos.
- **Segurança, resiliência e eficiência:**  
  O supervisor garante que nenhum usuário problemático trave o pipeline, nenhuma transmissão seja processada duas vezes, e o lote permaneça sempre no máximo da capacidade.
- **Pré-requisitos de execução:**  
  Certifique-se de executar previamente as Células 1, 3, 6, 7 e 8 para garantir inicialização correta do ambiente, variáveis globais, funções de log, gravação, upload e limpeza.

---

## Observações finais

- **Toda lógica de controle (blacklist, falhas, processamento) é feita por ID, promovendo rastreabilidade e evitando ambiguidades.**
- **O supervisor é o núcleo do pipeline, integrando e coordenando todas as rotinas críticas do XCam.**
- **Expansível, pronto para novos modos de busca, integração com notificações, dashboards ou novos sistemas de storage.**
- **A arquitetura Clean facilita onboarding de novos desenvolvedores e manutenção do ciclo de vida do projeto.**

---

In [None]:
# @title
# ================================================================
# Célula 9: Supervisor Dinâmico — Execução Paralela, Lote Sempre Cheio, Blacklist e Log Centralizado (AGORA USANDO ID)
# ================================================================
# Objetivo:
# - Manter o lote de gravações sempre cheio, preenchendo vagas em tempo real com máxima eficiência e segurança.
# - Garantir que usuários problemáticos (em blacklist - por ID) não sejam tentados novamente no ciclo vigente.
# - Prevenir duplicidade consultando log central de processamento (por ID) antes de iniciar qualquer gravação.
# - Integrar-se com a lógica de blacklist, commit/push automático, limpeza de recursos e log robusto, TUDO BASEADO NO ID.
# - Modularidade e clareza, pronta para integração com pipelines CI/CD, execução concorrente e ambientes colaborativos.
# ================================================================

from multiprocessing import Process, Manager # Garantir imports

def log_supervisor(msg, level="INFO"):
    """
    Log supervisor padronizado para todas as etapas do pipeline.
    Também registra cada evento relevante no log centralizado (sessao supervisor).
    Pode incluir ID/username se relevante para o evento.
    """
    from datetime import datetime
    timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    print(f"[{timestamp}] [{level}] {msg}")
    # Registro também no log central (sessao supervisor)
    append_log({
        "sessao": "supervisor",
        "evento": level,
        "id": "global", # Evento global do supervisor
        "username": "global",
        "status": "info" if level != "ERRO" else "erro",
        "detalhes": msg
    })

# Adicionando user_id como parâmetro para o worker
def worker(user_id, username, m3u8_url, poster_path, results):
    """
    Worker dedicado: grava a stream, faz upload, atualiza rec.json/poster, integra ao log.
    Recebe o ID do usuário e o passa para a função gravar_stream (Célula 7).
    O processamento é rastreado via log central, e o status final é adicionado à lista de resultados.
    """
    # gravar_stream agora espera user_id como primeiro parâmetro
    log_supervisor(f"Iniciando gravação: '{username}' (ID: {user_id}) | URL: {m3u8_url[:50]}...", "WORKER") # Loga o ID
    result = gravar_stream(user_id, username, m3u8_url, poster_url=poster_path) # Passa user_id para gravar_stream
    log_supervisor(
        f"Finalizou gravação: '{username}' (ID: {user_id}) | Sucesso: {result.get('upload_success')} | " # Loga o ID
        f"Arquivo: {result.get('filename')} | Abyss: {result.get('abyss_response')}", "WORKER")
    results.append(result)
    # Registro do resultado no log central (já feito dentro de gravar_stream, mas reforça aqui)
    # append_log({
    #     "sessao": "supervisor",
    #     "evento": "worker_result",
    #     "id": user_id, # Usa o ID aqui
    #     "username": username,
    #     "status": "ok" if result.get("upload_success") else "erro",
    #     "detalhes": str(result)
    # })


# Supervisor dinâmico, agora usando ID para controle de estado
def supervisor_dinamico(usuarios_especificos=None):
    """
    Supervisor dinâmico de transmissões ao vivo:
    - Mantém o lote de gravações sempre cheio, preenchendo vagas em tempo real.
    - Evita duplicidade e concorrência consultando log central (sessao="processing", status="in_progress"), AGORA PELO ID.
    - Respeita blacklist centralizada (pelo ID), não processando usuários bloqueados no ciclo vigente.
    - Log detalhado e modular para diagnóstico, CI/CD e rastreabilidade.
    """

    # Determina o tamanho do lote com base no modo operacional
    pool_size = LIMIT_DEFAULT if not usuarios_especificos else API_SEARCH_LIMIT
    running = []
    results = Manager().list()
    # Não precisamos mais do seen_usernames local, pois o log central é a fonte de verdade para o estado (is_processing, is_in_blacklist)
    # seen_usernames = set()

    log_supervisor(f"Supervisor dinâmico iniciado | Lote alvo: {pool_size} | Modo: {'específico' if usuarios_especificos else 'automático'}")

    # A função atualizar_seen_usernames local não é mais necessária,
    # pois is_processing e is_in_blacklist consultam o log central diretamente.
    # def atualizar_seen_usernames():
    #     """
    #     Atualiza o conjunto de usernames já processados diretamente do log central (sessao='processing').
    #     Garante robustez em ambientes concorrentes e previne duplicidade.
    #     """
    #     entries = query_logs(sessao="processing", status="in_progress")
    #     seen_usernames.update([e["username"] for e in entries])

    def buscar_nova_transmissao():
        """
        Busca uma nova transmissão livre para preencher o lote:
        - Modo específico: busca em lista fornecida (agora retorna ID).
        - Modo automático: busca próxima transmissão livre disponível (agora retorna ID).
        - Sempre consulta blacklist (pelo ID) e log central (pelo ID) antes de liberar.
        """
        # Não precisamos mais chamar atualizar_seen_usernames() aqui.
        # A lógica dentro de is_in_blacklist e is_processing consulta o log central diretamente.

        if usuarios_especificos:
            # buscar_usuarios_especificos agora retorna lista com ID
            candidatos = buscar_usuarios_especificos(usuarios_especificos)
            for s in candidatos:
                user_id = s["id"] # Captura o ID retornado pela função de busca
                username = s["username"]
                # Verifica se o ID está em blacklist ou processando (AGORA CONSULTANDO PELO ID)
                if not is_in_blacklist(user_id) and not is_processing(user_id):
                    log_supervisor(f"Nova transmissão encontrada (específico): '{username}' (ID: {user_id})", "BUSCA") # Loga o ID
                    return s # Retorna o dicionário com id, username, src, poster_path
                else:
                    # Loga que o ID está sendo ignorado
                    status_detail = ""
                    if is_in_blacklist(user_id): status_detail += "blacklist "
                    if is_processing(user_id): status_detail += "processing "
                    log_supervisor(f"Usuário '{username}' (ID: {user_id}) já em {status_detail.strip()}, ignorando.", "BUSCA")
            log_supervisor("Nenhuma transmissão específica livre encontrada (todos em blacklist/log ou offline).", "BUSCA")
            return None
        else:
            # Busca otimizada: tenta até 10 vezes buscar próxima transmissão livre
            for tentativa in range(1, 11):
                log_supervisor(f"Buscando próxima transmissão livre: tentativa {tentativa}", "BUSCA")
                # buscar_proxima_transmissao_livre agora retorna dicionário com ID
                stream = buscar_proxima_transmissao_livre()
                if stream:
                    user_id = stream["id"] # Captura o ID retornado pela função de busca
                    username = stream["username"]
                    # Verifica se o ID está em blacklist ou processando (AGORA CONSULTANDO PELO ID)
                    if not is_in_blacklist(user_id) and not is_processing(user_id):
                        log_supervisor(f"Nova transmissão encontrada: '{username}' (ID: {user_id})", "BUSCA") # Loga o ID
                        return stream # Retorna o dicionário com id, username, src, poster_path
                    else:
                        # Loga que o ID está sendo ignorado
                        status_detail = ""
                        if is_in_blacklist(user_id): status_detail += "blacklist "
                        if is_processing(user_id): status_detail += "processing "
                        log_supervisor(f"Usuário '{username}' (ID: {user_id}) já em {status_detail.strip()}, ignorando.", "BUSCA")
                else:
                    log_supervisor(f"buscar_proxima_transmissao_livre retornou None na tentativa {tentativa}.", "BUSCA")

            log_supervisor("Nenhuma transmissão livre encontrada após tentativas (todos em blacklist/log ou offline).", "BUSCA")
            return None

    # ========== Fase 1: Preenchimento do lote inicial ==========
    log_supervisor(f"Preenchendo lote inicial com até {pool_size} transmissões...", "STARTUP")
    tentativas = 0
    max_tentativas = 100 # Limita as tentativas totais para preencher o lote inicial
    while len(running) < pool_size and tentativas < max_tentativas:
        stream = buscar_nova_transmissao() # Retorna dicionário com id, username, src, poster_path
        if not stream:
            log_supervisor("Fim das transmissões disponíveis para preencher lote inicial.", "STARTUP")
            break # Sai do loop se não encontrar mais streams

        user_id = stream["id"] # Obtém o ID do dicionário retornado
        username = stream["username"]
        m3u8_url = stream["src"]
        poster_path = stream["poster_path"] # Caminho do poster temporário válido


        # Marca no log central como em processamento para evitar duplicidade (USANDO ID)
        mark_processing(user_id, username) # Passa user_id e username

        log_supervisor(f"Lançando processo para: '{username}' (ID: {user_id}) | {len(running)+1}/{pool_size}", "STARTUP") # Loga o ID
        # Passa o user_id para a função worker
        p = Process(target=worker, args=(user_id, username, m3u8_url, poster_path, results))
        running.append(p)
        p.start()
        tentativas += 1 # Incrementa tentativas

    log_supervisor(f"Lote inicial lançado com {len(running)} transmissões.", "STARTUP")


    # ========== Fase 2: Loop dinâmico de preenchimento contínuo ==========
    # Monitora processos ativos e busca novas streams para manter o lote cheio
    while True:
        # Atualiza a lista de processos ativos
        antes = len(running)
        running = [p for p in running if p.is_alive()]
        depois = len(running)

        # Se algum processo finalizou
        if antes != depois:
            log_supervisor(f"{antes-depois} gravações finalizaram. Vagas livres: {pool_size-len(running)}", "LOOP")

        vagas_livres = pool_size - len(running)

        # Se houver vagas livres, busca novas streams para preencher
        if vagas_livres > 0:
            # Busca até o número de vagas livres, mas com limite de tentativas para não travar
            preenchidas_nesta_rodada = 0
            for _ in range(vagas_livres):
                stream = buscar_nova_transmissao() # Retorna dicionário com id, username, src, poster_path
                if not stream:
                    # Se não encontrar mais streams disponíveis após todas as tentativas internas, sai do loop de preenchimento
                    log_supervisor("Não há mais transmissões para preencher as vagas livres.", "LOOP")
                    break # Sai do loop interno de preenchimento de vagas

                user_id = stream["id"] # Obtém o ID do dicionário retornado
                username = stream["username"]
                m3u8_url = stream["src"]
                poster_path = stream["poster_path"] # Caminho do poster temporário válido

                # Marca no log central como em processamento (USANDO ID)
                mark_processing(user_id, username) # Passa user_id e username

                log_supervisor(f"Lançando nova gravação: '{username}' (ID: {user_id}) | Vaga preenchida {len(running)+1}/{pool_size}", "LOOP") # Loga o ID
                # Passa o user_id para a função worker
                p = Process(target=worker, args=(user_id, username, m3u8_url, poster_path, results))
                running.append(p)
                p.start()
                preenchidas_nesta_rodada += 1 # Conta quantas vagas foram preenchidas nesta rodada

            if preenchidas_nesta_rodada == 0 and vagas_livres > 0 and not stream:
                 # Condição para sair do loop principal: não há processos rodando E não há mais streams disponíveis
                 # (a busca_nova_transmissao retornou None após várias tentativas)
                 if not running:
                      log_supervisor("Não há processos ativos e não há mais transmissões disponíveis.", "END")
                      break


        # Se não houver processos rodando e não conseguimos preencher nenhuma vaga nesta rodada,
        # significa que todas as transmissões disponíveis já foram processadas ou estão em blacklist/processing.
        # A condição `if not stream:` dentro do loop de vagas + `if not running:` fora do loop de vagas
        # já lida com isso, mas podemos adicionar uma checagem explícita.
        # if not running and vagas_livres == pool_size and stream is None:
        #      log_supervisor("Todas as transmissões possíveis já foram processadas ou estão bloqueadas.", "END")
        #      break


        # Log de status periódico
        log_supervisor(
            f"Transmissões ativas: {len(running)} | Lote alvo: {pool_size} | Buffer de resultados: {len(results)}",
            "STATUS"
        )

        # Aguarda um pouco antes de verificar novamente
        time.sleep(5) # Aumentado o sleep para reduzir a frequência da busca quando o lote está cheio

        # Condição de saída mais robusta: se não há processos rodando E a última busca não encontrou streams
        if not running and (stream is None or (isinstance(stream, list) and len(stream) == 0)):
             log_supervisor("Não há processos ativos e a última busca não encontrou transmissões.", "END")
             break


    # ========== Fase 3: Finalização ==========
    log_supervisor(f"Processamento dinâmico concluído! Total de transmissões gravadas/processadas: {len(results)}", "RESUMO")
    # A chamada para commit_push_restantes() foi removida pois o commit é gerenciado externamente.
    log_supervisor("Supervisor dinâmico finalizado.", "END")


# Função principal para iniciar o supervisor
def main():
    """
    Função principal: inicia o notebook perguntando se o usuário quer gravar transmissões específicas ou automáticas.
    Dispara o supervisor dinâmico na modalidade selecionada.
    """
    # Certificar-se que as variáveis globais essenciais da Célula 1 estão carregadas
    # Isso é feito executando a Célula 1 antes desta.
    if 'LOG_PATH' not in globals():
        print("⚠️ Variáveis globais da Célula 1 não carregadas. Execute a Célula 1 primeiro.")
        return # Sai se a Célula 1 não foi executada

    usuarios_especificos = perguntar_transmissoes_especificas() # perguntar_transmissoes_especificas está na Célula 1
    log_supervisor("Iniciando busca e gravação de streams (supervisor dinâmico)...", "MAIN")
    supervisor_dinamico(usuarios_especificos=usuarios_especificos)


if __name__ == '__main__':
    # Garante que as funções de log da Célula 1 estejam disponíveis
    # Em um notebook, geralmente as células são executadas em ordem,
    # então Célula 1 já teria definido append_log, query_logs, etc.
    # Se rodando como script Python, precisaria importar ou definir as funções de log aqui.
    # Para o contexto do Colab, assume-se que Célula 1 já rodou.

    # Adicionando um try-except para garantir que main() seja chamada
    # apenas se estiver em um ambiente interativo como Colab/IPython
    try:
        if 'google.colab' in str(get_ipython()):
            main()
        else:
            print("Não está rodando em Colab/IPython. Execute main() manualmente se desejar.")
    except NameError:
        print("Não está rodando em Colab/IPython. Execute main() se desejar.")


# ================================================================
# FIM DA CÉLULA 9 — Supervisor Dinâmico, Lote Cheio e Blacklist Centralizados (AGORA USANDO ID)
# ================================================================

# Observações e recomendações:
# - Toda lógica de blacklist, processamento e falhas agora se baseia no ID único do usuário no log centralizado para máxima rastreabilidade.
# - O log central é a fonte de verdade para sincronização entre workers/processos.
# - Modularidade, logs claros e tratamento de erro garantem manutenção e evolução seguras.
# - Pronto para ambientes colaborativos (Colab, CI/CD, pipelines paralelos).
# - Certifique-se de executar as Células 1, 3, 6, 7 e 8 antes desta.

# Célula XX: Limpeza do Arquivo de Log Central do Google Drive

**Objetivo:**\
Esta célula permite remover o arquivo de log central (`xcam_master.log`) do Google Drive. É uma operação útil para limpar um log corrompido que esteja causando erros (como `JSONDecodeError` ou `UnicodeDecodeError`) ou simplesmente para iniciar o registro de eventos do zero.

## Principais pontos e funcionalidades

- **Remoção segura:** Verifica se o arquivo de log existe antes de tentar removê-lo.
- **Tratamento de erros:** Inclui um bloco `try-except` para capturar e reportar quaisquer problemas que possam ocorrer durante a remoção do arquivo.
- **Feedback claro:** Imprime mensagens indicando se o arquivo foi removido com sucesso, se houve um erro ou se o arquivo não foi encontrado.
- **Utilidade para depuração:** Essencial para resetar o estado do log quando ele se corrompe devido a falhas inesperadas de escrita ou outros problemas de sistema de arquivos.

* * *

## Como funciona a célula

- **Define o caminho** completo para o arquivo de log central no Google Drive.
- **Verifica** se o arquivo existe nesse local.
- **Tenta remover** o arquivo.
- **Imprime** o resultado da operação (sucesso, erro ou arquivo não encontrado).

* * *

## Exemplo de execução

In [None]:
import os

log_file_drive = '/content/drive/MyDrive/XCam.Drive/logs/xcam_master.log'
if os.path.exists(log_file_drive):
    try:
        os.remove(log_file_drive)
        print(f"Arquivo de log do Drive removido: {log_file_drive}")
    except Exception as e:
        print(f"Erro ao remover arquivo de log do Drive: {e}")
else:
    print(f"Arquivo de log do Drive não encontrado: {log_file_drive}")

# Célula 1: Configuração Global, Parâmetros e Log Centralizado Robusto (JSONL no Google Drive, Usando ID)

**Objetivo:**\
Esta célula é a base do pipeline do notebook. Ela centraliza todas as configurações globais essenciais, define os caminhos importantes e, crucialmente, estabelece um sistema de log único, estruturado e robusto para registrar e gerenciar o estado de todo o processo.

## Principais pontos e funcionalidades

- **Configurações Centrais:** Define e propaga variáveis globais que controlam diversos aspectos do pipeline (limites de busca, duração de gravação, timeouts, etc.).
- **Montagem do Google Drive:** Prepara o ambiente montando seu Google Drive, permitindo a persistência de dados importantes como o log central e os arquivos de usuário (`rec.json`, posters).
- **Log Único Estruturado (JSONL):** Implementa um sistema de log centralizado em um arquivo no formato JSON Lines (`xcam_master.log`). Cada evento relevante do pipeline é registrado neste arquivo com uma estrutura definida (`sessao`, `evento`, `id`, `username`, `status`, `detalhes`).
- **Uso do ID como Chave Primária no Log:** Garante que a lógica de controle de estado (blacklist, processamento, falhas) no log se baseie no `id` único do usuário fornecido pela API, aumentando a precisão e a robustez, mantendo o `username` para referência humana.
- **Persistência no Google Drive:** O arquivo de log central é salvo diretamente em um diretório no seu Google Drive (`/content/drive/MyDrive/XCam.Drive/logs/`), garantindo que o histórico de execução, blacklist e falhas seja mantido entre as sessões do Colab. O diretório é criado automaticamente se não existir.
- **Utilitários Abrangentes de Log:** Fornece um conjunto completo de funções para interagir com o log central:
    - **`append_log`:** Adiciona novas entradas, lidando com unicidade lógica para estados críticos (como "em processamento" ou "blacklisted") atualizando entradas existentes em vez de duplicar. Inclui tratamento de erro robusto para ignorar linhas inválidas durante a leitura e garantir a escrita.
    - **`read_logs`:** Lê todas as entradas válidas do arquivo de log, com tratamento de erro linha a linha para ignorar corrupções parciais.
    - **`query_logs`:** Permite filtrar e buscar entradas do log com base em múltiplos critérios (sessão, ID, username, status, etc.), essencial para verificar o estado do pipeline e de usuários específicos.
    - **`remove_logs`:** Remove entradas do log que satisfazem uma condição, útil para limpar registros expirados (como blacklist temporária vencida).
    - **`update_log_entry`:** Permite modificar entradas existentes que correspondem a uma condição, para atualizar status ou detalhes.
- **Tratamento de Erros na Leitura do Log:** As funções de leitura (`append_log`, `read_logs`) são resilientes a `JSONDecodeError` e `UnicodeDecodeError`, ignorando linhas inválidas com avisos em vez de travar a execução completa do notebook, embora a remoção do arquivo corrompido seja a solução ideal para a causa raiz.
- **Função Interativa:** Inclui uma função para perguntar ao usuário se deseja processar usuários específicos no início da execução.

* * *

## Como funciona a célula

- Monta o Google Drive.
- Define e propaga as variáveis de configuração global via `globals().update()`.
- Define a localização do log central no Google Drive e garante a criação do diretório necessário.
- Define todas as funções do utilitário de log (`now_iso`, `make_id_username`, `append_log`, `read_logs`, `query_logs`, `remove_logs`, `update_log_entry`).
- Define a função interativa `perguntar_transmissoes_especificas`.

* * *

## Exemplo de execução

Esta célula não produz uma saída visível direta (além da montagem do Drive e da mensagem de criação do diretório de logs), mas sua execução é **obrigatória antes de qualquer outra célula** que dependa das configurações globais, caminhos ou do sistema de log centralizado.