<a href="https://colab.research.google.com/github/SamuelPassamani/XCam/blob/main/xcam-colab/XCam_REC_V3.8copy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Célula 1: Configurações Auxiliares, Parâmetros Globais e Log Centralizado

**Objetivo:**  
Esta célula inicializa e centraliza todas as variáveis globais, parâmetros essenciais e agora também fornece um utilitário robusto para o log único do notebook XCam.  
Permite ajuste rápido e seguro do comportamento do notebook, incluindo limites de processamento, controle de gravação, commit automático e mecanismos de resiliência contra transmissões problemáticas.

## Principais pontos e melhorias implementadas

- **Centralização dos parâmetros globais:**  
  Todos os valores críticos (limites, thresholds, caminhos) são definidos e propagados como globais pelo notebook.
- **Log único modular e estruturado (`xcam_master.log`):**  
  Todas as operações relevantes (busca, gravação, blacklist, commit, erros, etc.) agora são registradas em um único arquivo JSON Lines.  
  Cada entrada inclui sessão, evento, id, username, timestamps, status e detalhes.
- **Funções utilitárias para o log:**  
  Adição, busca, remoção e atualização de eventos são facilitadas por funções modulares (CRUD), promovendo robustez, rastreabilidade e fácil manutenção.
- **Blacklist, falhas e processamento padronizados por `id`:**  
  Toda lógica de controle é feita via identificador único, com `username` para exibição, garantindo unicidade e eliminando inconsistências.
- **Função interativa para seleção de transmissões específicas:**  
  Permite ao usuário informar nomes de usuários para filtrar transmissões antes do processamento.
- **Comentários detalhados:**  
  Cada etapa do código está documentada para orientar ajustes, manutenção e integração por toda a equipe.

---

## Parâmetros globais controlados nesta célula

- **`LIMIT_DEFAULT`**: Quantidade máxima de transmissões processadas em paralelo/lote.
- **`PAGE_DEFAULT`**: Página inicial para busca na API.
- **`RECORD_SECONDS`**: Tempo máximo de gravação de cada vídeo (em segundos).
- **`RECORD_SECONDS_MIN`**: Tempo mínimo exigido para considerar o vídeo válido (em segundos).
- **`API_SEARCH_LIMIT`**: Limite de transmissões retornadas ao buscar usuários específicos.
- **`COMMIT_PUSH_THRESHOLD`**: Quantidade de transmissões processadas até realizar commit/push automático (0 = commit imediato a cada gravação).
- **`LOG_PATH`**: Caminho do arquivo único de log (JSONL).
- **`BLACKLIST_TIMEOUT`**: Tempo de expiração da blacklist (em segundos).
- **`BLACKLIST_MAX_FAILURES`**: Quantidade de falhas consecutivas antes de banir temporariamente o usuário.

---

## Estrutura do log único (`xcam_master.log`)

Cada entrada segue o modelo:
```json
{
  "timestamp": "2025-06-06T06:15:00Z",
  "sessao": "busca|gravação|blacklist|commit|erro|...",
  "evento": "...",
  "id": "...",         // identificador único (primário)
  "username": "...",   // nome do usuário para exibição
  "status": "...",     // ok|erro|blacklisted|expirado|...
  "detalhes": "...",   // informações adicionais
}
```

---

## Funções utilitárias para o log

- **`append_log(entry, log_path=LOG_PATH)`**: Adiciona uma nova entrada ao log central.
- **`read_logs(log_path=LOG_PATH)`**: Lê todas as entradas do log.
- **`query_logs(...)`**: Consulta entradas do log por filtros opcionais (sessão, id, status, etc).
- **`remove_logs(condition_fn, log_path=LOG_PATH)`**: Remove todas as entradas que satisfaçam a condição.
- **`update_log_entry(match_fn, update_fn, log_path=LOG_PATH)`**: Atualiza entradas do log conforme regra.

---

## Exemplo de uso das funções (a serem aplicadas nas próximas células)

```python
append_log({
    "sessao": "busca",
    "evento": "encontrado",
    "id": "abc123",
    "username": "Manugic_",
    "status": "ok",
    "detalhes": "URL válida"
})

# Consultar blacklist:
logs_blacklist = query_logs(sessao="blacklist", status="blacklisted")

# Remover registros expirados:
remove_logs(lambda entry: entry["sessao"] == "processing" and expirou(entry), log_path=LOG_PATH)

# Atualizar status:
update_log_entry(lambda e: e["id"]=="abc123", lambda e: e.update({"status":"ok"}))
```

---

## Função interativa

Permite ao usuário informar transmissões específicas a serem gravadas antes de iniciar o processamento.

---

## Segurança, rastreabilidade e manutenção

- Todos os parâmetros globais são definidos no início e propagados para todo o notebook, garantindo consistência.
- O log único fornece rastreabilidade detalhada e elimina arquivos dispersos (blacklist, falha, etc).
- Ajuste qualquer valor diretamente nesta célula para alterar o comportamento global do notebook de forma segura.
- Comentários detalhados auxiliam a compreensão, integração e manutenção por toda a equipe.

---

In [None]:
# ================================================================
# Célula 1: Configuração Global, Parâmetros e Utilitário de Log Único
# ================================================================
# Objetivo:
# - Centralizar configurações globais e thresholds
# - Definir e montar caminhos do notebook
# - Fornecer utilitário robusto para LOG ÚNICO MODULAR (JSONL)
#   => Todas as células e funções usarão este log para registrar, consultar e manipular eventos
# - Garantir padronização, rastreabilidade e fácil manutenção futura
#
# Estratégia aplicada (conforme plano):
# - Log único estruturado (JSONL): sessão, evento, id, username, timestamps, status, detalhes
# - Funções CRUD para log: adicionar, buscar, atualizar, remover (para blacklist, processing, falhas, auditoria)
# - Blacklist e controles baseados em id (com username apenas para exibição)
# - Parâmetros globais facilmente editáveis e propagados via globals()
# ================================================================

from google.colab import drive
drive.mount('/content/drive')

# ============================
# PARÂMETROS GLOBAIS EDITÁVEIS
# ============================
# Modifique abaixo conforme necessidade do ambiente ou processamento

# Limites e thresholds principais de processamento
LIMIT_DEFAULT = 50             # Máximo de transmissões processadas por rodada
PAGE_DEFAULT = 1               # Página padrão para busca na API
RECORD_SECONDS = 12780         # Duração máxima da gravação (em segundos)
RECORD_SECONDS_MIN = 660       # Duração mínima válida (em segundos)
API_SEARCH_LIMIT = 1500        # Limite ao buscar usuários específicos
COMMIT_PUSH_THRESHOLD = 25     # Quantidade de transmissões até commit/push automático (0 = commit imediato)

# Caminhos de arquivos principais
BASE_PATH = '/content'
LOG_PATH = f"{BASE_PATH}/xcam_master.log"          # Arquivo único de log central
BLACKLIST_TIMEOUT = 15 * 60                        # Blacklist: tempo de expiração (segundos)
BLACKLIST_MAX_FAILURES = 3                         # Blacklist: falhas para banimento temporário

# ============================
# ATUALIZAÇÃO GLOBAL DOS PARÂMETROS
# ============================
# Propaga parâmetros como globais do notebook
globals().update({
    'LIMIT_DEFAULT': LIMIT_DEFAULT,
    'PAGE_DEFAULT': PAGE_DEFAULT,
    'RECORD_SECONDS': RECORD_SECONDS,
    'RECORD_SECONDS_MIN': RECORD_SECONDS_MIN,
    'API_SEARCH_LIMIT': API_SEARCH_LIMIT,
    'COMMIT_PUSH_THRESHOLD': COMMIT_PUSH_THRESHOLD,
    'LOG_PATH': LOG_PATH,
    'BLACKLIST_TIMEOUT': BLACKLIST_TIMEOUT,
    'BLACKLIST_MAX_FAILURES': BLACKLIST_MAX_FAILURES
})

# =============================================================================
# UTILITÁRIO DE LOG ÚNICO MODULAR (JSONL)
# -----------------------------------------------------------------------------
# Cada entrada: {
#   "timestamp": "2025-06-06T06:15:00Z",
#   "sessao": "busca|gravação|blacklist|commit|erro|...",
#   "evento": "...",
#   "id": "...",         # sempre o identificador primário!
#   "username": "...",   # para exibição/auditoria
#   "status": "...",     # ok|erro|blacklisted|expirado|...
#   "detalhes": "...",   # info extra (motivo, paths, etc)
# }
# =============================================================================

def now_iso():
    """Retorna timestamp UTC em formato ISO."""
    from datetime import datetime
    return datetime.utcnow().isoformat() + "Z"

def append_log(entry, log_path=LOG_PATH):
    """
    Adiciona uma nova entrada ao log central (JSONL).
    Campos obrigatórios: sessao, evento, id, username, status.
    """
    entry.setdefault("timestamp", now_iso())
    # Garante campos essenciais para rastreabilidade
    for field in ["sessao", "evento", "id", "username", "status"]:
        entry.setdefault(field, "")
    with open(log_path, "a", encoding="utf-8") as f:
        f.write(json.dumps(entry, ensure_ascii=False) + "\n")

def read_logs(log_path=LOG_PATH):
    """Lê todas as entradas do log central."""
    if not os.path.exists(log_path):
        return []
    with open(log_path, "r", encoding="utf-8") as f:
        return [json.loads(line) for line in f if line.strip()]

def query_logs(sessao=None, id=None, username=None, evento=None, status=None, after=None, before=None, log_path=LOG_PATH):
    """
    Consulta entradas do log por filtros opcionais.
    - after/before: string ISO ou datetime
    """
    logs = read_logs(log_path)
    result = []
    for entry in logs:
        if sessao and entry.get("sessao") != sessao:
            continue
        if id and entry.get("id") != id:
            continue
        if username and entry.get("username") != username:
            continue
        if evento and entry.get("evento") != evento:
            continue
        if status and entry.get("status") != status:
            continue
        ts = entry.get("timestamp")
        if after:
            after_val = after if isinstance(after, str) else after.isoformat()
            if ts < after_val:
                continue
        if before:
            before_val = before if isinstance(before, str) else before.isoformat()
            if ts > before_val:
                continue
        result.append(entry)
    return result

def remove_logs(condition_fn, log_path=LOG_PATH):
    """
    Remove do log central todas as entradas que satisfaçam condition_fn(entry).
    Útil para expurgar logs expirados, blacklists vencidas, eventos processados, etc.
    """
    logs = read_logs(log_path)
    kept = [entry for entry in logs if not condition_fn(entry)]
    with open(log_path, "w", encoding="utf-8") as f:
        for entry in kept:
            f.write(json.dumps(entry, ensure_ascii=False) + "\n")
    return len(logs) - len(kept)

def update_log_entry(match_fn, update_fn, log_path=LOG_PATH):
    """
    Atualiza entradas do log central: se match_fn(entry)==True, aplica update_fn(entry).
    Exemplo: promover status de "pending" para "ok".
    """
    logs = read_logs(log_path)
    updated = 0
    for entry in logs:
        if match_fn(entry):
            update_fn(entry)
            updated += 1
    with open(log_path, "w", encoding="utf-8") as f:
        for entry in logs:
            f.write(json.dumps(entry, ensure_ascii=False) + "\n")
    return updated

# Exemplos de uso (para as próximas células):
# append_log({"sessao":"busca", "evento":"encontrado", "id":"abc123", "username":"Manugic_", "status":"ok", "detalhes":"URL válida"})
# logs_blacklist = query_logs(sessao="blacklist", status="blacklisted")
# remove_logs(lambda entry: entry["sessao"]=="processing" and expirou(entry), log_path=LOG_PATH)

# =============================================================================
# FUNÇÃO INTERATIVA (opcional) PARA ESCOLHA DE TRANSMISSÕES ESPECÍFICAS
# =============================================================================
def perguntar_transmissoes_especificas():
    """
    Pergunta ao usuário se deseja informar transmissões específicas para gravar,
    recebendo nomes de usuário separados por vírgula e retornando lista limpa.
    Retorna lista vazia caso não deseje selecionar usuários.
    """
    resp = input('Deseja gravar alguma transmissão específica? (sim/não): ').strip().lower()
    if resp.startswith('s'):
        usuarios = input('Informe o(s) nome(s) de usuário, separados por vírgula (ex: userNovo234, jovemPT): ')
        usuarios_lista = [u.strip() for u in usuarios.split(',') if u.strip()]
        return usuarios_lista
    return []

# =============================================================================
# DICA DE USO EM OUTRAS CÉLULAS:
# - Para registrar evento: append_log({...})
# - Para consultar blacklist: query_logs(sessao="blacklist", status="blacklisted")
# - Para remover registros expirados: remove_logs(lambda e: ...)
# - Para atualizar status: update_log_entry(lambda e: ..., lambda e: ...)
# =============================================================================

# ============================
# FIM DA CÉLULA 1
# ============================

# Célula 2: Instalação e Validação do ffmpeg

**Objetivo:**  
Esta célula garante que o utilitário `ffmpeg` esteja instalado e disponível no ambiente Google Colab. O ffmpeg é indispensável para a gravação dos vídeos das transmissões e para o processamento de mídia ao longo do pipeline do notebook XCam.

## Pontos principais e melhorias implementadas

- **Verificação pré-instalação:**  
  Antes de instalar, verifica se o ffmpeg já está disponível no ambiente, tornando o processo idempotente e eficiente.
- **Instalação automatizada:**  
  Efetua a instalação via `apt-get` apenas se necessário, reduzindo o tempo de setup em execuções futuras.
- **Validação pós-instalação:**  
  Exibe a versão instalada do ffmpeg, garantindo transparência e rastreabilidade.
- **Mensagens detalhadas:**  
  O usuário recebe logs informativos sobre cada etapa, facilitando o diagnóstico em caso de erros.
- **Design modular:**  
  Estrutura pronta para ser utilizada em outros ambientes (Colab, local, server) com pequenas adaptações.

---

## Como funciona a célula

- **Verifica se o ffmpeg está instalado (no PATH do sistema).**
- **Se não estiver, instala automaticamente via apt-get.**
- **Valida e exibe a versão instalada após o processo.**
- **Em caso de falha, exibe erro detalhado e interrompe o fluxo para evitar inconsistências futuras.**

---

## Exemplo de uso das funções nesta célula

```python
if not is_ffmpeg_installed():
    install_ffmpeg()
show_ffmpeg_version()
```

---

## Segurança, rastreabilidade e manutenção

- A célula torna o setup do ambiente mais robusto, impedindo falhas silenciosas relacionadas à ausência de ffmpeg.
- Mensagens e validações ajudam a equipe a identificar rapidamente problemas de ambiente ou permissões.
- O padrão modular facilita a reutilização do código em diferentes notebooks ou pipelines do projeto XCam.

---

In [None]:
# ================================================================
# Célula 2: Instalação e Validação do FFMPEG no Colab
# ================================================================
# Objetivo:
# - Garantir que o utilitário ffmpeg está instalado e disponível no ambiente
# - Validar a instalação e exibir a versão instalada
# - Tornar a etapa idempotente, evitando instalações desnecessárias
# - Fornecer feedback claro e orientações em caso de erro
#
# Estratégia aplicada:
# - Instalação via apt-get apenas se ffmpeg não estiver disponível
# - Validação pós-instalação
# - Logs claros e comentários detalhados para rastreabilidade
# ================================================================

import subprocess

def is_ffmpeg_installed():
    """
    Verifica se o ffmpeg está instalado e disponível no PATH do sistema.
    Retorna True se estiver, False caso contrário.
    """
    try:
        result = subprocess.run(["ffmpeg", "-version"], capture_output=True, text=True)
        return result.returncode == 0
    except FileNotFoundError:
        return False

def install_ffmpeg():
    """
    Instala o ffmpeg via apt-get caso não esteja presente.
    """
    print("[INFO] Instalando ffmpeg via apt-get...")
    # Atualiza pacotes e instala ffmpeg silenciosamente
    !apt-get update -y > /dev/null
    !apt-get install -y ffmpeg > /dev/null
    print("[INFO] ffmpeg instalado com sucesso.")

def show_ffmpeg_version():
    """
    Exibe a versão instalada do ffmpeg.
    """
    print("[INFO] Versão do ffmpeg instalada:")
    !ffmpeg -version | head -n 2

# ============================
# EXECUÇÃO DA ETAPA DE SETUP
# ============================

if not is_ffmpeg_installed():
    print("[WARN] ffmpeg não encontrado no ambiente.")
    install_ffmpeg()
    if not is_ffmpeg_installed():
        raise RuntimeError("[ERRO] Falha ao instalar o ffmpeg. Verifique permissões ou tente novamente.")
else:
    print("[OK] ffmpeg já está instalado no ambiente.")

# Validação final e exibição da versão
show_ffmpeg_version()

# ============================
# FIM DA CÉLULA 2
# ============================

# Dica: ffmpeg deve estar disponível para todas as células subsequentes.
# Se precisar de um caminho específico, utilize `which ffmpeg` para obter o path absoluto.

# Célula 3: Imports Essenciais, Utilitários e Preparação do Ambiente

**Objetivo:**  
Importa todas as bibliotecas essenciais do Python necessárias para o funcionamento do notebook, incluindo módulos para requisições HTTP, processamento paralelo, manipulação de datas, controle de subprocessos e exibição interativa.  
Centraliza funções utilitárias robustas e padronizadas para processamento, download de poster, geração automática de poster com ffmpeg e exibição de progresso.  

## Principais pontos e melhorias implementadas

- **Centralização de imports essenciais:**  
  Todos os módulos fundamentais (os, requests, multiprocessing, datetime, json, time, subprocess, math, re, IPython) estão disponíveis e prontos para uso global.
- **Funções utilitárias padronizadas:**  
  Funções para formatação de segundos, exibição de progresso, download e validação de poster e geração de poster via ffmpeg foram refatoradas e documentadas, seguindo arquitetura modular e Clean Architecture.
- **Remoção de logs temporários dispersos:**  
  O antigo arquivo de log de processamento temporário foi descontinuado em favor do log único centralizado definido na Célula 1, promovendo rastreabilidade e controle total.
- **Robustez e clareza:**  
  Todas as funções possuem tratamento de erros, mensagens amigáveis e são preparadas para uso concorrente e integração com as próximas etapas do pipeline.
- **Pronto para uso em todo o notebook:**  
  As funções aqui definidas são utilizadas em toda a automação, garantindo reuso, legibilidade e manutenção facilitada.

---

## Funções utilitárias disponíveis nesta célula

- **`format_seconds(seconds)`**: Formata um valor em segundos para string legível (ex: "1h23m45s").
- **`log_progress(username, elapsed_seconds, total_seconds)`**: Exibe o progresso da gravação de cada transmissão.
- **`download_and_save_poster(poster_url, username, temp_folder)`**: Baixa e salva o poster da transmissão a partir de uma URL remota ou retorna se for um caminho local.
- **`generate_poster_with_ffmpeg(m3u8_url, username, temp_folder, frame_time=7, timeout=20)`**: Gera automaticamente um poster usando ffmpeg, após validar a disponibilidade do stream.
- **`is_poster_valid(poster_path)`**: Verifica se o arquivo de poster é válido (existe e não está vazio).

---

## Exemplo de uso das funções

```python
# Formatar segundos em string legível
tempo = format_seconds(385)
# Exibir progresso
log_progress("userNovo234", 385, 12780)
# Download do poster
poster_path = download_and_save_poster(url_poster, "userNovo234", "/content/temp")
# Geração automática de poster via ffmpeg (se necessário)
if not is_poster_valid(poster_path):
    poster_path = generate_poster_with_ffmpeg(m3u8_url, "userNovo234", "/content/temp")
```

---

## Segurança, rastreabilidade e manutenção

- Todas as funções são preparadas para tratamento de erros e integração com processos concorrentes.
- O log temporário de processamento foi removido, garantindo que todo o rastreio e auditoria sejam feitos via log único centralizado da Célula 1.
- Comentários detalhados facilitam manutenção, entendimento e evolução do notebook.

---

# Célula 4: Clonagem do Repositório GitHub no Colab e Google Drive

**Objetivo:**  
Esta célula garante que o repositório do projeto XCam seja sempre clonado de forma limpa e sincronizada no ambiente local do Colab e, se disponível, também no Google Drive para persistência.  
Assegura ambiente pronto, atualizado, seguro para gravações e processamento, e prepara diretórios padronizados para integração com o restante do pipeline.

## Principais pontos e melhorias implementadas

- **Clonagem idempotente e limpa:**  
  Remove repositórios antigos antes de clonar para evitar conflitos, arquivos órfãos ou problemas de sincronização.
- **Clonagem para ambiente temporário e persistente:**  
  O repositório é clonado tanto para `/content` (Colab) quanto para o Drive (`/content/drive/MyDrive/XCam.Drive`) se o Drive estiver montado.
- **Preparação de diretórios de gravação e processamento:**  
  Estrutura de diretórios temporários criada automaticamente, garantindo organização dos dados.
- **Exportação de variáveis globais:**  
  Todos os caminhos, URLs e configurações relevantes são disponibilizados via `globals().update()` para uso em todo o notebook.
- **Mensagens e validações detalhadas:**  
  Feedback informativo sobre o status de cada etapa, facilitando o diagnóstico e a manutenção.
- **Pronto para CI/CD e integrações futuras:**  
  Token e URLs preparados para automações, integrações externas e uploads (Abyss.to, etc).

---

## Parâmetros globais definidos nesta célula

- **`GITHUB_USER`**, **`GITHUB_REPO`**, **`GITHUB_BRANCH`**, **`GITHUB_TOKEN`**: Configurações do repositório e autenticação.
- **`repo_url`**: URL do repositório autenticada para clone/push.
- **`TEMP_OUTPUT_FOLDER`**: Pasta para gravações temporárias.
- **`BASE_REPO_FOLDER`**: Localização do repositório no ambiente Colab.
- **`DRIVE_MOUNT`**, **`DRIVE_REPO_FOLDER`**: Caminhos no Google Drive para persistência (se montado).
- **`ABYSS_UPLOAD_URL`**: URL de upload para integração com sistemas externos.

---

## Como funciona a célula

- **Remove repositórios antigos e diretórios temporários**, evitando resíduos de execuções anteriores.
- **Clona o repositório do GitHub** para `/content` (Colab).
- **Se o Google Drive estiver montado**, faz o mesmo clone no diretório persistente do Drive.
- **Cria diretórios temporários necessários** para gravações e arquivos intermediários.
- **Exporta todas as variáveis configuradas** para uso global no notebook.
- **Exibe mensagens informativas** sobre cada etapa e alerta caso o Drive não esteja disponível.

---

## Exemplo de uso das variáveis globais

```python
print(BASE_REPO_FOLDER)        # Caminho do repositório clonado no Colab
print(DRIVE_REPO_FOLDER)      # Caminho do repositório no Drive (se montado)
print(TEMP_OUTPUT_FOLDER)     # Pasta temporária para gravações
print(ABYSS_UPLOAD_URL)       # URL de upload para integração externa
```

---

## Segurança, rastreabilidade e manutenção

- Garantia de ambiente limpo a cada execução, evitando conflitos de arquivos e branches.
- Persistência dos dados no Drive (se montado), evitando perda de gravações em caso de reinicialização do Colab.
- Comentários detalhados e estrutura modular facilitam a manutenção, integração com CI/CD e futuras expansões no pipeline do XCam.

---

In [None]:
# ================================================================
# Célula 4: Clonagem do Repositório GitHub no Colab e no Google Drive
# ================================================================
# Objetivo:
# - Garantir ambiente limpo e sincronizado para o repositório XCam em todas as execuções
# - Clonar o repositório tanto para o ambiente efêmero do Colab quanto para o Google Drive (persistência)
# - Preparar diretórios de trabalho para gravações e processamento temporário
# - Fornecer feedback claro sobre o status da operação
#
# Estratégia aplicada:
# - Remove repositórios antigos antes de clonar (evita conflitos e arquivos órfãos)
# - Utiliza token pessoal para autenticação segura e push futuro (CI/CD)
# - Cria estrutura de diretórios padronizada (módulos, gravações, cache, etc.)
# - Valida se o Drive está montado antes de tentar operações persistentes
# - Comentários detalhados para fácil manutenção e evolução
# ================================================================

# ============================
# CONFIGURAÇÕES DO GITHUB
# ============================
GITHUB_USER = "SamuelPassamani"
GITHUB_REPO = "XCam"
GITHUB_BRANCH = "main"
GITHUB_TOKEN = "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"

repo_url = f"https://{GITHUB_USER}:{GITHUB_TOKEN}@github.com/{GITHUB_USER}/{GITHUB_REPO}.git"

# ============================
# CLONAGEM PARA O COLAB
# ============================
print(f"⏳ Limpando ambiente e clonando '{GITHUB_REPO}' para o Colab...")
!rm -rf {GITHUB_REPO}
!git clone -b {GITHUB_BRANCH} {repo_url}
print(f"✅ Repositório clonado em /content/{GITHUB_REPO}")

# ============================
# ESTRUTURA DE DIRETÓRIOS TEMPORÁRIOS
# ============================
TEMP_OUTPUT_FOLDER = "/content/temp_recordings"  # Para gravações temporárias
BASE_REPO_FOLDER = f"/content/{GITHUB_REPO}"

# ============================
# CLONAGEM PARA O GOOGLE DRIVE (PERSISTÊNCIA)
# ============================
DRIVE_MOUNT = "/content/drive/MyDrive/XCam.Drive"
DRIVE_REPO_FOLDER = f"{DRIVE_MOUNT}/{GITHUB_REPO}"

import os

if os.path.exists(DRIVE_MOUNT):
    print(f"⏳ Limpando repositório antigo no Drive (se existir)...")
    !rm -rf "{DRIVE_REPO_FOLDER}"
    print(f"⏳ Clonando '{GITHUB_REPO}' para o Drive em {DRIVE_REPO_FOLDER} ...")
    !git clone -b {GITHUB_BRANCH} {repo_url} "{DRIVE_REPO_FOLDER}"
    print(f"✅ Repositório também clonado no Drive: {DRIVE_REPO_FOLDER}")
else:
    print(f"⚠️ Google Drive não está montado em {DRIVE_MOUNT}.\nℹ️ Use a célula de montagem antes de prosseguir para garantir persistência.")

# ============================
# CONFIGURAÇÃO DE ENDPOINTS DE UPLOAD/INTEGRAÇÃO
# ============================
ABYSS_UPLOAD_URL = 'http://up.hydrax.net/0128263f78f0b426d617bb61c2a8ff43'
globals().update({
    'GITHUB_USER': GITHUB_USER,
    'GITHUB_REPO': GITHUB_REPO,
    'GITHUB_BRANCH': GITHUB_BRANCH,
    'GITHUB_TOKEN': GITHUB_TOKEN,
    'repo_url': repo_url,
    'TEMP_OUTPUT_FOLDER': TEMP_OUTPUT_FOLDER,
    'BASE_REPO_FOLDER': BASE_REPO_FOLDER,
    'DRIVE_MOUNT': DRIVE_MOUNT,
    'DRIVE_REPO_FOLDER': DRIVE_REPO_FOLDER,
    'ABYSS_UPLOAD_URL': ABYSS_UPLOAD_URL
})

# ============================
# FIM DA CÉLULA 4
# ============================

# Observações:
# - Os caminhos globais são exportados via globals().update() para uso em todo o notebook.
# - Recomenda-se sempre rodar esta célula após alterar tokens ou trocar branches para garantir ambiente limpo e sincronizado.
# - O endpoint ABYSS_UPLOAD_URL pode ser atualizado conforme integrações futuras.

# Célula 5: Commit e Push Automáticos (rec.json, posters, etc.)

**Objetivo:**  
Automatiza o processo de commit e push dos arquivos modificados (ex: rec.json, posters e demais artefatos importantes) para o repositório GitHub, garantindo rastreabilidade, atomicidade e integração contínua (CI/CD) do pipeline XCam.

## Principais pontos e melhorias implementadas

- **Função robusta e modular:**  
  A função `git_commit_and_push()` aceita um caminho único (string) ou uma lista de arquivos, permitindo commit em lote e integração com estratégias de batch commit (threshold).
- **Configuração automatizada de usuário e e-mail do git:**  
  Garante commits válidos para rastreabilidade, auditoria e integração com pipelines automáticos.
- **Validação de caminhos e mensagens informativas:**  
  Apenas arquivos existentes são adicionados. Mensagens de sucesso, erro ou aviso detalhadas facilitam troubleshooting e manutenção.
- **Compatível com commit vazio:**  
  Permite o uso do parâmetro `--allow-empty` para garantir que o pipeline siga mesmo sem alterações detectadas, útil para sincronização e CI/CD.
- **Push autenticado via token:**  
  Utiliza o token pessoal fornecido nas variáveis globais para garantir push seguro e sem intervenção manual.
- **Design pronto para integração com logs centralizados:**  
  Recomenda-se registrar todas as ações relevantes de commit/push utilizando o log único modular definido na Célula 1.

---

## Parâmetros e variáveis globais utilizados

- **`GITHUB_USER`**, **`GITHUB_REPO`**, **`GITHUB_TOKEN`**: Definidos nas células anteriores para autenticação e configuração do repositório.
- **`repo_dir`**: Caminho absoluto do repositório clonado no ambiente Colab.
- **`file_paths`**: String ou lista de arquivos a serem commitados e enviados.
- **`commit_message`**: Mensagem do commit, customizável conforme a operação realizada.

---

## Como funciona a função principal

- **Valida a existência do repositório local** antes de prosseguir.
- **Aceita arquivos únicos ou múltiplos** para commit (string ou lista).
- **Adiciona apenas arquivos existentes** ao staging, com avisos para arquivos não encontrados.
- **Realiza commit (mesmo vazio) e push autenticado** para o repositório remoto.
- **Emite mensagens claras** de sucesso, erro ou aviso ao longo do processo.

---

## Exemplo de uso típico

```python
# Commit e push de um único arquivo
git_commit_and_push("data/rec.json", "Atualiza rec.json de gravação")

# Commit e push em lote (lista de arquivos)
git_commit_and_push([
    "data/rec.json",
    "posters/user1_poster.jpg",
    "posters/user2_poster.jpg"
], "Batch commit de múltiplos arquivos")
```

---

## Segurança, rastreabilidade e manutenção

- **Rastreabilidade garantida** por mensagens de commit claras e integração recomendada com o log modular (Célula 1).
- **Atomicidade** em operações batch, evitando inconsistências de dados no repositório.
- **Pronto para integração com pipelines CI/CD**, webhooks e controles de auditoria.
- **Mensagens e tratamento de erros detalhados** facilitam o diagnóstico e a evolução do sistema.

---

In [None]:
# ================================================================
# Célula 5: Commit e Push Automáticos (rec.json, posters, etc.)
# ================================================================
# Objetivo:
# - Automatizar o processo de commit e push dos arquivos modificados (rec.json, posters, etc.) para o repositório GitHub
# - Suportar tanto commit de arquivo único como em lote, permitindo estratégia de batch commit baseada em thresholds
# - Garantir rastreabilidade, atomicidade e integração segura (CI/CD)
#
# Estratégia aplicada:
# - Função modular e robusta, preparada para integração com logs e auditoria
# - Permite commit vazio por segurança, evitando falhas em pipelines sincronizados
# - Mensagens e tratamento de erros detalhados para facilitar troubleshooting
# - Utilização de variáveis globais para caminhos, usuário e token definidos nas células anteriores
# - Design pronto para evolução, reuso e integração com ferramentas externas (ex: webhooks, jobs, etc.)
# ================================================================

import os
import subprocess

def git_commit_and_push(file_paths, commit_message="Atualiza rec.json"):
    """
    Realiza git add, commit e push dos arquivos especificados.
    - file_paths pode ser uma string (arquivo único) ou uma lista de arquivos.
    - commit_message é a mensagem de commit utilizada.

    Estratégia:
    - Ajusta diretório para o repositório local clonado no Colab
    - Configura usuário e e-mail do git (necessários para CI/CD)
    - Adiciona arquivos ao staging (aceita múltiplos arquivos)
    - Realiza commit (permite commit vazio)
    - Realiza push autenticado via token
    """
    # ============================
    # VALIDAÇÃO E AJUSTE DE ENTRADAS
    # ============================
    repo_dir = f"/content/{GITHUB_REPO}"
    if not os.path.exists(repo_dir):
        raise FileNotFoundError(f"Repositório '{repo_dir}' não encontrado. Verifique se a célula de clonagem foi executada.")
    os.chdir(repo_dir)

    # Aceita string ou lista de arquivos
    if isinstance(file_paths, str):
        file_paths = [file_paths]
    elif not isinstance(file_paths, list):
        raise ValueError("file_paths deve ser uma string ou uma lista de caminhos.")

    # ============================
    # CONFIGURAÇÃO DO USUÁRIO GIT (CI/CD)
    # ============================
    subprocess.run(["git", "config", "user.email", "contato@aserio.work"], check=True)
    subprocess.run(["git", "config", "user.name", "SamuelPassamani"], check=True)

    # ============================
    # ADIÇÃO DOS ARQUIVOS AO STAGING
    # ============================
    for file_path in file_paths:
        # Verifica se o arquivo existe antes de adicionar
        if not os.path.exists(file_path):
            print(f"⚠️ Aviso: arquivo '{file_path}' não existe e será ignorado no commit.")
            continue
        subprocess.run(["git", "add", file_path], check=True)

    # ============================
    # COMMIT (PERMITE COMMIT VAZIO)
    # ============================
    try:
        subprocess.run(
            ["git", "commit", "-m", commit_message, "--allow-empty"],
            check=False  # Não força erro se não houver mudanças
        )
    except Exception as e:
        print(f"❌ Erro ao tentar realizar commit: {e}")

    # ============================
    # PUSH PARA O REPOSITÓRIO REMOTO (AUTENTICADO)
    # ============================
    try:
        remote_url = f"https://{GITHUB_USER}:{GITHUB_TOKEN}@github.com/{GITHUB_USER}/{GITHUB_REPO}.git"
        subprocess.run(
            ["git", "push", remote_url],
            check=True
        )
        print(f"✅ Push realizado com sucesso! ({commit_message})")
    except Exception as e:
        print(f"❌ Erro ao tentar realizar push: {e}")

# ============================
# FIM DA CÉLULA 5
# ============================

# Dicas e melhores práticas:
# - Use commit_messages claros e informativos para facilitar a auditoria.
# - Utilize a função dentro de loops ou triggers de batch para commit em lote.
# - Integre logs das ações de commit/push usando o log único centralizado (Célula 1).
# - Em caso de erro de autenticação, revise o token e as permissões do GitHub.

# Célula 6: Busca de Transmissões na API XCam, Blacklist Temporária, Fallback via liveInfo e Busca Inteligente/Unitária

**Objetivo:**  
Realizar a busca das transmissões ativas na API principal da XCam, mantendo o lote de transmissões sempre completo até o `LIMIT_DEFAULT` e sem duplicidades, utilizando controle de blacklist temporária e log de transmissões em processamento.  
Inclui funções de busca unitária/inteligente (para manter “lote cheio” continuamente) e gerenciamento automático de poster, com geração via ffmpeg quando necessário.

## Estratégia e melhorias implementadas

- **Blacklist temporária e controle de falhas:**  
  Usuários problemáticos são bloqueados temporariamente após atingirem o limite de falhas (`BLACKLIST_MAX_FAILURES`), acelerando o processamento e evitando ciclos infinitos.
- **Busca em lote e unitária com fallback:**  
  Consulta a API principal com limite alto para preencher o lote rapidamente. Caso necessário, realiza fallback via `/liveInfo` para usuários sem `src`.
- **Controle de duplicidade e fila inteligente:**  
  Antes de incluir qualquer transmissão, verifica no log de processamento e na blacklist para evitar tentativas repetidas ou paradas em streams problemáticos.
- **Poster garantido:**  
  Se o poster estiver ausente, inválido ou nulo, gera automaticamente uma imagem via ffmpeg a partir do stream, garantindo sempre um arquivo válido.
- **Eficiência e paralelismo:**  
  Todas as funções são preparadas para processamento paralelo e integração total ao pipeline XCam.
- **Compatibilidade:**  
  Suporte total à busca de usuários específicos, agora também protegida pela blacklist e controle de falhas.
- **Design modular:**  
  Funções separadas para busca em lote (`get_broadcasts`), busca por usuários (`buscar_usuarios_especificos`) e busca unitária/primeira transmissão livre (`buscar_proxima_transmissao_livre`), facilitando reuso e manutenção.

---

## Como funciona cada função

- **get_broadcasts:**  
  Retorna um lote de transmissões válidas, sempre checando blacklist, log de processamento e gerando poster se necessário. Realiza fallback automático para `/liveInfo` para usuários sem `src`.
- **buscar_usuarios_especificos:**  
  Busca apenas os usuários informados, respeitando sempre o controle de blacklist/falhas, e faz fallback via `/liveInfo` quando necessário.
- **buscar_proxima_transmissao_livre:**  
  Busca rapidamente a próxima transmissão livre para processamento, sempre utilizando os mesmos critérios de controle, garantindo agilidade na fila e eficiência máxima.

---

## Detalhes técnicos e recomendações

- **Blacklist temporária e controle de falhas:**  
  Funções `register_failure`, `clear_failure`, `add_to_blacklist`, `is_in_blacklist`, `load_blacklist` e `save_blacklist` garantem rastreabilidade e bloqueio eficiente de usuários problemáticos.
- **Arquitetura limpa e modular:**  
  Código preparado para integração futura com log único centralizado e processamento concorrente.
- **Poster sempre válido:**  
  Funções utilitárias garantem que cada transmissão só é liberada para gravação se houver poster válido (baixado ou gerado).
- **Tratamento de erros robusto:**  
  Toda etapa crítica possui tratamento de exceções e mensagens claras para facilitar manutenção e monitoramento.

---

## Exemplo de uso das funções

```python
# Buscar lote completo de transmissões válidas
streams = get_broadcasts(limit=LIMIT_DEFAULT)

# Buscar apenas usuários específicos
streams_especificos = buscar_usuarios_especificos(["user1", "user2"])

# Buscar a próxima transmissão livre disponível
proxima_stream = buscar_proxima_transmissao_livre()
```

---

## Rastreabilidade, manutenção e integração

- Blacklist e falhas podem ser migrados para o log centralizado para máxima rastreabilidade.
- Todas as funções são compatíveis com execução paralela e integração CI/CD.
- Mensagens detalhadas e arquitetura modular facilitam manutenção e futuras expansões no pipeline do XCam.

---

In [None]:
# ================================================================
# Célula 6: Blacklist, Falhas, Processamento e Funções de Busca de Transmissões
# ================================================================
# Este arquivo une as funções de controle (blacklist, falhas, processamento)
# e as funções de busca de transmissões, garantindo integração total.
# ================================================================

import os
import time
import requests
import json
import re
from datetime import datetime
import threading

# Funções utilitárias importadas da célula 3 (garante que estão disponíveis)
try:
    download_and_save_poster
    generate_poster_with_ffmpeg
    is_poster_valid
except NameError:
    def download_and_save_poster(*a, **kw): raise NotImplementedError('Função não definida!')
    def generate_poster_with_ffmpeg(*a, **kw): raise NotImplementedError('Função não definida!')
    def is_poster_valid(*a, **kw): raise NotImplementedError('Função não definida!')

# ============================
# PARÂMETROS E CAMINHOS GLOBAIS (ajuste conforme necessário)
# ============================
BLACKLIST_PATH = "/content/xcam_blacklist.log"    # Preferencialmente use log centralizado!
FAILURE_LOG_PATH = "/content/xcam_failures.log"   # Preferencialmente use log centralizado!
TEMP_OUTPUT_FOLDER = "/content/temp_recordings"   # Ajuste conforme seu ambiente
LIMIT_DEFAULT = 50
API_SEARCH_LIMIT = 1500
BLACKLIST_TIMEOUT = 15 * 60
BLACKLIST_MAX_FAILURES = 3

# ============================
# BLACKLIST TEMPORÁRIA - CRUD
# ============================
def load_blacklist():
    if not os.path.exists(BLACKLIST_PATH):
        return {}
    with open(BLACKLIST_PATH, "r") as f:
        now = time.time()
        lines = [line.strip().split(",") for line in f if line.strip()]
        return {user: float(ts) for user, ts in lines if now - float(ts) < BLACKLIST_TIMEOUT}

def save_blacklist(blacklist):
    with open(BLACKLIST_PATH, "w") as f:
        for user, ts in blacklist.items():
            f.write(f"{user},{ts}\n")

def add_to_blacklist(username):
    entry = {
        "sessao": "blacklist",
        "evento": "add",
        "id": username,
        "username": username,
        "status": "blacklisted",
        "detalhes": "Adicionado à blacklist",
        "timestamp": now_iso()
    }
    append_log(entry)
    print(f"⚠️ Usuário '{username}' adicionado à blacklist temporária.")

def is_in_blacklist(username):
    logs = query_logs(sessao="blacklist", id=username, status="blacklisted")
    if not logs:
        return False
    # Verifica expiração
    last = logs[-1]
    from datetime import datetime, timezone
    from dateutil import parser
    ts = parser.isoparse(last["timestamp"]).replace(tzinfo=timezone.utc).timestamp()
    if time.time() - ts < BLACKLIST_TIMEOUT:
        return True
    return False

# ============================
# CONTROLE DE FALHAS POR USUÁRIO
# ============================
def load_failures():
    if not os.path.exists(FAILURE_LOG_PATH):
        return {}
    with open(FAILURE_LOG_PATH, "r") as f:
        return {user: int(count) for user, count in (line.strip().split(",") for line in f if line.strip())}

def save_failures(failures):
    with open(FAILURE_LOG_PATH, "w") as f:
        for user, count in failures.items():
            f.write(f"{user},{count}\n")

def register_failure(username):
    fails = query_logs(sessao="failure", id=username)
    count = len([f for f in fails if f.get("status") == "fail"])
    entry = {
        "sessao": "failure",
        "evento": "fail",
        "id": username,
        "username": username,
        "status": "fail",
        "detalhes": f"Falha registrada. Total: {count+1}",
        "timestamp": now_iso()
    }
    append_log(entry)
    if count+1 >= BLACKLIST_MAX_FAILURES:
        add_to_blacklist(username)

def clear_failure(username):
    entry = {
        "sessao": "failure",
        "evento": "clear",
        "id": username,
        "username": username,
        "status": "ok",
        "detalhes": "Falhas zeradas",
        "timestamp": now_iso()
    }
    append_log(entry)

# ============================
# Funções para log de processamento
# ============================
def add_processing(username):
    entry = {
        "sessao": "processing",
        "evento": "add",
        "id": username,
        "username": username,
        "status": "processing",
        "detalhes": "Em processamento",
        "timestamp": now_iso()
    }
    append_log(entry)

def remove_processing(username):
    entry = {
        "sessao": "processing",
        "evento": "remove",
        "id": username,
        "username": username,
        "status": "done",
        "detalhes": "Removido do processamento",
        "timestamp": now_iso()
    }
    append_log(entry)

def is_processing(username):
    logs = query_logs(sessao="processing", id=username)
    if not logs:
        return False
    last = logs[-1]
    return last.get("status") == "processing"

# ================================================================
# Funções de Busca de Transmissões
# ================================================================
def buscar_transmissoes_base(url, params=None):
    try:
        response = requests.get(url, params=params, timeout=10)
        response.raise_for_status()
        data = response.json()
        # Garante que retorna a lista correta de transmissões (padrão da API XCam)
        if isinstance(data, dict) and "broadcasts" in data and "items" in data["broadcasts"]:
            return data["broadcasts"]["items"]
        return data
    except requests.exceptions.RequestException as e:
        print(f"❌ Erro ao buscar transmissões da API: {e}")
        return []

def validar_e_preparar_stream(stream_data, temp_folder=TEMP_OUTPUT_FOLDER):
    username = stream_data.get("username")
    if not username:
        print("⚠️ Stream sem username, ignorando.")
        return None
    if is_processing(username):
        return None
    if is_in_blacklist(username):
        return None
    poster_url = stream_data.get("poster")
    poster_temp_path = None
    if poster_url:
        poster_temp_path = download_and_save_poster(poster_url, username, temp_folder)
    if not is_poster_valid(poster_temp_path) and stream_data.get("src"):
        poster_temp_path = generate_poster_with_ffmpeg(stream_data["src"], username, temp_folder)
    if not is_poster_valid(poster_temp_path):
        register_failure(username)
        return None
    stream_data["poster_temp_path"] = poster_temp_path
    return stream_data

def get_broadcasts(limit=LIMIT_DEFAULT):
    print(f"⏳ Buscando até {limit} transmissões ativas na API...")
    streams_api = buscar_transmissoes_base("https://api.xcam.gay/?limit=1000", {"limit": 1000})
    if not streams_api or not isinstance(streams_api, list):
        print("❌ Falha ao obter transmissões da API principal.")
        return []
    valid_streams = []
    for stream in streams_api:
        if len(valid_streams) >= limit:
            break
        prepared_stream = validar_e_preparar_stream(stream)
        if prepared_stream:
            valid_streams.append(prepared_stream)
        elif isinstance(stream, dict) and not stream.get("src"):
            username = stream.get("username")
            if username:
                print(f"ℹ️ 'src' ausente para '{username}' na API principal, tentando fallback via /liveInfo...")
                stream_liveinfo = buscar_transmissoes_base(f"https://api.xcam.gay/user/{username}/liveInfo")
                if isinstance(stream_liveinfo, dict) and stream_liveinfo.get("src"):
                    prepared_stream_liveinfo = validar_e_preparar_stream(stream_liveinfo)
                    if prepared_stream_liveinfo:
                        valid_streams.append(prepared_stream_liveinfo)
                else:
                    register_failure(username)
    print(f"✅ Busca concluída. Encontradas {len(valid_streams)} transmissões válidas para processamento.")
    return valid_streams

def buscar_usuarios_especificos(usernames, limit=API_SEARCH_LIMIT):
    print(f"⏳ Buscando transmissões específicas para: {', '.join(usernames)}")
    valid_streams = []
    for username in usernames:
        if len(valid_streams) >= limit:
            break
        print(f"⏳ Buscando informações para usuário específico: {username}")
        stream_info = buscar_transmissoes_base(f"https://api.xcam.gay/user/{username}/liveInfo")
        if isinstance(stream_info, dict):
            prepared_stream = validar_e_preparar_stream(stream_info)
            if prepared_stream:
                valid_streams.append(prepared_stream)
                print(f"✅ Transmissão específica válida encontrada: {username} ({len(valid_streams)}/{limit})")
        else:
            print(f"❌ Não foi possível obter informações para o usuário específico: {username}")
    print(f"✅ Busca específica concluída. Encontradas {len(valid_streams)} transmissões válidas.")
    return valid_streams

def buscar_proxima_transmissao_livre():
    streams_api = buscar_transmissoes_base("https://api.xcam.gay/?limit=1000", {"limit": 20})
    if not streams_api or not isinstance(streams_api, list):
        return None
    for stream in streams_api:
        prepared_stream = validar_e_preparar_stream(stream)
        if prepared_stream:
            return prepared_stream
        elif isinstance(stream, dict) and not stream.get("src"):
            username = stream.get("username")
            if username:
                stream_liveinfo = buscar_transmissoes_base(f"https://api.xcam.gay/user/{username}/liveInfo")
                if isinstance(stream_liveinfo, dict) and stream_liveinfo.get("src"):
                    prepared_stream_liveinfo = validar_e_preparar_stream(stream_liveinfo)
                    if prepared_stream_liveinfo:
                        return prepared_stream_liveinfo
    return None

# ================================================================
# FIM DO ARQUIVO UNIFICADO
# ================================================================


# Célula 7: Gravação da Stream, Poster Automático, Controle de Falhas, Log Seguro e Blacklist Inteligente

**Objetivo:**  
Automatizar a gravação de transmissões ao vivo com ffmpeg, garantindo robustez, rastreabilidade e integração com a lógica de blacklist temporária e controle de falhas. A célula também assegura o gerenciamento seguro do log de transmissões em processamento e a limpeza de arquivos temporários.

## Estratégia e melhorias implementadas

- **Gerenciamento seguro de log:**  
  O usuário é registrado no log de transmissões em processamento antes da gravação e removido dele ao final (tanto em sucesso quanto em erro), evitando duplicidade e permitindo paralelismo seguro.
- **Poster sempre válido:**  
  O sistema tenta baixar o poster da API. Se o poster estiver ausente, inválido ou nulo, gera automaticamente uma imagem via ffmpeg, assegurando que toda transmissão tenha um poster associado e válido.
- **Controle de tempo mínimo:**  
  Se a gravação resultar em vídeo muito curto, tanto o arquivo de vídeo quanto o poster são descartados imediatamente, e uma falha é registrada para o usuário.
- **Tratamento robusto de falhas:**  
  Qualquer falha (ffmpeg, exceptions, etc.) é registrada. Ao atingir o número máximo de falhas consecutivas (`BLACKLIST_MAX_FAILURES`), o usuário entra automaticamente na blacklist temporária, evitando tentativas infinitas e desperdício de recursos.
- **Limpeza automatizada:**  
  Após upload ou erro, todos os arquivos temporários (vídeo e poster) são removidos, otimizando o uso do disco e mantendo o ambiente do Colab limpo.
- **Reset de falhas em caso de sucesso:**  
  Quando a gravação é válida, o contador de falhas do usuário é limpo, evitando blacklist indevida.
- **Comentários detalhados e código modular:**  
  O fluxo é completamente documentado, facilitando manutenção, revisão e entendimento por toda a equipe.

---

## Fluxo resumido da função principal

1. **Registra o usuário** no log de transmissões em processamento.
2. **Garante um poster válido** (download ou geração automática).
3. **Executa o ffmpeg** para gravar a transmissão e monitora o progresso em tempo real.
4. **Valida a gravação**:
   - Se falhar, registra falha e trata blacklist.
   - Se for curta demais, descarta e registra falha.
   - Se for válida, limpa contador de falhas e prossegue normalmente.
5. **Após upload ou erro**, remove o usuário do log e limpa arquivos temporários.

---

## Exemplo de uso

```python
resultado = gravar_stream(username="user123", m3u8_url="https://cdn.xcam.gay/m3u8/...", poster_url="https://api.xcam.gay/poster/...")
if resultado['upload_success']:
    print("Gravação e upload realizados com sucesso!")
else:
    print("Falha na gravação ou upload:", resultado['abyss_response'])
```

---

## Segurança, rastreabilidade e integração

- **Pronto para CI/CD e execução paralela:**  
  Controle rigoroso de log e blacklist garante execução concorrente, segura e rastreável por todo o pipeline XCam.
- **Integração total com as funções globais:**  
  Utiliza funções de blacklist e falha da Célula 6, promovendo rastreabilidade e controle centralizado.
- **Diagnóstico facilitado:**  
  Mensagens e logs detalhados em cada etapa do processo.

---

In [None]:
# ================================================================
# Célula 7: Gravação Automática de Transmissão, Controle de Log, Limpeza e Blacklist Inteligente
# ================================================================
# Objetivo:
# - Gravar transmissões ao vivo utilizando ffmpeg, com controle rigoroso de log de processamento, tratamento de falhas e integração com blacklist temporária.
# - Garantir que cada transmissão seja registrada no log de processamento no início e removida ao final (sucesso ou erro), evitando duplicidade ou processamento concorrente.
# - Registrar falhas (ffmpeg, duração insuficiente, poster inválido), escalando usuários para a blacklist temporária ao atingir o limite de tentativas, conforme regras globais (Célula 6).
# - Limpar arquivos temporários após uso.
# - Modular e pronto para integração com pipelines CI/CD, concorrência e integração total ao pipeline XCam.
# ================================================================

def get_video_duration(filepath):
    """
    Retorna a duração real do arquivo mp4, em segundos, utilizando ffprobe.
    Retorna None em caso de erro ou se o arquivo não existir.
    """
    import subprocess
    import json
    try:
        if not os.path.exists(filepath):
            print(f"⚠️ Arquivo para ffprobe não encontrado: {filepath}")
            return None
        cmd = [
            "ffprobe", "-v", "error",
            "-show_entries", "format=duration",
            "-of", "json",
            filepath
        ]
        result = subprocess.run(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE, text=True)
        info = json.loads(result.stdout)
        duration = float(info["format"]["duration"])
        return int(round(duration))
    except Exception as e:
        print(f"⚠️ Não foi possível obter duração via ffprobe para {filepath}: {e}")
        return None

def gravar_stream(username, m3u8_url, poster_url=None, poster_frame_time=7):
    """
    Grava a transmissão ao vivo do usuário usando ffmpeg, com controle de erros, log e integração à blacklist.
    - Adiciona usuário ao log de processamento no início.
    - Remove do log ao finalizar, independentemente do resultado (robusto via finally).
    - Em caso de falha do ffmpeg ou gravação muito curta, registra falha do usuário.
    - Ao atingir N falhas consecutivas, usuário entra na blacklist (funções globais).
    - Limpa arquivos temporários ao final.
    - Garante poster válido: baixa da poster_url, ou gera automaticamente com ffmpeg se ausente/inválido.
    - poster_frame_time: segundo do vídeo onde a captura do poster será feita, se necessário.
    """
    try:
        add_processing(username)
    except Exception as e:
        print(f"❌ Erro ao registrar transmissão em processamento no log: {e}")

    start_time_dt = datetime.now()
    data_str = start_time_dt.strftime("%d-%m-%Y")
    horario_str = start_time_dt.strftime("%H-%M")
    temp_filename = f"{username}_{start_time_dt.strftime('%Y%m%d_%H%M%S')}_temp.mp4"
    filepath = os.path.join(TEMP_OUTPUT_FOLDER, temp_filename)

    print(f"\n🎬 Iniciando gravação de: {username} (URL: {m3u8_url}) em {filepath}")

    # Garante poster válido
    poster_temp_path = None
    if poster_url:
        poster_temp_path = download_and_save_poster(poster_url, username, TEMP_OUTPUT_FOLDER)
    if not is_poster_valid(poster_temp_path) and m3u8_url:
        poster_temp_path = generate_poster_with_ffmpeg(m3u8_url, username, TEMP_OUTPUT_FOLDER, frame_time=poster_frame_time)

    ffmpeg_cmd = [
        "ffmpeg", "-i", m3u8_url,
        "-t", str(RECORD_SECONDS),
        "-c", "copy", "-y", filepath
    ]

    start_time_process = time.time()
    process = None

    try:
        process = subprocess.Popen(
            ffmpeg_cmd,
            stdout=subprocess.PIPE,
            stderr=subprocess.STDOUT,
            text=True,
            bufsize=1,
            universal_newlines=True
        )

        # Monitoramento de progresso do ffmpeg (logs em tempo real)
        elapsed_seconds = 0
        last_log_minute = -1
        while True:
            line = process.stdout.readline()
            if not line and process.poll() is not None:
                break
            if "time=" in line:
                try:
                    match = re.search(r"time=(\d+):(\d+):(\d+)", line)
                    if match:
                        h, m, s = map(int, match.groups())
                        elapsed_seconds = h * 3600 + m * 60 + s
                        if elapsed_seconds // 60 != last_log_minute:
                            log_progress(username, elapsed_seconds, RECORD_SECONDS)
                            last_log_minute = elapsed_seconds // 60
                except Exception:
                    pass

        process.wait()
        end_time_process = time.time()
        elapsed_seconds_proc = round(end_time_process - start_time_process)
        log_progress(username, elapsed_seconds_proc, RECORD_SECONDS)

        # Se FFmpeg falhou, registra falha para o usuário e retorna erro
        if process.returncode != 0:
            print(f"❌ FFmpeg falhou para {username}. Código de saída: {process.returncode}")
            register_failure(username)
            return {
                'username': username,
                'filename': temp_filename,
                'filepath': filepath,
                'upload_success': False,
                'abyss_response': "Gravação FFmpeg falhou"
            }

        # Validação pelo tempo real do arquivo gravado (robusta)
        elapsed_seconds_real = get_video_duration(filepath)
        if elapsed_seconds_real is not None:
            print(f"✅ Duração real do arquivo gravado: {elapsed_seconds_real}s (ffprobe)")
        else:
            print(f"⚠️ Não foi possível aferir duração real, usando a do processo: {elapsed_seconds_proc}s")
            elapsed_seconds_real = elapsed_seconds_proc

        if elapsed_seconds_real < RECORD_SECONDS_MIN:
            print(f"⏩ Duração gravada ({elapsed_seconds_real}s) menor que o mínimo ({RECORD_SECONDS_MIN}s). Arquivo descartado.")
            register_failure(username)
            if os.path.exists(filepath): os.remove(filepath)
            if poster_temp_path and os.path.exists(poster_temp_path): os.remove(poster_temp_path)
            return {
                'username': username,
                'filename': temp_filename,
                'filepath': filepath,
                'upload_success': False,
                'abyss_response': "Gravação muito curta (descartada)"
            }

        # Sucesso: limpa falhas acumuladas do usuário
        clear_failure(username)
        tempo_formatado = format_seconds(elapsed_seconds_real)
        final_filename = f"{username}_{data_str}_{horario_str}_{tempo_formatado}.mp4"
        final_filepath = os.path.join(TEMP_OUTPUT_FOLDER, final_filename)

        try:
            os.rename(filepath, final_filepath)
            print(f"✅ Arquivo renomeado para: {final_filename}")
            filepath_for_upload = final_filepath
            filename_for_upload = final_filename
        except Exception as e:
            print(f"❌ Erro ao renomear arquivo {temp_filename} para {final_filename}: {e}")
            filepath_for_upload = filepath
            filename_for_upload = temp_filename

        # Realiza upload e atualização do banco de dados (json)
        success, abyss_resp, slug = upload_to_abyss_and_update_json(
            filepath_for_upload, username, elapsed_seconds_real,
            poster_temp_path=poster_temp_path
        )

        return {
            'username': username,
            'filename': filename_for_upload,
            'filepath': filepath_for_upload,
            'upload_success': success,
            'abyss_response': abyss_resp,
            'slug': slug
        }

    except FileNotFoundError:
        print(f"❌ Erro: Comando 'ffmpeg' não encontrado. Certifique-se de que foi instalado corretamente.")
        register_failure(username)
        return {
            'username': username,
            'filename': None,
            'filepath': None,
            'upload_success': False,
            'abyss_response': "Comando FFmpeg não encontrado"
        }
    except Exception as e:
        print(f"❌ Erro inesperado durante a execução do FFmpeg para {username}: {e}")
        register_failure(username)
        return {
            'username': username,
            'filename': None,
            'filepath': None,
            'upload_success': False,
            'abyss_response': f"Erro inesperado na execução do FFmpeg: {e}"
        }
    finally:
        # Remoção segura do usuário do log de transmissões em processamento
        try:
            remove_processing(username)
        except Exception as e:
            print(f"❌ Erro ao remover transmissão do log de processamento: {e}")

        # Limpeza do arquivo de vídeo pós-upload
        if 'filepath_for_upload' in locals() and os.path.exists(filepath_for_upload):
            try:
                os.remove(filepath_for_upload)
                print(f"🗑️ Arquivo de vídeo removido do Colab: {filepath_for_upload}")
            except Exception as e:
                print(f"⚠️ Não foi possível remover o arquivo de vídeo temporário: {e}")

        # Limpeza do poster temporário
        if poster_temp_path and os.path.exists(poster_temp_path):
            try:
                os.remove(poster_temp_path)
                print(f"🗑️ Poster temporário removido: {poster_temp_path}")
            except Exception as e:
                print(f"⚠️ Não foi possível remover o poster temporário: {e}")

# ================================================================
# FIM DA CÉLULA 7 — Gravação, Log e Blacklist Inteligente
# ================================================================

# Observações e recomendações:
# - Use sempre as funções globais de blacklist/falha da Célula 6 para máxima rastreabilidade.
# - Mensagens claras e detalhadas facilitam diagnóstico, CI/CD e manutenção.
# - Pronto para execução concorrente e integração total com pipeline modular do XCam.

# Célula 8: Upload para Abyss.to, Atualização do rec.json, Commit Poster e Sincronização com Google Drive

**Objetivo:**  
Realizar upload do vídeo gravado para Abyss.to, registrar e atualizar todos os metadados relevantes no arquivo `rec.json` do usuário, garantir a movimentação/renomeação adequada do poster e executar o commit/push automatizado de arquivos alterados, sincronizando também com o Google Drive.  
O processo é otimizado para processamento em lote: os arquivos modificados só são enviados quando o número atingir o limiar (`COMMIT_PUSH_THRESHOLD`), promovendo eficiência e integridade do repositório, mesmo em execução paralela.

---

## Estratégia e melhorias implementadas

- **Commit/push em lote otimizado:**  
  Arquivos alterados são acumulados em um buffer. O commit e push são executados automaticamente apenas quando a quantidade de arquivos atinge o threshold configurado, reduzindo conflitos e otimizando o workflow CI/CD.
- **Sincronização automática com o Google Drive:**  
  Sempre que `rec.json` ou poster são atualizados, uma cópia é feita para o diretório correspondente do usuário no Google Drive (se disponível), garantindo redundância, persistência e facil acesso externo aos metadados e imagens.
- **Atomicidade e segurança em concorrência:**  
  O acesso ao buffer de commit é protegido por lock (`threading.Lock`), assegurando integridade mesmo em processamento paralelo ou múltiplos workers.
- **Poster sempre correto e rastreável:**  
  O poster utilizado é sempre movido/renomeado para o local definitivo e associado ao vídeo pelo slug. O caminho é sincronizado tanto no repositório quanto no Drive.
- **Atualização robusta do rec.json:**  
  O histórico do usuário é preenchido com todos os campos, incluindo poster, urlIframe, data, horário e tempo formatado. O padrão da estrutura JSON é rigorosamente seguido, facilitando a integração, análise e exportação dos dados.
- **Limpeza automática de arquivos temporários:**  
  Após mover, copiar e commitar os arquivos, os temporários são removidos, mantendo o ambiente Colab limpo e eficiente.

---

## Como funciona o fluxo principal

1. **Faz upload do vídeo para Abyss.to** e recebe a confirmação (slug, url, urlIframe).
2. **Move/renomeia o poster** para o local definitivo no repositório, associando ao vídeo pelo slug.
3. **Atualiza ou cria `rec.json`** do usuário, preenchendo todos os metadados da gravação.
4. **Adiciona arquivos alterados ao buffer de commit** (com lock para evitar concorrência).
5. **Sincroniza** `rec.json` e poster no Google Drive, mantendo redundância e facilidade de acesso.
6. **Executa commit/push automático em lote** ao final do processamento faz o commit/push dos arquivos restantes.
7. **Limpa arquivos temporários** garantindo eficiência e organização do ambiente.

---

## Exemplo de uso recomendado

```python
# Após concluir o upload e gerar poster:
upload_success, abyss_response, slug = upload_to_abyss_and_update_json(
    filepath=arquivo_video,
    username="usuario",
    duration_seconds=duracao,
    poster_temp_path=caminho_poster_temp
)

# Ao final do processamento, para garantir commit dos arquivos restantes:
commit_push_restantes()
```

---

## Segurança, rastreabilidade e integração

- **Processo compatível com execução concorrente** e pipelines CI/CD.
- **Commit/push protegido contra condições de corrida**, garantindo atomicidade dos dados no repositório.
- **Sincronização Drive robusta**, ideal para ambientes colaborativos ou para garantir backup.
- **Mensagens e logs claros** facilitam manutenção, auditoria e diagnóstico rápido em todo o pipeline XCam.

---

In [None]:
# ================================================================
# Célula 9: Processamento Automático, Paralelismo e Supervisor Dinâmico com Blacklist
# ================================================================
# Objetivo:
# - Controlar e orquestrar todo o pipeline do notebook, garantindo processamento contínuo, paralelo, eficiente e seguro de transmissões ao vivo.
# - O supervisor dinâmico mantém o lote sempre cheio, respeita a blacklist temporária e o log central, e integra todas as funções críticas das células anteriores, garantindo máxima resiliência e rastreabilidade.
#
# Estratégia aplicada:
# - Utiliza múltiplos processos para gravar e processar transmissões simultaneamente
# - O supervisor monitora constantemente as vagas livres no lote e preenche em tempo real com novas transmissões válidas
# - Consulta o log central de processamento para evitar duplicidade, mesmo em ambientes concorrentes ou paralelos
# - Transmissões de usuários em blacklist não são tentadas novamente durante o ciclo vigente
# - Cada etapa do processamento é registrada com timestamp, status e contexto
# - Ao final do ciclo (ou quando atingido o threshold), todos os arquivos alterados são enviados ao repositório
# ================================================================

from multiprocessing import Process, Manager # Import Manager here

def log_supervisor(msg, level="INFO"):
    """
    Log supervisor padronizado para todas as etapas do pipeline.
    """
    from datetime import datetime
    timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    print(f"[{timestamp}] [{level}] {msg}")

def worker(username, m3u8_url, poster_url, results):
    """
    Worker dedicado: grava a stream, faz upload, atualiza rec.json/poster, integra ao log.
    """
    log_supervisor(f"Iniciando gravação: {username} | URL: {m3u8_url} | Poster: {poster_url}", "WORKER")
    result = gravar_stream(username, m3u8_url, poster_url)
    log_supervisor(
        f"Finalizou gravação: {username} | Sucesso: {result.get('upload_success')} | "
        f"Arquivo: {result.get('filename')} | Abyss: {result.get('abyss_response')}", "WORKER")
    results.append(result)

def supervisor_dinamico(usuarios_especificos=None):
    """
    Supervisor dinâmico de transmissões ao vivo:
    - Mantém o lote de gravações sempre cheio, preenchendo vagas em tempo real.
    - Evita duplicidade e concorrência consultando log central.
    - Respeita blacklist temporária, não processando usuários bloqueados no ciclo vigente.
    - Integra-se com a lógica de blacklist, commit/push automático, limpeza de recursos e log robusto.
    - Modular e clareza, pronta para integração com pipelines CI/CD, execução concorrente e ambientes colaborativos.
    """

    # Determina o tamanho do lote com base no modo operacional
    pool_size = LIMIT_DEFAULT if not usuarios_especificos else API_SEARCH_LIMIT
    running = []
    results = Manager().list()
    seen_usernames = set()
    LOG_PROCESSAMENTO_PATH = "/content/xcam_processing.log"

    log_supervisor(f"Supervisor dinâmico iniciado | Lote alvo: {pool_size} | Modo: {'específico' if usuarios_especificos else 'automático'}")

    def atualizar_seen_usernames():
        """
        Atualiza o conjunto de usernames já processados diretamente do log central.
        Garante robustez em ambientes concorrentes e previne duplicidade.
        """
        if os.path.exists(LOG_PROCESSAMENTO_PATH):
            with open(LOG_PROCESSAMENTO_PATH, "r") as f:
                log_set = set([line.strip() for line in f if line.strip()])
                seen_usernames.update(log_set)

    def buscar_nova_transmissao():
        """
        Busca uma nova transmissão livre para preencher o lote:
        - Modo específico: busca em lista fornecida.
        - Modo automático: busca próxima transmissão livre disponível.
        - Sempre consulta blacklist e log central antes de lançar.
        """
        atualizar_seen_usernames()  # Sempre atualiza antes de buscar
        if usuarios_especificos:
            candidatos = buscar_usuarios_especificos(usuarios_especificos)
            for s in candidatos:
                username = s["username"]
                if username not in seen_usernames and not is_in_blacklist(username):
                    log_supervisor(f"Nova transmissão encontrada (específico): {username}", "BUSCA")
                    return s
            log_supervisor("Nenhuma transmissão específica livre encontrada (todos em blacklist/log ou offline).", "BUSCA")
            return None
        else:
            # Busca otimizada: tenta até 10 vezes buscar próxima transmissão livre
            for tentativa in range(1, 11):
                log_supervisor(f"Buscando próxima transmissão livre: tentativa {tentativa}", "BUSCA")
                stream = buscar_proxima_transmissao_livre()
                if stream:
                    username = stream["username"]
                    if username not in seen_usernames and not is_in_blacklist(username):
                        log_supervisor(f"Nova transmissão encontrada: {username}", "BUSCA")
                        return stream
                    else:
                        log_supervisor(f"Usuário {username} já processado ou em blacklist, ignorando.", "BUSCA")
            log_supervisor("Nenhuma transmissão livre encontrada após tentativas (todos em blacklist/log ou offline).", "BUSCA")
            return None

    # ========== Fase 1: Preenchimento do lote inicial ==========
    log_supervisor(f"Preenchendo lote inicial com até {pool_size} transmissões...", "STARTUP")
    tentativas = 0
    max_tentativas = 100
    while len(running) < pool_size and tentativas < max_tentativas:
        stream = buscar_nova_transmissao()
        if not stream:
            log_supervisor("Fim das transmissões disponíveis para preencher lote inicial.", "STARTUP")
            break
        username = stream["username"]
        seen_usernames.add(username)
        # Escreve no log imediatamente para evitar duplicidade em concorrência antes do .start()
        with open(LOG_PROCESSAMENTO_PATH, "a") as f:
            f.write(f"{username}\n")
        log_supervisor(f"Lançando processo para: {username} | {len(running)+1}/{pool_size}", "STARTUP")
        p = Process(target=worker, args=(username, stream["src"], stream.get("poster"), results))
        running.append(p)
        p.start()
        tentativas += 1

    log_supervisor(f"Lote inicial lançado com {len(running)} transmissões.", "STARTUP")

    # ========== Fase 2: Loop dinâmico de preenchimento contínuo ==========
    while True:
        antes = len(running)
        running = [p for p in running if p.is_alive()]
        depois = len(running)
        if antes != depois:
            log_supervisor(f"{antes-depois} gravações finalizaram. Vagas livres: {pool_size-len(running)}", "LOOP")
        vagas_livres = pool_size - len(running)
        if vagas_livres > 0:
            for _ in range(vagas_livres):
                stream = buscar_nova_transmissao()
                if not stream:
                    log_supervisor("Não há mais transmissões para preencher as vagas livres.", "LOOP")
                    break
                username = stream["username"]
                seen_usernames.add(username)
                with open(LOG_PROCESSAMENTO_PATH, "a") as f:
                    f.write(f"{username}\n")
                log_supervisor(f"Lançando nova gravação: {username} | Vaga preenchida {len(running)+1}/{pool_size}", "LOOP")
                p = Process(target=worker, args=(username, stream["src"], stream.get("poster"), results))
                running.append(p)
                p.start()
        if not running:
            log_supervisor("Todas as transmissões possíveis já foram processadas!", "END")
            break
        log_supervisor(
            f"Transmissões ativas: {len(running)} | Total processadas: {len(seen_usernames)} | Buffer de resultados: {len(results)}",
            "STATUS"
        )
        time.sleep(2)

    # ========== Fase 3: Commit/push final e encerramento ==========
    log_supervisor(f"Processamento dinâmico concluído! Total de transmissões gravadas/processadas: {len(results)}", "RESUMO")
    try:
        log_supervisor("Realizando commit/push final dos arquivos pendentes...", "FINALIZACAO")
        commit_push_restantes()
        log_supervisor("Commit/push final executado com sucesso.", "FINALIZACAO")
    except Exception as e:
        log_supervisor(f"Falha ao tentar commit/push final dos arquivos restantes: {e}", "ERRO")
    log_supervisor("Supervisor dinâmico finalizado.", "END")

def main():
    """
    Função principal: inicia o notebook perguntando se o usuário quer gravar transmissões específicas ou automáticas.
    Dispara o supervisor dinâmico na modalidade selecionada.
    """
    usuarios_especificos = perguntar_transmissoes_especificas()
    log_supervisor("Iniciando busca e gravação de streams (supervisor dinâmico)...", "MAIN")
    supervisor_dinamico(usuarios_especificos=usuarios_especificos)

if __name__ == '__main__':
    try:
        if 'google.colab' in str(get_ipython()):
            main()
        else:
            print("Execute main() manualmente se desejar rodar fora do Colab.")
    except NameError:
        print("Não está rodando em Colab/IPython. Execute main() se desejar.")

# ================================================================
# FIM DA CÉLULA 9 — Supervisor Dinâmico, Lote Cheio e Blacklist
# ================================================================

# Observações e recomendações:
# - Toda lógica de blacklist e commit está integrada para máxima resiliência e rastreabilidade.
# - O log central de processamento é a fonte de verdade para sincronização entre workers/processos.
# - Modularidade, logs claros e tratamento de erro garantem manutenção e evolução seguras.

# ===========================
# Execução automática do supervisor dinâmico
# ===========================
main()

# Célula extra: Commit final de pendências


In [None]:
# Célula extra: Commit final de pendências
def commit_final_pendencias():
    commit_buffer = getattr(upload_to_abyss_and_update_json, 'commit_buffer', [])
    if commit_buffer:
        print(f"🔔 Realizando commit/push final de {len(commit_buffer)} pendências...")
        git_commit_and_push(commit_buffer, commit_message="Commit final de pendências")
        commit_buffer.clear()
    else:
        print("✅ Sem pendências para commit final.")

# Execute isto ao final do processamento
# commit_final_pendencias()