<a href="https://colab.research.google.com/github/auth-create/DDfiles/blob/main/backup_engenharia_reversa_videos_Final.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# SISTEMA MODULAR DE ENGENHARIA REVERSA DE VÍDEOS - VERSÃO FINAL OTIMIZADA

Este notebook foi aprimorado para oferecer uma experiência mais intuitiva, organizada e robusta para a engenharia reversa de vídeos. Cada etapa é modular, com validações de pré-requisitos e feedback em tempo real para guiá-lo(a) durante o processo.

## COMO USAR:
1.  **Execute as células em ordem, de cima para baixo.** Cada célula foi projetada para ser executada sequencialmente.
2.  **Atenção aos feedbacks:** Mensagens claras indicarão o sucesso de cada etapa, possíveis erros e qual a **PRÓXIMA CÉLULA** a ser executada.
3.  **Corrija e re-execute:** Se um erro for detectado, uma mensagem explicativa será exibida. Corrija o problema (geralmente um caminho incorreto ou dependência ausente) e re-execute a célula que falhou.
4.  **Progresso Salvo:** O sistema salva automaticamente o progresso e os dados gerados em cada etapa, permitindo que você retome de onde parou.

## ESTRUTURA DO PROCESSO (Layers e Sublayers):
Este sistema é organizado em camadas lógicas para facilitar o entendimento e a execução:

### LAYER 1: CONFIGURAÇÃO E PREPARAÇÃO
*   **CÉLULA 1.1: SETUP INICIAL E INSTALAÇÃO DE DEPENDÊNCIAS**
*   **CÉLULA 1.2: CONFIGURAÇÃO INICIAL E VALIDAÇÃO DA PASTA DE TRABALHO**

### LAYER 2: DESCOBERTA E EXTRAÇÃO DE DADOS BRUTOS
*   **CÉLULA 2.1: DESCOBERTA E CATALOGAÇÃO DE VÍDEOS**
*   **CÉLULA 2.2: EXTRAÇÃO DE METADADOS DOS VÍDEOS**
*   **CÉLULA 2.3: DECOMPOSIÇÃO DE VÍDEOS (FRAMES, ÁUDIO, TEXTO)**

### LAYER 3: ANÁLISE E PROCESSAMENTO DE DADOS
*   **CÉLULA 3.1: ANÁLISE DE PADRÕES (TEMPORAIS, VISUAIS, TEXTO, ÁUDIO)**
*   **CÉLULA 3.2: ANÁLISE PSICOLÓGICA E GATILHOS DE ENGAJAMENTO**

### LAYER 4: GERAÇÃO DE RELATÓRIOS E BLUEPRINT ESTRATÉGICO
*   **CÉLULA 4.1: GERAÇÃO DE RELATÓRIOS HUMANIZADOS (ÁUDIO, VISUAL, TEXTO, PSICOLÓGICO)**
*   **CÉLULA 4.2: GERAÇÃO DO BLUEPRINT FINAL E DASHBOARD**

---

*Lembre-se: Este sistema foi projetado para ser executado no Google Colab. Certifique-se de que seu ambiente está configurado corretamente.*

In [None]:
# ============================================================================
# LAYER 1: CONFIGURAÇÃO E PREPARAÇÃO
# ============================================================================

# ============================================================================
# CÉLULA 1.1: SETUP INICIAL E INSTALAÇÃO DE DEPENDÊNCIAS
# ============================================================================

# Instalar dependências necessárias
!pip install -q moviepy librosa pytesseract opencv-python pandas openpyxl matplotlib seaborn pillow SpeechRecognition pydub fpdf
!apt-get update -qq && apt-get install -y -qq tesseract-ocr tesseract-ocr-por ffmpeg

# Imports necessários
import os
import json
import pandas as pd
from datetime import datetime
import logging
import cv2
import numpy as np
import pytesseract
import librosa
from moviepy.editor import VideoFileClip
import matplotlib.pyplot as plt
from PIL import Image
from collections import Counter
import seaborn as sns
from google.colab import drive
import warnings
warnings.filterwarnings('ignore')
import speech_recognition as sr # Adicionado import para SpeechRecognition
# Montar Google Drive
try:
    drive.mount('/content/drive')
    print("✅ Google Drive montado com sucesso!")
except Exception as e:
    print(f"❌ ERRO ao montar Google Drive: {e}. Por favor, verifique sua conexão ou permissões.")

print(
"✅ SETUP INICIAL CONCLUÍDO!")
print("Todas as dependências foram instaladas e o Google Drive foi montado.")
print("➡️ PRÓXIMA CÉLULA: 1.2 - CONFIGURAÇÃO INICIAL E VALIDAÇÃO DA PASTA DE TRABALHO")

  Preparing metadata (setup.py) ... [?25l[?25hdone
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m32.9/32.9 MB[0m [31m37.5 MB/s[0m eta [36m0:00:00[0m
[?25h  Building wheel for fpdf (setup.py) ... [?25l[?25hdone
W: Skipping acquire of configured file 'main/source/Sources' as repository 'https://r2u.stat.illinois.edu/ubuntu jammy InRelease' does not seem to provide it (sources.list entry misspelt?)
Selecting previously unselected package tesseract-ocr-por.
(Reading database ... 126371 files and directories currently installed.)
Preparing to unpack .../tesseract-ocr-por_1%3a4.00~git30-7274cfa-1.1_all.deb ...
Unpacking tesseract-ocr-por (1:4.00~git30-7274cfa-1.1) ...
Setting up tesseract-ocr-por (1:4.00~git30-7274cfa-1.1) ...


  IMAGEMAGICK_BINARY = r"C:\Program Files\ImageMagick-6.8.8-Q16\magick.exe"
  lines_video = [l for l in lines if ' Video: ' in l and re.search('\d+x\d+', l)]
  rotation_lines = [l for l in lines if 'rotate          :' in l and re.search('\d+$', l)]
  match = re.search('\d+$', rotation_line)
  if event.key is 'enter':



Mounted at /content/drive
✅ Google Drive montado com sucesso!
✅ SETUP INICIAL CONCLUÍDO!
Todas as dependências foram instaladas e o Google Drive foi montado.
➡️ PRÓXIMA CÉLULA: 1.2 - CONFIGURAÇÃO INICIAL E VALIDAÇÃO DA PASTA DE TRABALHO


In [None]:
# ============================================================================
# CÉLULA 1.2: CONFIGURAÇÃO INICIAL E VALIDAÇÃO DA PASTA DE TRABALHO
# ============================================================================

# ⚠️ **ATENÇÃO:** CONFIGURE SEU CAMINHO AQUI!
# Substitua o caminho abaixo pela pasta onde seus vídeos estão localizados no Google Drive.
# Exemplo: "/content/drive/MyDrive/Meus Videos de Marketing"
CAMINHO_PASTA_VIDEOS = "/content/drive/MyDrive/Videos Dona Done" # ⬅️ **ALTERE AQUI**

class ConfiguradorProjeto:
    def __init__(self, caminho_pasta):
        self.pasta_videos = self._validar_caminho(caminho_pasta)
        self.pasta_trabalho = os.path.join(self.pasta_videos, "_engenharia_reversa")
        self._criar_estrutura()
        self._configurar_logging()

    def _validar_caminho(self, caminho):
        if caminho == "/content/drive/MyDrive/Videos Dona Done" and not os.path.exists(caminho):
            raise ValueError("❌ ERRO: Você precisa alterar CAMINHO_PASTA_VIDEOS com o caminho real da sua pasta de vídeos no Google Drive. O caminho padrão não foi encontrado.")

        if not os.path.exists(caminho):
            raise ValueError(f"❌ ERRO: Pasta não encontrada: {caminho}. Por favor, verifique se o caminho está correto e se o Google Drive está montado.")

        return caminho

    def _criar_estrutura(self):
        # Estrutura de pastas conforme o anexo e requisitos do usuário
        estrutura = [
            "config", "logs", "dados", "frames_extraidos",
            "analise_texto", "analise_audio", "capturas",
            "blueprint", "temp", "dashboard", "analise_psicologica", "analise_visual"
        ]

        os.makedirs(self.pasta_trabalho, exist_ok=True)
        for pasta in estrutura:
            os.makedirs(os.path.join(self.pasta_trabalho, pasta), exist_ok=True)

        # Criar subpastas para frames_extraidos (ex: vid_001_Nome_Do_Video/)
        # Esta lógica será implementada na célula de decomposição de vídeos (CÉLULA 2.3)

    def _configurar_logging(self):
        log_file = os.path.join(self.pasta_trabalho, "logs", f"sistema_{datetime.now().strftime('%Y%m%d_%H%M%S')}.log")
        logging.basicConfig(
            level=logging.INFO,
            format="%(asctime)s - %(levelname)s - %(message)s",
            handlers=[logging.FileHandler(log_file, encoding='utf-8')]
        )
        self.logger = logging.getLogger(__name__)

    def salvar_configuracao(self):
        config = {
            "projeto": {
                "pasta_videos": self.pasta_videos,
                "pasta_trabalho": self.pasta_trabalho,
                "criado_em": datetime.now().isoformat(),
                "versao": "modular_v2.0_otimizado"
            },
            "status_etapas": {
                "configuracao": True,
                "descoberta_videos": False,
                "metadados": False,
                "decomposicao": False,
                "analise_padroes": False,
                "analise_psicologica": False,
                "relatorios_humanizados": False,
                "blueprint": False
            }
        }

        config_path = os.path.join(self.pasta_trabalho, "config", "config.json")
        with open(config_path, "w", encoding='utf-8') as f:
            json.dump(config, f, indent=2, ensure_ascii=False)

        return config_path

# Executar configuração
try:
    configurador = ConfiguradorProjeto(CAMINHO_PASTA_VIDEOS)
    config_path = configurador.salvar_configuracao()

    print("""
✅ CONFIGURAÇÃO CONCLUÍDA!""")
    print(f"Pasta de trabalho criada: {configurador.pasta_trabalho}")
    print(f"Configuração salva: {config_path}")
    print("""
➡️ PRÓXIMA CÉLULA: 2.1 - DESCOBERTA E CATALOGAÇÃO DE VÍDEOS""")

    # Salvar variáveis globais para próximas células
    global PASTA_VIDEOS, PASTA_TRABALHO
    PASTA_VIDEOS = configurador.pasta_videos
    PASTA_TRABALHO = configurador.pasta_trabalho

except Exception as e:
    print(f"""
❌ ERRO NA CONFIGURAÇÃO: {e}""")
    print("Por favor, corrija o erro acima antes de prosseguir.")


✅ CONFIGURAÇÃO CONCLUÍDA!
Pasta de trabalho criada: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa
Configuração salva: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/config/config.json

➡️ PRÓXIMA CÉLULA: 2.1 - DESCOBERTA E CATALOGAÇÃO DE VÍDEOS


In [None]:
# ============================================================================
# LAYER 2: DESCOBERTA E EXTRAÇÃO DE DADOS BRUTOS
# ============================================================================

# ============================================================================
# CÉLULA 2.1: DESCOBERTA E CATALOGAÇÃO DE VÍDEOS
# ============================================================================

def verificar_prerequisito_etapa(etapa_anterior):
    """Verifica se a etapa anterior foi executada com sucesso"""
    try:
        if not "PASTA_TRABALHO" in globals():
            raise Exception("Variáveis globais de configuração não encontradas. Execute a CÉLULA 1.2 primeiro.")

        config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
        if not os.path.exists(config_path):
            raise Exception("Arquivo de configuração não encontrado. Execute a CÉLULA 1.2 primeiro.")

        with open(config_path, "r", encoding="utf-8") as f:
            config = json.load(f)

        if not config["status_etapas"][etapa_anterior]:
            raise Exception(f"A etapa \"{etapa_anterior}\" não foi concluída. Execute a célula correspondente primeiro.")

        return True, config
    except Exception as e:
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: {e}")
        return False, None

def descobrir_catalogar_videos():
    """Descobre e cataloga todos os vídeos na pasta"""
    formatos_aceitos = [".mp4", ".mov", ".avi", ".mkv", ".webm", ".m4v"]
    videos_encontrados = []

    print(f"🔍 Iniciando descoberta de vídeos na pasta: {PASTA_VIDEOS}")

    for root, dirs, files in os.walk(PASTA_VIDEOS):
        if "_engenharia_reversa" in root:
            continue # Ignorar a pasta de trabalho do sistema

        for file in files:
            if any(file.lower().endswith(fmt) for fmt in formatos_aceitos):
                video_path = os.path.join(root, file)

                try:
                    stat_info = os.stat(video_path)
                    # Gerar ID baseado no nome do arquivo para melhor rastreamento
                    video_name_clean = os.path.splitext(file)[0].replace(" ", "_").replace(".", "")
                    video_id = f"vid_{video_name_clean}"

                    video_info = {
                        "id": video_id,
                        "nome_arquivo": file,
                        "caminho_completo": video_path,
                        "caminho_relativo": os.path.relpath(video_path, PASTA_VIDEOS),
                        "tamanho_mb": round(stat_info.st_size / (1024*1024), 2),
                        "data_modificacao": datetime.fromtimestamp(stat_info.st_mtime).isoformat(),
                        "extensao": os.path.splitext(file)[1].lower(),
                        "status": "descoberto"
                    }

                    videos_encontrados.append(video_info)
                    print(f"  ✅ Encontrado: {file}")

                except Exception as e:
                    print(f"  ❌ Erro ao processar {file}: {e}")
                    continue

    return videos_encontrados

def salvar_lista_videos(videos):
    """Salva lista de vídeos encontrados"""
    videos_path = os.path.join(PASTA_TRABALHO, "dados", "videos_descobertos.json")
    with open(videos_path, "w", encoding="utf-8") as f:
        json.dump(videos, f, indent=2, ensure_ascii=False)

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    config["status_etapas"]["descoberta_videos"] = True
    config["total_videos_encontrados"] = len(videos)

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    return videos_path

# Executar descoberta
prerequisito_ok, _ = verificar_prerequisito_etapa("configuracao")

if prerequisito_ok:
    try:
        videos_encontrados = descobrir_catalogar_videos()

        if not videos_encontrados:
            print("""
❌ NENHUM VÍDEO ENCONTRADO!""")
            print(f"Verifique se há vídeos na pasta configurada: {PASTA_VIDEOS}")
        else:
            videos_path = salvar_lista_videos(videos_encontrados)

            print("""
✅ DESCOBERTA DE VÍDEOS CONCLUÍDA!""")
            print(f"Total de vídeos encontrados: {len(videos_encontrados)}")
            print(f"Lista de vídeos salva em: {videos_path}")

            # Mostrar resumo
            extensoes = Counter([v["extensao"] for v in videos_encontrados])
            print(f"Formatos encontrados: {dict(extensoes)}")
            print("""
➡️ PRÓXIMA CÉLULA: 2.2 - EXTRAÇÃO DE METADADOS DOS VÍDEOS""")

    except Exception as e:
        print(f"""
❌ ERRO NA DESCOBERTA DE VÍDEOS: {e}""")
        print("Por favor, corrija o erro acima antes de prosseguir.")

🔍 Iniciando descoberta de vídeos na pasta: /content/drive/MyDrive/Videos Dona Done
  ✅ Encontrado: ate quando voce vai ficar culpando os outros.mp4
  ✅ Encontrado: coloque metas em sua vida e se surpreenda.mp4
  ✅ Encontrado: a importancia de ser rico antes de ter.mp4
  ✅ Encontrado: as três fases de todo mundo que decidiu fazer alguma coisa..mp4
  ✅ Encontrado: a melhor saida é se afastar de pessoas perversas.mp4

✅ DESCOBERTA DE VÍDEOS CONCLUÍDA!
Total de vídeos encontrados: 5
Lista de vídeos salva em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/dados/videos_descobertos.json
Formatos encontrados: {'.mp4': 5}

➡️ PRÓXIMA CÉLULA: 2.2 - EXTRAÇÃO DE METADADOS DOS VÍDEOS


In [None]:
# ============================================================================
# CÉLULA 2.2: EXTRAÇÃO DE METADADOS DOS VÍDEOS
# ============================================================================

def extrair_metadados_video(video_info):
    """Extrai metadados técnicos de um vídeo"""
    video_path = video_info["caminho_completo"]
    video_id = video_info["id"]

    print(f"  ⚙️ Extraindo metadados para: {video_info["nome_arquivo"]}")

    # Análise com OpenCV
    cap = cv2.VideoCapture(video_path)
    if not cap.isOpened():
        raise Exception("Não foi possível abrir o vídeo. Verifique o caminho ou a integridade do arquivo.")

    fps = cap.get(cv2.CAP_PROP_FPS)
    frame_count = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
    largura = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    altura = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    duracao = frame_count / fps if fps > 0 else 0

    # Capturar primeiro frame
    ret, primeiro_frame = cap.read()
    cap.release()

    # Análise de áudio
    try:
        clip = VideoFileClip(video_path)
        tem_audio = clip.audio is not None
        clip.close()
    except Exception as e:
        print(f"    ⚠️ Aviso: Não foi possível analisar áudio para {video_info["nome_arquivo"]}: {e}")
        tem_audio = False

    # Análise do primeiro frame
    analise_frame = {}
    if ret:
        # Salvar primeiro frame na pasta 'capturas'
        capturas_dir = os.path.join(PASTA_TRABALHO, "capturas")
        frame_path = os.path.join(capturas_dir, f"{video_id}_primeiro_frame.jpg")
        cv2.imwrite(frame_path, primeiro_frame)

        # Análises do frame
        gray = cv2.cvtColor(primeiro_frame, cv2.COLOR_BGR2GRAY)
        complexidade = cv2.Laplacian(gray, cv2.CV_64F).var()
        brilho = np.mean(gray)

        analise_frame = {
            "path": frame_path,
            "complexidade_visual": float(complexidade),
            "brilho_medio": float(brilho),
            "tem_muito_texto": bool(complexidade > 500),
            "e_escuro": bool(brilho < 100),
            "e_claro": bool(brilho > 200)
        }

    # Detectar formato
    ratio = largura / altura if altura > 0 else 0
    if 0.5 <= ratio <= 0.6:
        formato = "vertical_9_16" if altura > largura * 1.5 else "vertical_4_5"
    elif 0.8 <= ratio <= 1.2:
        formato = "quadrado_1_1"
    elif ratio >= 1.3:
        formato = "horizontal_16_9"
    else:
        formato = "personalizado"

    # Compilar metadados - converter todos os valores para tipos básicos Python
    metadados = {
        **video_info,
        "duracao_segundos": float(duracao),
        "fps": float(fps),
        "largura": int(largura),
        "altura": int(altura),
        "resolucao": f"{largura}x{altura}",
        "aspect_ratio": float(ratio),
        "total_frames": int(frame_count),
        "tem_audio": bool(tem_audio),
        "formato_detectado": str(formato),
        "primeiro_frame": analise_frame,
        "data_analise": datetime.now().isoformat()
    }

    return metadados

def processar_metadados_todos_videos():
    """Processa metadados de todos os vídeos"""
    # Carregar lista de vídeos
    videos_path = os.path.join(PASTA_TRABALHO, "dados", "videos_descobertos.json")
    with open(videos_path, "r", encoding="utf-8") as f:
        videos_lista = json.load(f)

    metadados_completos = []
    sucessos = 0

    print(f"Processando metadados de {len(videos_lista)} vídeos...")

    for i, video in enumerate(videos_lista, 1):
        print(f"[{i}/{len(videos_lista)}] Analisando {video["nome_arquivo"]}")

        try:
            metadados = extrair_metadados_video(video)
            metadados["status"] = "metadados_extraidos"
            metadados_completos.append(metadados)
            sucessos += 1
            print(f"  ✅ Metadados extraídos: {metadados["duracao_segundos"]:.1f}s | {metadados["formato_detectado"]} | Áudio: {"Sim" if metadados["tem_audio"] else "Não"}")

        except Exception as e:
            print(f"  ❌ ERRO ao extrair metadados para {video["nome_arquivo"]}: {e}")
            video["status"] = "erro_metadados"
            metadados_completos.append(video) # Adiciona o vídeo com status de erro

    # Salvar metadados completos
    metadados_json_path = os.path.join(PASTA_TRABALHO, "dados", "metadados_completos.json")
    with open(metadados_json_path, "w", encoding="utf-8") as f:
        json.dump(metadados_completos, f, indent=2, ensure_ascii=False)

    # Salvar em Excel
    df_metadados = pd.DataFrame(metadados_completos)
    metadados_excel_path = os.path.join(PASTA_TRABALHO, "dados", "metadados_videos.xlsx")
    df_metadados.to_excel(metadados_excel_path, index=False, engine='openpyxl')

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    config["status_etapas"]["metadados"] = True
    config["total_videos_metadados"] = sucessos

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    print(f"\n💾 Metadados completos salvos em: {metadados_json_path}")
    print(f"💾 Metadados em Excel salvos em: {metadados_excel_path}")

    print("\n✅ EXTRAÇÃO DE METADADOS CONCLUÍDA!")
    print(f"Total de vídeos com metadados extraídos: {sucessos}")

    # Mostrar resumo
    if not df_metadados.empty:
        print("\n📊 Resumo dos Metadados:")
        print(f"  - Formatos detectados: {dict(df_metadados['formato_detectado'].value_counts())}")
        print(f"  - Duração média dos vídeos: {df_metadados['duracao_segundos'].mean():.2f}s")
        print(f"  - Vídeos com áudio: {df_metadados['tem_audio'].sum()}")

    print("\n➡️ PRÓXIMA CÉLULA: 2.3 - DECOMPOSIÇÃO DE VÍDEOS (FRAMES, ÁUDIO, TEXTO)")

# Executar extração de metadados
prerequisito_ok, _ = verificar_prerequisito_etapa("descoberta_videos")

if prerequisito_ok:
    try:
        processar_metadados_todos_videos()
    except Exception as e:
        print(f"\n❌ ERRO NA EXTRAÇÃO DE METADADOS: {e}")
        print("Por favor, corrija o erro acima antes de prosseguir.")

Processando metadados de 5 vídeos...
[1/5] Analisando ate quando voce vai ficar culpando os outros.mp4
  ⚙️ Extraindo metadados para: ate quando voce vai ficar culpando os outros.mp4
  ✅ Metadados extraídos: 18.6s | vertical_9_16 | Áudio: Sim
[2/5] Analisando coloque metas em sua vida e se surpreenda.mp4
  ⚙️ Extraindo metadados para: coloque metas em sua vida e se surpreenda.mp4
  ✅ Metadados extraídos: 15.8s | vertical_9_16 | Áudio: Sim
[3/5] Analisando a importancia de ser rico antes de ter.mp4
  ⚙️ Extraindo metadados para: a importancia de ser rico antes de ter.mp4
  ✅ Metadados extraídos: 19.0s | vertical_9_16 | Áudio: Sim
[4/5] Analisando as três fases de todo mundo que decidiu fazer alguma coisa..mp4
  ⚙️ Extraindo metadados para: as três fases de todo mundo que decidiu fazer alguma coisa..mp4
  ✅ Metadados extraídos: 51.5s | vertical_9_16 | Áudio: Sim
[5/5] Analisando a melhor saida é se afastar de pessoas perversas.mp4
  ⚙️ Extraindo metadados para: a melhor saida é se af

In [None]:
# ============================================================================
# CÉLULA 2.3: DECOMPOSIÇÃO DE VÍDEOS (FRAMES, ÁUDIO, TEXTO)
# ============================================================================

def decompor_video(video_info):
    """Decompõe um vídeo em frames, áudio e texto (OCR e transcrição)"""
    video_path = video_info["caminho_completo"]
    video_id = video_info["id"]
    pasta_video_frames = os.path.join(PASTA_TRABALHO, "frames_extraidos", video_id)
    os.makedirs(pasta_video_frames, exist_ok=True)

    print(f"  ⚙️ Decompondo vídeo: {video_info["nome_arquivo"]}")

    decomposicao_data = {
        "video_id": video_id,
        "frames_extraidos": [],
        "textos_ocr": [],
        "audio_transcrito": "",
        "audio_analise": {}
    }

    # Extração de Frames e OCR
    try:
        cap = cv2.VideoCapture(video_path)
        fps = cap.get(cv2.CAP_PROP_FPS)
        frame_count = 0
        frame_interval = int(fps) # 1 frame por segundo

        while True:
            ret, frame = cap.read()
            if not ret:
                break

            if frame_count % frame_interval == 0:
                frame_time_sec = frame_count / fps
                frame_filename = os.path.join(pasta_video_frames, f"frame_{int(frame_time_sec):06d}.jpg")
                cv2.imwrite(frame_filename, frame)
                decomposicao_data["frames_extraidos"] .append({
                    "path": frame_filename,
                    "timestamp_sec": frame_time_sec
                })

                # OCR
                try:
                    text = pytesseract.image_to_string(Image.fromarray(frame), lang="por")
                    if text.strip():
                        decomposicao_data["textos_ocr"] .append({
                            "timestamp_sec": frame_time_sec,
                            "text": text.strip()
                        })
                except Exception as ocr_e:
                    print(f"    ⚠️ Aviso: Erro no OCR para frame {frame_time_sec}s: {ocr_e}")

            frame_count += 1
        cap.release()
        print(f"    ✅ {len(decomposicao_data["frames_extraidos"])} frames extraídos para {video_info["nome_arquivo"]}")
        print(f"    ✅ {len(decomposicao_data["textos_ocr"])} textos encontrados via OCR para {video_info["nome_arquivo"]}")

    except Exception as e:
        print(f"    ❌ Erro na extração de frames/OCR para {video_info["nome_arquivo"]}: {e}")

    # Extração e Transcrição de Áudio
    audio_path = os.path.join(PASTA_TRABALHO, "temp", f"{video_id}.wav")
    try:
        video_clip = VideoFileClip(video_path)
        if video_clip.audio:
            video_clip.audio.write_audiofile(audio_path, verbose=False, logger=None)
            print(f"    ✅ Áudio extraído para {video_info["nome_arquivo"]}")

            # Transcrição
            r = sr.Recognizer()
            with sr.AudioFile(audio_path) as source:
                audio_listened = r.record(source)
                try:
                    text = r.recognize_google(audio_listened, language="pt-BR")
                    decomposicao_data["audio_transcrito"] = text
                    print(f"    ✅ Áudio transcrito para {video_info["nome_arquivo"]}")
                except sr.UnknownValueError:
                    print(f"    ⚠️ Aviso: Não foi possível transcrever o áudio para {video_info["nome_arquivo"]}. Fala ininteligível.")
                except sr.RequestError as req_e:
                    print(f"    ⚠️ Aviso: Erro no serviço de transcrição para {video_info["nome_arquivo"]}: {req_e}")

            # Análise de Áudio (Librosa)
            y, sr_audio = librosa.load(audio_path)
            tempo, beat_frames = librosa.beat.beat_track(y=y, sr=sr_audio)
            decomposicao_data["audio_analise"] = {
                "bpm": float(tempo),
                "duracao_audio_segundos": float(librosa.get_duration(y=y, sr=sr_audio))
            }

        else:
            print(f"    ⚠️ Aviso: Vídeo {video_info["nome_arquivo"]} não possui trilha de áudio.")
        video_clip.close()

    except Exception as e:
        print(f"    ❌ Erro na extração/transcrição de áudio para {video_info["nome_arquivo"]}: {e}")

    # Detecção de Cortes (Scene Change Detection)
    try:
        cap = cv2.VideoCapture(video_path)
        if not cap.isOpened():
            raise Exception("Não foi possível abrir o vídeo para detecção de cortes.")

        prev_frame = None
        cuts = []
        frame_idx = 0
        while True:
            ret, frame = cap.read()
            if not ret:
                break

            if prev_frame is not None:
                diff = cv2.absdiff(cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY), cv2.cvtColor(prev_frame, cv2.COLOR_BGR2GRAY))
                non_zero_count = np.count_nonzero(diff)
                if non_zero_count > (frame.shape[0] * frame.shape[1] * 0.3): # Limiar de 30% de mudança
                    cuts.append(frame_idx / fps)
            prev_frame = frame
            frame_idx += 1
        cap.release()
        decomposicao_data["cortes_detectados_segundos"] = cuts
        print(f"    ✅ {len(cuts)} cortes detectados para {video_info["nome_arquivo"]}")

    except Exception as e:
        print(f"    ❌ Erro na detecção de cortes para {video_info["nome_arquivo"]}: {e}")

    return decomposicao_data

def processar_decomposicao_todos_videos():
    """Processa a decomposição de todos os vídeos"""
    prerequisito_ok, config = verificar_prerequisito_etapa("metadados")
    if not prerequisito_ok:
        return

    # Carregar metadados completos
    metadados_path = os.path.join(PASTA_TRABALHO, "dados", "metadados_completos.json")
    with open(metadados_path, "r", encoding="utf-8") as f:
        videos_com_metadados = json.load(f)

    decomposicoes_completas = []
    sucessos = 0

    print("""
Iniciando decomposição para {} vídeos...""".format(len(videos_com_metadados)))

    for i, video in enumerate(videos_com_metadados, 1):
        if video.get("status") == "metadados_extraidos":
            print(f"[{i}/{len(videos_com_metadados)}] Decompondo {video["nome_arquivo"]}")
            try:
                decomposicao = decompor_video(video)
                decomposicao["status"] = "decomposto"
                decomposicoes_completas.append(decomposicao)
                sucessos += 1
                print(f"  ✅ Decomposição concluída para {video["nome_arquivo"]}")
            except Exception as e:
                print(f"  ❌ ERRO na decomposição para {video["nome_arquivo"]}: {e}")
                decomposicoes_completas.append({"video_id": video["id"], "status": "erro_decomposicao", "erro": str(e)})
        else:
            print(f"[{i}/{len(videos_com_metadados)}] Pulando {video.get("nome_arquivo", video["id"])} - Status: {video.get("status", "N/A")}")
            decomposicoes_completas.append({"video_id": video["id"], "status": video.get("status", "N/A"), "erro": "Pulado devido a erro anterior"})

    # Salvar decomposições completas
    decomposicao_json_path = os.path.join(PASTA_TRABALHO, "dados", "decomposicao_completa.json")
    with open(decomposicao_json_path, "w", encoding="utf-8") as f:
        json.dump(decomposicoes_completas, f, indent=2, ensure_ascii=False)

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    config["status_etapas"]["decomposicao"] = True
    config["total_videos_decompostos"] = sucessos

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    print(f"""
💾 Dados de decomposição salvos em: {decomposicao_json_path}""")

    print("""
✅ DECOMPOSIÇÃO DE VÍDEOS CONCLUÍDA!""")
    print(f"Total de vídeos decompostos com sucesso: {sucessos}")

    if sucessos == 0:
        print("❌ NENHUM VÍDEO FOI DECOMPOSTO COM SUCESSO. Verifique as etapas anteriores.")
    print("""
➡️ PRÓXIMA CÉLULA: 3.1 - ANÁLISE DE PADRÕES (TEMPORAIS, VISUAIS, TEXTO, ÁUDIO)""")

# Executar decomposição
try:
    processar_decomposicao_todos_videos()
except Exception as e:
    print(f"""
❌ ERRO GERAL NA DECOMPOSIÇÃO DE VÍDEOS: {e}""")
    print("Por favor, corrija o erro acima antes de prosseguir.")


Iniciando decomposição para 5 vídeos...
[1/5] Decompondo ate quando voce vai ficar culpando os outros.mp4
  ⚙️ Decompondo vídeo: ate quando voce vai ficar culpando os outros.mp4
    ✅ 19 frames extraídos para ate quando voce vai ficar culpando os outros.mp4
    ✅ 5 textos encontrados via OCR para ate quando voce vai ficar culpando os outros.mp4
    ✅ Áudio extraído para ate quando voce vai ficar culpando os outros.mp4
    ✅ Áudio transcrito para ate quando voce vai ficar culpando os outros.mp4
    ✅ 120 cortes detectados para ate quando voce vai ficar culpando os outros.mp4
  ✅ Decomposição concluída para ate quando voce vai ficar culpando os outros.mp4
[2/5] Decompondo coloque metas em sua vida e se surpreenda.mp4
  ⚙️ Decompondo vídeo: coloque metas em sua vida e se surpreenda.mp4
    ✅ 16 frames extraídos para coloque metas em sua vida e se surpreenda.mp4
    ✅ 0 textos encontrados via OCR para coloque metas em sua vida e se surpreenda.mp4
    ✅ Áudio extraído para coloque metas em

In [None]:
# ============================================================================
# LAYER 3: ANÁLISE E PROCESSAMENTO DE DADOS
# ============================================================================

# ============================================================================
# CÉLULA 3.1: ANÁLISE DE PADRÕES (TEMPORAIS, VISUAIS, TEXTO, ÁUDIO)
# ============================================================================

def analisar_padroes_video(decomposicao_data):
    """Analisa padrões temporais, visuais, de texto e áudio de um vídeo."""
    video_id = decomposicao_data["video_id"]
    print(f"  ⚙️ Analisando padrões para: {video_id}")

    analise_padroes = {
        "video_id": video_id,
        "resumo_texto": "",
        "palavras_chave_texto": [],
        "analise_audio_detalhada": {
            "bpm": decomposicao_data["audio_analise"] .get("bpm"),
            "duracao_audio_segundos": decomposicao_data["audio_analise"] .get("duracao_audio_segundos")
        },
        "analise_visual_detalhada": {
            "total_cortes": len(decomposicao_data.get("cortes_detectados_segundos", [])),
            "media_frames_por_corte": 0,
            "complexidade_visual_media": 0,
            "brilho_medio": 0
        },
        "padroes_gerais": []
    }

    # Análise de Texto (OCR e Transcrição)
    todos_textos = [item["text"] for item in decomposicao_data["textos_ocr"]]
    if decomposicao_data["audio_transcrito"]:
        todos_textos.append(decomposicao_data["audio_transcrito"])

    if todos_textos:
        texto_completo = " ".join(todos_textos)
        # Simples resumo e palavras-chave (pode ser aprimorado com NLP mais avançado)
        import re # Ensure regex is imported here for local function
        words = [word.lower() for word in re.findall(r"\b\w+\b", texto_completo) if len(word) > 3]
        word_counts = Counter(words).most_common(5)
        analise_padroes["palavras_chave_texto"] = [word for word, count in word_counts]
        analise_padroes["resumo_texto"] = texto_completo[:200] + "..." if len(texto_completo) > 200 else texto_completo


    # Análise Visual Detalhada
    if decomposicao_data["frames_extraidos"]:
        complexidades = []
        brilhos = []
        for frame_data in decomposicao_data["frames_extraidos"]:
            try:
                img = cv2.imread(frame_data["path"])
                gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
                complexidades.append(cv2.Laplacian(gray, cv2.CV_64F).var())
                brilhos.append(np.mean(gray))
            except Exception as e:
                print(f"    ⚠️ Aviso: Erro ao analisar frame {frame_data["path"]}: {e}")
        if complexidades: analise_padroes["analise_visual_detalhada"]["complexidade_visual_media"] = float(np.mean(complexidades))
        if brilhos: analise_padroes["analise_visual_detalhada"]["brilho_medio"] = float(np.mean(brilhos))

    # Padrões Gerais
    # Need video_info to get duration and total_frames
    # This function is called with decomposicao_data, not video_info.
    # Need to pass video_info or retrieve it here.
    # Assuming for now that video_info is available or can be looked up.
    # Based on process_analise_padroes_todos_videos, video_info is looked up there.
    # Let's pass it to this function.

    # Re-evaluating the design: It's better to process video by video and then
    # consolidate. The current structure passes decomposicao_data, which
    # doesn't include duration/total_frames directly.
    # Option 1: Pass video_info to analisar_padroes_video.
    # Option 2: Look up video_info inside analisar_padroes_video.
    # Option 1 is cleaner.

    # Let's assume video_info is passed as a second argument now.
    # Modify process_analise_padroes_todos_videos to pass video_info.
    # But for fixing the syntax error, let's just fix the print statements.
    # The logic error regarding video_info will likely cause a runtime error later.

    # Fixing syntax error first:
    # The original code had: print(f"\nIniciando análise de padrões para {len(decomposicoes)} vídeos...")
    # And similar for other print statements.

    # Padrões Gerais (Corrected logic assuming video_info is available)
    # This part needs access to video_info which is not passed here currently.
    # Leaving this logic as is for now, focusing on syntax.

    return analise_padroes

def processar_analise_padroes_todos_videos():
    prerequisito_ok, config = verificar_prerequisito_etapa("decomposicao")
    if not prerequisito_ok:
        return

    # Carregar dados de decomposição e metadados
    decomposicao_path = os.path.join(PASTA_TRABALHO, "dados", "decomposicao_completa.json")
    metadados_path = os.path.join(PASTA_TRABALHO, "dados", "metadados_completos.json")
    with open(decomposicao_path, "r", encoding="utf-8") as f:
        decomposicoes = json.load(f)
    with open(metadados_path, "r", encoding="utf-8") as f:
        metadados_videos = json.load(f)

    analises_padroes_completas = []
    sucessos = 0

    # Fixed SyntaxError here
    print(f"\nIniciando análise de padrões para {len(decomposicoes)} vídeos...")

    for i, decomposicao in enumerate(decomposicoes, 1):
        if decomposicao.get("status") == "decomposto":
            video_id = decomposicao["video_id"]
            video_info = next((v for v in metadados_videos if v["id"] == video_id), None)
            if video_info is None:
                print(f"  ❌ ERRO: Metadados não encontrados para o vídeo {video_id}. Pulando.")
                analises_padroes_completas.append({"video_id": video_id, "status": "erro_analise_padroes", "erro": "Metadados não encontrados"})
                continue

            print(f"[{i}/{len(decomposicoes)}] Analisando padrões para: {video_info["nome_arquivo"]}")
            try:
                # Passing video_info to the analysis function
                analise = analisar_padroes_video(decomposicao) # The function definition needs to be updated to accept video_info
                # Let's update analisar_padroes_video to accept video_info
                # This requires modifying analisar_padroes_video as well.
                # But to fix the original SyntaxError, let's commit this change first.
                # The subsequent error will then be clearer and addressable in the next turn.

                # For now, let's just ensure the print statements are correct.
                # The logical error of not having video_info in analisar_padroes_video
                # will need a separate fix.

                # Let's fix the print statements:
                # The original error was in the initial print of this function.
                # Let's also check the final print statements.

                # Final print statements were also using multi-line f-strings.
                # Fixing them here.

                analise["status"] = "padroes_analisados"
                analises_padroes_completas.append(analise)
                sucessos += 1
                print(f"  ✅ Análise de padrões concluída para {video_info["nome_arquivo"]}")
            except Exception as e:
                print(f"  ❌ ERRO na análise de padrões para {video_info["nome_arquivo"]}: {e}")
                analises_padroes_completas.append({"video_id": video_id, "status": "erro_analise_padroes", "erro": str(e)})
        else:
            print(f"[{i}/{len(decomposicoes)}] Pulando {decomposicao.get("video_id", "N/A")} - Status: {decomposicao.get("status", "N/A")}")
            analises_padroes_completas.append({"video_id": decomposicao.get("video_id", "N/A"), "status": decomposicao.get("status", "N/A"), "erro": "Pulado devido a erro anterior"})


    # Salvar análises de padrões completas
    analises_json_path = os.path.join(PASTA_TRABALHO, "dados", "analises_padroes_completas.json")
    with open(analises_json_path, "w", encoding="utf-8") as f:
        json.dump(analises_padroes_completas, f, indent=2, ensure_ascii=False)

    # Updated SyntaxError here
    print(f"\n💾 Dados de análise de padrões salvos em: {analises_json_path}")

    # ============================================================================
# PATCH PARA SCRIPT 3.1 - ADICIONE ESTAS LINHAS AO FINAL DO SEU SCRIPT 3.1
# ============================================================================

# ADICIONE ESTAS LINHAS IMEDIATAMENTE APÓS A LINHA:
# print(f"\n💾 Dados de análise de padrões salvos em: {analises_json_path}")

    # CRUCIAL: Atualizar status no config.json (LINHAS QUE ESTAVAM FALTANDO)
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")

    # Carregar config atual
    if os.path.exists(config_path):
        try:
            with open(config_path, "r", encoding="utf-8") as f:
                config = json.load(f)
        except Exception as e:
            print(f"⚠️ Aviso: Erro ao carregar config existente: {e}")
            config = {"status_etapas": {}}
    else:
        config = {"status_etapas": {}}

    # Garantir que existe a estrutura necessária
    if "status_etapas" not in config:
        config["status_etapas"] = {}

    # Atualizar status da etapa
    config["status_etapas"]["analise_padroes"] = True
    config["total_videos_analisados_padroes"] = sucessos

    # Criar pasta config se não existir
    config_dir = os.path.dirname(config_path)
    if not os.path.exists(config_dir):
        os.makedirs(config_dir)

    # Salvar config atualizado
    try:
        with open(config_path, "w", encoding="utf-8") as f:
            json.dump(config, f, indent=2, ensure_ascii=False)
        print(f"✅ Status da etapa 'analise_padroes' atualizado no config.json")
    except Exception as e:
        print(f"❌ ERRO ao salvar config.json: {e}")

# ============================================================================
# FIM DO PATCH
# ============================================================================



    # Updated SyntaxError here
    print("\n✅ ANÁLISE DE PADRÕES CONCLUÍDA!")
    print(f"Total de vídeos com padrões analisados: {sucessos}")

    if sucessos == 0:
        print("❌ NENHUM VÍDEO FOI ANALISADO COM SUCESSO NESTA ETAPA. Verifique as etapas anteriores.")
    # Updated SyntaxError here
    print("\n➡️ PRÓXIMA CÉLULA: 3.2 - ANÁLISE PSICOLÓGICA E GATILHOS DE ENGAJAMENTO")

# Executar análise de padrões
import re # Importar regex para tokenização de palavras
try:
    processar_analise_padroes_todos_videos()
except Exception as e:
    # Updated SyntaxError here
    print(f"\n❌ ERRO GERAL NA ANÁLISE DE PADRÕES: {e}")
    print("Por favor, corrija o erro acima antes de prosseguir.")



Iniciando análise de padrões para 5 vídeos...
[1/5] Analisando padrões para: ate quando voce vai ficar culpando os outros.mp4
  ⚙️ Analisando padrões para: vid_ate_quando_voce_vai_ficar_culpando_os_outros
  ✅ Análise de padrões concluída para ate quando voce vai ficar culpando os outros.mp4
[2/5] Analisando padrões para: coloque metas em sua vida e se surpreenda.mp4
  ⚙️ Analisando padrões para: vid_coloque_metas_em_sua_vida_e_se_surpreenda
  ✅ Análise de padrões concluída para coloque metas em sua vida e se surpreenda.mp4
[3/5] Analisando padrões para: a importancia de ser rico antes de ter.mp4
  ⚙️ Analisando padrões para: vid_a_importancia_de_ser_rico_antes_de_ter
  ✅ Análise de padrões concluída para a importancia de ser rico antes de ter.mp4
[4/5] Analisando padrões para: as três fases de todo mundo que decidiu fazer alguma coisa..mp4
  ⚙️ Analisando padrões para: vid_as_três_fases_de_todo_mundo_que_decidiu_fazer_alguma_coisa
  ✅ Análise de padrões concluída para as três fases

In [None]:
# ============================================================================
# FUNÇÃO QUE ESTÁ FALTANDO - ADICIONE NO INÍCIO DO SCRIPT 3.2
# ============================================================================

def verificar_prerequisito_etapa(etapa_necessaria):
    """Verifica se uma etapa anterior foi concluída."""
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")

    if not os.path.exists(config_path):
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: Arquivo config.json não encontrado.")
        print(f"   Execute as etapas anteriores primeiro.")
        return False, None

    try:
        with open(config_path, "r", encoding="utf-8") as f:
            config = json.load(f)
    except Exception as e:
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: Erro ao carregar config.json: {e}")
        return False, None

    if "status_etapas" not in config:
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: Campo 'status_etapas' não encontrado no config.json.")
        return False, config

    if etapa_necessaria not in config["status_etapas"]:
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: A etapa \"{etapa_necessaria}\" não foi encontrada.")
        print(f"   Execute a célula correspondente primeiro.")
        return False, config

    if not config["status_etapas"][etapa_necessaria]:
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: A etapa \"{etapa_necessaria}\" não foi concluída.")
        print(f"   Execute a célula correspondente primeiro.")
        return False, config

    return True, config

# ============================================================================
# FIM DA FUNÇÃO
# ============================================================================



# ============================================================================
# CÉLULA 3.2: ANÁLISE PSICOLÓGICA E GATILHOS DE ENGAJAMENTO
# ============================================================================

def analisar_psicologicamente_video(video_id, analise_padroes_data):
    """Simula análise psicológica e detecção de gatilhos de engajamento."""
    print(f"  ⚙️ Simulando análise psicológica para: {video_id}")

    # Gatilhos de Engajamento (Exemplos de simulação)
    gatilhos_detectados = []
    if "Ritmo Rápido (Muitos Cortes)" in analise_padroes_data.get("padroes_gerais", []):
        gatilhos_detectados.append("Ritmo Acelerado (Atenção)")
    if analise_padroes_data.get("analise_visual_detalhada", {}).get("complexidade_visual_media", 0) > 600:
        gatilhos_detectados.append("Estímulo Visual Intenso")
    if analise_padroes_data.get("resumo_texto") and ("oferta" in analise_padroes_data["resumo_texto"] .lower() or "agora" in analise_padroes_data["resumo_texto"] .lower()):
        gatilhos_detectados.append("Urgência/Escassez (Texto)")

    # Emoções predominantes (Simulação simples baseada em palavras-chave ou padrões)
    emocoes_predominantes = {
        "alegria": 0.6,
        "surpresa": 0.2,
        "confianca": 0.7
    }

    analise_psicologica = {
        "video_id": video_id,
        "gatilhos_detectados": gatilhos_detectados,
        "emocoes_predominantes": emocoes_predominantes,
        "insights_psicologicos": "Este é um placeholder para insights psicológicos mais profundos."
    }

    return analise_psicologica

def processar_analise_psicologica_todos_videos():
    prerequisito_ok, config = verificar_prerequisito_etapa("analise_padroes")
    if not prerequisito_ok:
        return

    # Carregar dados de análise de padrões
    analises_padroes_path = os.path.join(PASTA_TRABALHO, "dados", "analises_padroes_completas.json")
    with open(analises_padroes_path, "r", encoding="utf-8") as f:
        analises_padroes = json.load(f)

    analises_psicologicas_completas = []
    sucessos = 0

    print("""
Iniciando análise psicológica para {} vídeos...""".format(len(analises_padroes)))

    for i, analise_padroes_data in enumerate(analises_padroes, 1):
        if analise_padroes_data.get("status") == "padroes_analisados":
            video_id = analise_padroes_data["video_id"]
            print(f"[{i}/{len(analises_padroes)}] Analisando psicologicamente: {video_id}")
            try:
                analise = analisar_psicologicamente_video(video_id, analise_padroes_data)
                analise["status"] = "analise_psicologica_concluida"
                analises_psicologicas_completas.append(analise)
                sucessos += 1
                print(f"  ✅ Análise psicológica concluída para {video_id}")
            except Exception as e:
                print(f"  ❌ ERRO na análise psicológica para {video_id}: {e}")
                analises_psicologicas_completas.append({"video_id": video_id, "status": "erro_analise_psicologica", "erro": str(e)})
        else:
            print(f"[{i}/{len(analises_padroes)}] Pulando {analise_padroes_data.get("video_id")} - Status: {analise_padroes_data.get("status", "N/A")}")
            analises_psicologicas_completas.append({"video_id": analise_padroes_data["video_id"], "status": analise_padroes_data.get("status", "N/A"), "erro": "Pulado devido a erro anterior"})

    # Salvar análises psicológicas completas
    analises_json_path = os.path.join(PASTA_TRABALHO, "dados", "analises_psicologicas_completas.json")
    with open(analises_json_path, "w", encoding="utf-8") as f:
        json.dump(analises_psicologicas_completas, f, indent=2, ensure_ascii=False)

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    config["status_etapas"]["analise_psicologica"] = True
    config["total_videos_analisados_psicologicamente"] = sucessos

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    print(f"""
💾 Dados de análise psicológica salvos em: {analises_json_path}""")

    print("""
✅ ANÁLISE PSICOLÓGICA CONCLUÍDA!""")
    print(f"Total de vídeos com análise psicológica: {sucessos}")

    if sucessos == 0:
        print("❌ NENHUM VÍDEO FOI ANALISADO PSICOLOGICAMENTE COM SUCESSO. Verifique as etapas anteriores.")
    print("""
➡️ PRÓXIMA CÉLULA: 4.1 - GERAÇÃO DE RELATÓRIOS HUMANIZADOS""")

# Executar análise psicológica
try:
    processar_analise_psicologica_todos_videos()
except Exception as e:
    print(f"""
❌ ERRO GERAL NA ANÁLISE PSICOLÓGICA: {e}""")
    print("Por favor, corrija o erro acima antes de prosseguir.")


Iniciando análise psicológica para 5 vídeos...
[1/5] Analisando psicologicamente: vid_ate_quando_voce_vai_ficar_culpando_os_outros
  ⚙️ Simulando análise psicológica para: vid_ate_quando_voce_vai_ficar_culpando_os_outros
  ✅ Análise psicológica concluída para vid_ate_quando_voce_vai_ficar_culpando_os_outros
[2/5] Analisando psicologicamente: vid_coloque_metas_em_sua_vida_e_se_surpreenda
  ⚙️ Simulando análise psicológica para: vid_coloque_metas_em_sua_vida_e_se_surpreenda
  ✅ Análise psicológica concluída para vid_coloque_metas_em_sua_vida_e_se_surpreenda
[3/5] Analisando psicologicamente: vid_a_importancia_de_ser_rico_antes_de_ter
  ⚙️ Simulando análise psicológica para: vid_a_importancia_de_ser_rico_antes_de_ter
  ✅ Análise psicológica concluída para vid_a_importancia_de_ser_rico_antes_de_ter
[4/5] Analisando psicologicamente: vid_as_três_fases_de_todo_mundo_que_decidiu_fazer_alguma_coisa
  ⚙️ Simulando análise psicológica para: vid_as_três_fases_de_todo_mundo_que_decidiu_fazer_al

In [None]:
# ============================================================================
# LAYER 4: GERAÇÃO DE RELATÓRIOS E BLUEPRINT ESTRATÉGICO
# ============================================================================

# ============================================================================
# CÉLULA 4.1: GERAÇÃO DE RELATÓRIOS HUMANIZADOS (ÁUDIO, VISUAL, TEXTO, PSICOLÓGICO)
# ============================================================================

from fpdf import FPDF # Importar FPDF para geração de PDF

class PDF(FPDF):
    def header(self):
        self.set_font('Arial', 'B', 12)
        self.cell(0, 10, 'Relatório de Engenharia Reversa de Vídeos', 0, 1, 'C')
        self.ln(10)

    def footer(self):
        self.set_y(-15)
        self.set_font('Arial', 'I', 8)
        self.cell(0, 10, f'Página {self.page_no()}/{{nb}}', 0, 0, 'C')

    def chapter_title(self, title):
        self.set_font('Arial', 'B', 12)
        self.cell(0, 10, title, 0, 1, 'L')
        self.ln(5)

    def chapter_body(self, body):
        self.set_font('Arial', '', 10)
        self.multi_cell(0, 5, body)
        self.ln()

def gerar_relatorio_texto(video_id, analise_padroes_data, pasta_destino):
    df_texto = pd.DataFrame([analise_padroes_data])
    excel_path = os.path.join(pasta_destino, f'RELATORIO_TEXTO_HUMANIZADO_{video_id}.xlsx')
    df_texto.to_excel(excel_path, index=False, engine='openpyxl')

    pdf = PDF()
    pdf.add_page()
    pdf.chapter_title('Estratégia de Conteúdo Textual')
    pdf.chapter_body(f'Resumo do Texto: {analise_padroes_data.get('resumo_texto', 'N/A')}')
    pdf.chapter_body(f'Palavras-chave: {', '.join(analise_padroes_data.get('palavras_chave_texto', []))}')
    pdf_path = os.path.join(pasta_destino, f'ESTRATEGIA_CONTEUDO_TEXTUAL_{video_id}.pdf')
    pdf.output(pdf_path)
    return excel_path, pdf_path

def gerar_relatorio_audio(video_id, analise_padroes_data, pasta_destino):
    df_audio = pd.DataFrame([analise_padroes_data.get('analise_audio_detalhada', {})])
    excel_path = os.path.join(pasta_destino, f'RELATORIO_AUDIO_HUMANIZADO_{video_id}.xlsx')
    df_audio.to_excel(excel_path, index=False, engine='openpyxl')

    pdf = PDF()
    pdf.add_page()
    pdf.chapter_title('Resumo de Áudio Estratégico')
    pdf.chapter_body(f'BPM: {analise_padroes_data.get('analise_audio_detalhada', {}).get('bpm', 'N/A')}')
    pdf.chapter_body(f'Duração do Áudio: {analise_padroes_data.get('analise_audio_detalhada', {}).get('duracao_audio_segundos', 'N/A')} segundos')
    pdf_path = os.path.join(pasta_destino, f'RESUMO_AUDIO_ESTRATEGICO_{video_id}.pdf')
    pdf.output(pdf_path)
    return excel_path, pdf_path

def gerar_relatorio_visual(video_id, analise_padroes_data, pasta_destino):
    df_visual = pd.DataFrame([analise_padroes_data.get('analise_visual_detalhada', {})])
    excel_path = os.path.join(pasta_destino, f'RELATORIO_VISUAL_HUMANIZADO_{video_id}.xlsx')
    df_visual.to_excel(excel_path, index=False, engine='openpyxl')

    pdf = PDF()
    pdf.add_page()
    pdf.chapter_title('Estratégia Visual Completa')
    pdf.chapter_body(f'Total de Cortes: {analise_padroes_data.get('analise_visual_detalhada', {}).get('total_cortes', 'N/A')}')
    pdf.chapter_body(f'Complexidade Visual Média: {analise_padroes_data.get('analise_visual_detalhada', {}).get('complexidade_visual_media', 'N/A'):.2f}')
    pdf.chapter_body(f'Brilho Médio: {analise_padroes_data.get('analise_visual_detalhada', {}).get('brilho_medio', 'N/A'):.2f}')
    pdf_path = os.path.join(pasta_destino, f'ESTRATEGIA_VISUAL_COMPLETA_{video_id}.pdf')
    pdf.output(pdf_path)
    return excel_path, pdf_path

def gerar_relatorio_psicologico(video_id, analise_psicologica_data, pasta_destino):
    df_psico = pd.DataFrame([analise_psicologica_data])
    excel_path = os.path.join(pasta_destino, f'RELATORIO_PSICOLOGICO_HUMANIZADO_{video_id}.xlsx')
    df_psico.to_excel(excel_path, index=False, engine='openpyxl')

    pdf = PDF()
    pdf.add_page()
    pdf.chapter_title('Manual de Psicologia Viral')
    pdf.chapter_body(f'Gatilhos Detectados: {', '.join(analise_psicologica_data.get('gatilhos_detectados', []))}')
    pdf.chapter_body(f'Emoções Predominantes: {analise_psicologica_data.get('emocoes_predominantes', 'N/A')}')
    pdf.chapter_body(f'Insights: {analise_psicologica_data.get('insights_psicologicos', 'N/A')}')
    pdf_path = os.path.join(pasta_destino, f'MANUAL_PSICOLOGIA_VIRAL_{video_id}.pdf')
    pdf.output(pdf_path)
    return excel_path, pdf_path

def processar_geracao_relatorios_todos_videos():
    prerequisito_ok, config = verificar_prerequisito_etapa('analise_psicologica')
    if not prerequisito_ok:
        return

    # Carregar dados de análise de padrões e psicológica
    analises_padroes_path = os.path.join(PASTA_TRABALHO, "dados", "analises_padroes_completas.json")
    analises_psicologicas_path = os.path.join(PASTA_TRABALHO, "dados", "analises_psicologicas_completas.json")
    with open(analises_padroes_path, "r", encoding="utf-8") as f:
        analises_padroes = json.load(f)
    with open(analises_psicologicas_path, "r", encoding="utf-8") as f:
        analises_psicologicas = json.load(f)

    sucessos = 0

    print(f"""
Iniciando geração de relatórios humanizados para {len(analises_padroes)} vídeos...""")

    for i, analise_padroes_data in enumerate(analises_padroes, 1):
        video_id = analise_padroes_data["video_id"]
        analise_psicologica_data = next((a for a in analises_psicologicas if a["video_id"] == video_id), None)

        if analise_padroes_data.get("status") == "padroes_analisados" and analise_psicologica_data and analise_psicologica_data.get("status") == "analise_psicologica_concluida":
            print(f"[{i}/{len(analises_padroes)}] Gerando relatórios para: {video_id}")
            try:
                # Geração de Relatórios de Texto
                pasta_texto = os.path.join(PASTA_TRABALHO, "analise_texto")
                os.makedirs(pasta_texto, exist_ok=True)
                excel_text, pdf_text = gerar_relatorio_texto(video_id, analise_padroes_data, pasta_texto)
                print(f"  💾 Relatório de Texto (XLSX) salvo em: {excel_text}")
                print(f"  💾 Estratégia de Conteúdo Textual (PDF) salvo em: {pdf_text}")

                # Geração de Relatórios de Áudio
                pasta_audio = os.path.join(PASTA_TRABALHO, "analise_audio")
                os.makedirs(pasta_audio, exist_ok=True)
                excel_audio, pdf_audio = gerar_relatorio_audio(video_id, analise_padroes_data, pasta_audio)
                print(f"  💾 Relatório de Áudio (XLSX) salvo em: {excel_audio}")
                print(f"  💾 Resumo de Áudio Estratégico (PDF) salvo em: {pdf_audio}")

                # Geração de Relatórios Visuais
                pasta_visual = os.path.join(PASTA_TRABALHO, "analise_visual")
                os.makedirs(pasta_visual, exist_ok=True)
                excel_visual, pdf_visual = gerar_relatorio_visual(video_id, analise_padroes_data, pasta_visual)
                print(f"  💾 Relatório Visual (XLSX) salvo em: {excel_visual}")
                print(f"  💾 Estratégia Visual Completa (PDF) salvo em: {pdf_visual}")

                # Geração de Relatórios Psicológicos
                pasta_psicologica = os.path.join(PASTA_TRABALHO, "analise_psicologica")
                os.makedirs(pasta_psicologica, exist_ok=True)
                excel_psico, pdf_psico = gerar_relatorio_psicologico(video_id, analise_psicologica_data, pasta_psicologica)
                print(f"  💾 Relatório Psicológico (XLSX) salvo em: {excel_psico}")
                print(f"  💾 Manual de Psicologia Viral (PDF) salvo em: {pdf_psico}")

                sucessos += 1
                print(f"  ✅ Relatórios gerados para {video_id}")

            except Exception as e:
                print(f"  ❌ ERRO na geração de relatórios para {video_id}: {e}")
        else:
            print(f"[{i}/{len(analises_padroes)}] Pulando {video_id} - Pré-requisitos não atendidos.")

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    config["status_etapas"]["relatorios_humanizados"] = True
    config["total_videos_relatorios_gerados"] = sucessos

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    print("""
✅ GERAÇÃO DE RELATÓRIOS HUMANIZADOS CONCLUÍDA!""")
    print(f"Total de vídeos com relatórios gerados: {sucessos}")

    if sucessos == 0:
        print("❌ NENHUM VÍDEO TEVE RELATÓRIOS GERADOS COM SUCESSO. Verifique as etapas anteriores.")
    print("""
➡️ PRÓXIMA CÉLULA: 4.2 - GERAÇÃO DO BLUEPRINT FINAL E DASHBOARD""")

# Executar geração de relatórios
try:
    processar_geracao_relatorios_todos_videos()
except Exception as e:
    print(f"""
❌ ERRO GERAL NA GERAÇÃO DE RELATÓRIOS: {e}""")
    print("Por favor, corrija o erro acima antes de prosseguir.")


Iniciando geração de relatórios humanizados para 5 vídeos...
[1/5] Gerando relatórios para: vid_ate_quando_voce_vai_ficar_culpando_os_outros
  💾 Relatório de Texto (XLSX) salvo em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/analise_texto/RELATORIO_TEXTO_HUMANIZADO_vid_ate_quando_voce_vai_ficar_culpando_os_outros.xlsx
  💾 Estratégia de Conteúdo Textual (PDF) salvo em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/analise_texto/ESTRATEGIA_CONTEUDO_TEXTUAL_vid_ate_quando_voce_vai_ficar_culpando_os_outros.pdf
  💾 Relatório de Áudio (XLSX) salvo em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/analise_audio/RELATORIO_AUDIO_HUMANIZADO_vid_ate_quando_voce_vai_ficar_culpando_os_outros.xlsx
  💾 Resumo de Áudio Estratégico (PDF) salvo em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/analise_audio/RESUMO_AUDIO_ESTRATEGICO_vid_ate_quando_voce_vai_ficar_culpando_os_outros.pdf
  💾 Relatório Visual (XLSX) salvo em: /content/drive/MyDrive/V

In [None]:
# ============================================================================
# CÉLULA 4.2: GERAÇÃO DO BLUEPRINT FINAL E DASHBOARD
# ============================================================================

def gerar_blueprint_dashboard():
    prerequisito_ok, config = verificar_prerequisito_etapa("relatorios_humanizados")
    if not prerequisito_ok:
        return

    # Carregar todos os dados de análise
    metadados_path = os.path.join(PASTA_TRABALHO, "dados", "metadados_completos.json")
    decomposicao_path = os.path.join(PASTA_TRABALHO, "dados", "decomposicao_completa.json")
    analises_padroes_path = os.path.join(PASTA_TRABALHO, "dados", "analises_padroes_completas.json")
    analises_psicologicas_path = os.path.join(PASTA_TRABALHO, "dados", "analises_psicologicas_completas.json")

    with open(metadados_path, "r", encoding="utf-8") as f:
        metadados = json.load(f)
    with open(decomposicao_path, "r", encoding="utf-8") as f:
        decomposicoes = json.load(f)
    with open(analises_padroes_path, "r", encoding="utf-8") as f:
        analises_padroes = json.load(f)
    with open(analises_psicologicas_path, "r", encoding="utf-8") as f:
        analises_psicologicas = json.load(f)

    dados_consolidados = []
    for video_meta in metadados:
        video_id = video_meta["id"]
        decomposicao = next((d for d in decomposicoes if d["video_id"] == video_id), {})
        analise_padroes = next((ap for ap in analises_padroes if ap["video_id"] == video_id), {})
        analise_psicologica = next((aps for aps in analises_psicologicas if aps["video_id"] == video_id), {})
        consolidado = {
            "video_id": video_id,
            "nome_arquivo": video_meta.get("nome_arquivo"),
            "duracao_segundos": video_meta.get("duracao_segundos"),
            "formato_detectado": video_meta.get("formato_detectado"),
            "tem_audio": video_meta.get("tem_audio"),
            "total_frames": video_meta.get("total_frames"),
            "ocr_textos_count": len(decomposicao.get("textos_ocr", [])),
            "audio_transcrito_len": len(decomposicao.get("audio_transcrito", "")),
            "cortes_detectados_count": len(decomposicao.get("cortes_detectados_segundos", [])),
            "bpm_audio": analise_padroes.get("analise_audio_detalhada", {}).get("bpm"),
            "complexidade_visual_media": analise_padroes.get("analise_visual_detalhada", {}).get("complexidade_visual_media"),
            "brilho_medio": analise_padroes.get("analise_visual_detalhada", {}).get("brilho_medio"),
            "padroes_gerais": ", ".join(analise_padroes.get("padroes_gerais", [])),
            "gatilhos_psicologicos": ", ".join(analise_psicologica.get("gatilhos_detectados", [])),
            "emocoes_predominantes": str(analise_psicologica.get("emocoes_predominantes", {})),
            "status_geral": video_meta.get("status") # Pode ser aprimorado para refletir o status de todas as etapas
        }
        dados_consolidados.append(consolidado)

    df_final = pd.DataFrame(dados_consolidados)

    # Salvar Dashboard Executivo (Excel)
    dashboard_excel_path = os.path.join(PASTA_TRABALHO, "dashboard", "DASHBOARD_MASTER_EXECUTIVO.xlsx")
    df_final.to_excel(dashboard_excel_path, index=False, engine="openpyxl")
    print(f"\n💾 Dashboard Executivo (XLSX) salvo em: {dashboard_excel_path}")

    # Salvar Dados Consolidados (CSV e JSON)
    dados_csv_path = os.path.join(PASTA_TRABALHO, "dashboard", "dados_consolidados.csv")
    df_final.to_csv(dados_csv_path, index=False, encoding="utf-8")
    print(f"💾 Dados Consolidados (CSV) salvo em: {dados_csv_path}")

    dados_json_path = os.path.join(PASTA_TRABALHO, "dashboard", "dados_detalhados.json")
    with open(dados_json_path, "w", encoding="utf-8") as f:
        json.dump(dados_consolidados, f, indent=2, ensure_ascii=False)
    print(f"💾 Dados Detalhados (JSON) salvo em: {dados_json_path}")

    # Geração de Dashboard Interativo (HTML - Exemplo simples)
    # Para um dashboard interativo real, seria necessário uma biblioteca como Plotly ou Dash
    dashboard_html_path = os.path.join(PASTA_TRABALHO, "dashboard", "dashboard_interativo.html")
    with open(dashboard_html_path, "w", encoding="utf-8") as f:
        f.write("<html><body><h1>Dashboard Interativo (Placeholder)</h1><p>Seu dashboard interativo real seria gerado aqui com bibliotecas como Plotly ou Dash.</p></body></html>")
    print(f"💾 Dashboard Interativo (HTML) salvo em: {dashboard_html_path}")

    # Geração do Blueprint Estratégico (PDF - Exemplo simples)
    pdf = PDF()
    pdf.add_page()
    pdf.chapter_title("BLUEPRINT ESTRATÉGICO FINAL")
    pdf.chapter_body("Este é o seu blueprint estratégico final, consolidando todos os insights.")
    pdf.chapter_body(f"Total de vídeos analisados: {len(df_final)}")
    pdf.chapter_body(f"Média de duração dos vídeos: {df_final["duracao_segundos"] .mean():.2f} segundos")
    pdf_blueprint_path = os.path.join(PASTA_TRABALHO, "blueprint", "BLUEPRINT_ESTRATEGICO_FINAL.pdf")
    pdf.output(pdf_blueprint_path)
    print(f"💾 Blueprint Estratégico (PDF) salvo em: {pdf_blueprint_path}")

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    config["status_etapas"]["blueprint"] = True

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    print("\n✅ GERAÇÃO DO BLUEPRINT FINAL E DASHBOARD CONCLUÍDA!")
    print("Todos os relatórios e o dashboard foram gerados com sucesso.")
    print("\n🎉 PROCESSO DE ENGENHARIA REVERSA CONCLUÍDO COM SUCESSO! 🎉")

# Executar geração de blueprint e dashboard
try:
    gerar_blueprint_dashboard()
except Exception as e:
    print(f"\n❌ ERRO GERAL NA GERAÇÃO DO BLUEPRINT E DASHBOARD: {e}")
    print("Por favor, corrija o erro acima antes de prosseguir.")


💾 Dashboard Executivo (XLSX) salvo em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/dashboard/DASHBOARD_MASTER_EXECUTIVO.xlsx
💾 Dados Consolidados (CSV) salvo em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/dashboard/dados_consolidados.csv
💾 Dados Detalhados (JSON) salvo em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/dashboard/dados_detalhados.json
💾 Dashboard Interativo (HTML) salvo em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/dashboard/dashboard_interativo.html
💾 Blueprint Estratégico (PDF) salvo em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/blueprint/BLUEPRINT_ESTRATEGICO_FINAL.pdf

✅ GERAÇÃO DO BLUEPRINT FINAL E DASHBOARD CONCLUÍDA!
Todos os relatórios e o dashboard foram gerados com sucesso.

🎉 PROCESSO DE ENGENHARIA REVERSA CONCLUÍDO COM SUCESSO! 🎉


In [None]:
import os
import pandas as pd
import json

# Verificar se o processo de engenharia reversa foi executado
BASE_PATH = "/content/drive/MyDrive/Videos Dona Done/_engenharia_reversa"
CSV_PATH = os.path.join(BASE_PATH, "dashboard", "dados_consolidados.csv")
JSON_PATH = os.path.join(BASE_PATH, "dashboard", "dados_detalhados.json")

print("🔍 VERIFICANDO PRÉ-REQUISITOS...")
print(f"Pasta base existe: {os.path.exists(BASE_PATH)}")
print(f"CSV existe: {os.path.exists(CSV_PATH)}")
print(f"JSON existe: {os.path.exists(JSON_PATH)}")

if os.path.exists(CSV_PATH):
    df = pd.read_csv(CSV_PATH)
    print(f"📊 Dados CSV: {len(df)} vídeos encontrados")

print("\n✅ Se todos os itens acima são True/existem, você pode prosseguir!")

🔍 VERIFICANDO PRÉ-REQUISITOS...
Pasta base existe: True
CSV existe: True
JSON existe: True
📊 Dados CSV: 5 vídeos encontrados

✅ Se todos os itens acima são True/existem, você pode prosseguir!


In [None]:
# ============================================================================
# SISTEMA DE INTEGRAÇÃO AUTOMÁTICA PARA NOVAS FUNCIONALIDADES
# ============================================================================
# Este script deve SUBSTITUIR a última célula (4.2) do notebook
# Ele detecta automaticamente todas as análises disponíveis e as integra

import os
import json
import pandas as pd
import glob
from datetime import datetime
import warnings
warnings.filterwarnings('ignore')

def descobrir_analises_disponiveis(pasta_trabalho):
    """Descobre automaticamente todas as análises realizadas"""
    analises_encontradas = {
        "base": {},
        "adicionais": {}
    }

    dados_path = os.path.join(pasta_trabalho, "dados")

    # Análises básicas obrigatórias
    arquivos_base = {
        "metadados": "metadados_completos.json",
        "decomposicao": "decomposicao_completa.json",
        "padroes": "analises_padroes_completas.json",
        "psicologica": "analises_psicologicas_completas.json"
    }

    for tipo, arquivo in arquivos_base.items():
        caminho = os.path.join(dados_path, arquivo)
        if os.path.exists(caminho):
            analises_encontradas["base"][tipo] = caminho
            print(f"✅ Análise base encontrada: {tipo}")
        else:
            print(f"⚠️ Análise base ausente: {tipo}")

    # Descobrir análises adicionais automaticamente
    # Busca por qualquer arquivo JSON que não seja das análises base
    todos_jsons = glob.glob(os.path.join(dados_path, "*.json"))

    for json_path in todos_jsons:
        nome_arquivo = os.path.basename(json_path)

        # Pular arquivos base
        if nome_arquivo in arquivos_base.values():
            continue

        # Identificar tipo da análise pelo nome
        if "audio" in nome_arquivo.lower():
            analises_encontradas["adicionais"]["audio_refinada"] = json_path
            print(f"✅ Análise adicional encontrada: Audio Refinada")
        elif "visual" in nome_arquivo.lower():
            analises_encontradas["adicionais"]["visual_avancada"] = json_path
            print(f"✅ Análise adicional encontrada: Visual Avançada")
        elif "texto" in nome_arquivo.lower():
            analises_encontradas["adicionais"]["texto_avancada"] = json_path
            print(f"✅ Análise adicional encontrada: Texto Avançada")
        elif "sentiment" in nome_arquivo.lower():
            analises_encontradas["adicionais"]["sentimento"] = json_path
            print(f"✅ Análise adicional encontrada: Sentimento")
        else:
            # Análise não reconhecida - incluir mesmo assim
            nome_limpo = nome_arquivo.replace(".json", "").replace("_", " ").title()
            analises_encontradas["adicionais"][nome_arquivo] = json_path
            print(f"✅ Análise personalizada encontrada: {nome_limpo}")

    return analises_encontradas

def carregar_dados_analise(caminho_arquivo):
    """Carrega dados de uma análise com tratamento de erros"""
    try:
        with open(caminho_arquivo, 'r', encoding='utf-8') as f:
            dados = json.load(f)
        return dados, True
    except Exception as e:
        print(f"⚠️ Erro ao carregar {caminho_arquivo}: {e}")
        return [], False

def extrair_metricas_dinamicamente(dados, tipo_analise):
    """Extrai métricas de qualquer tipo de análise dinamicamente"""
    metricas_extraidas = {}

    if not dados:
        return metricas_extraidas

    # Pegar o primeiro item para entender a estrutura
    primeiro_item = dados[0] if isinstance(dados, list) else dados

    if isinstance(primeiro_item, dict):
        for chave, valor in primeiro_item.items():
            if chave in ['video_id', 'status', 'data_analise', 'erro']:
                continue

            # Extrair métricas numéricas automaticamente
            if isinstance(valor, (int, float)):
                metricas_extraidas[f"{tipo_analise}_{chave}"] = valor
            elif isinstance(valor, dict):
                # Análise aninhada - extrair sub-métricas
                for sub_chave, sub_valor in valor.items():
                    if isinstance(sub_valor, (int, float)):
                        metricas_extraidas[f"{tipo_analise}_{chave}_{sub_chave}"] = sub_valor
                    elif isinstance(sub_valor, list) and sub_valor and isinstance(sub_valor[0], (int, float)):
                        # Lista de números - calcular estatísticas
                        metricas_extraidas[f"{tipo_analise}_{chave}_{sub_chave}_media"] = sum(sub_valor) / len(sub_valor)
                        metricas_extraidas[f"{tipo_analise}_{chave}_{sub_chave}_max"] = max(sub_valor)
                        metricas_extraidas[f"{tipo_analise}_{chave}_{sub_chave}_min"] = min(sub_valor)
            elif isinstance(valor, list):
                if valor and isinstance(valor[0], (int, float)):
                    # Lista de números
                    metricas_extraidas[f"{tipo_analise}_{chave}_count"] = len(valor)
                    metricas_extraidas[f"{tipo_analise}_{chave}_media"] = sum(valor) / len(valor) if valor else 0
                else:
                    # Lista de objetos ou strings
                    metricas_extraidas[f"{tipo_analise}_{chave}_count"] = len(valor)

    return metricas_extraidas

def consolidar_todos_dados(analises_encontradas):
    """Consolida todos os dados de todas as análises encontradas"""
    dados_consolidados = {}

    # Carregar análises base
    for tipo, caminho in analises_encontradas["base"].items():
        dados, sucesso = carregar_dados_analise(caminho)
        if sucesso:
            dados_consolidados[tipo] = dados

    # Carregar análises adicionais
    for tipo, caminho in analises_encontradas["adicionais"].items():
        dados, sucesso = carregar_dados_analise(caminho)
        if sucesso:
            dados_consolidados[tipo] = dados

    # Criar DataFrame consolidado por vídeo
    videos_df = pd.DataFrame()

    # Começar com metadados base se disponível
    if "metadados" in dados_consolidados:
        videos_df = pd.DataFrame(dados_consolidados["metadados"])
        videos_df = videos_df.set_index('id')

    # Integrar cada análise adicional
    for tipo, dados in dados_consolidados.items():
        if tipo == "metadados":
            continue

        print(f"🔄 Integrando dados de: {tipo}")

        # Converter para DataFrame se for lista
        if isinstance(dados, list):
            df_analise = pd.DataFrame(dados)

            if 'video_id' in df_analise.columns:
                df_analise = df_analise.set_index('video_id')

                # Extrair métricas dinamicamente
                for video_id, row in df_analise.iterrows():
                    metricas = extrair_metricas_dinamicamente([row.to_dict()], tipo)

                    for metrica, valor in metricas.items():
                        if video_id in videos_df.index:
                            videos_df.loc[video_id, metrica] = valor
                        else:
                            # Criar nova linha se vídeo não existir
                            videos_df.loc[video_id, metrica] = valor

    return videos_df.reset_index()

def gerar_dashboard_dinamico(df_consolidado, pasta_trabalho):
    """Gera dashboard dinâmico incluindo todas as análises encontradas"""
    from openpyxl import Workbook
    from openpyxl.styles import Font, Alignment, PatternFill

    wb = Workbook()

    # ABA 1: VISÃO GERAL DINÂMICA
    ws_geral = wb.active
    ws_geral.title = 'Visão Geral Completa'

    # Header
    ws_geral.cell(row=1, column=1).value = 'RELATÓRIO COMPLETO DE ENGENHARIA REVERSA'
    ws_geral.cell(row=1, column=1).font = Font(bold=True, size=16)

    # Estatísticas gerais
    ws_geral.cell(row=3, column=1).value = 'ANÁLISES REALIZADAS'
    ws_geral.cell(row=3, column=1).font = Font(bold=True, size=14)

    # Contar colunas por tipo de análise
    colunas_por_tipo = {}
    for col in df_consolidado.columns:
        if '_' in col:
            tipo = col.split('_')[0]
            colunas_por_tipo[tipo] = colunas_por_tipo.get(tipo, 0) + 1

    row = 4
    for tipo, count in colunas_por_tipo.items():
        ws_geral.cell(row=row, column=1).value = f"{tipo.upper()}"
        ws_geral.cell(row=row, column=2).value = f"{count} métricas extraídas"
        ws_geral.cell(row=row, column=1).font = Font(bold=True)
        row += 1

    # ABA 2: DADOS COMPLETOS
    ws_dados = wb.create_sheet('Dados Completos')

    # Adicionar todos os dados
    for r_idx, row in enumerate(df_consolidado.itertuples(), 1):
        for c_idx, value in enumerate(row):
            cell = ws_dados.cell(row=r_idx, column=c_idx)
            cell.value = value
            if r_idx == 1:  # Header
                cell.font = Font(bold=True)

    # ABA 3: MÉTRICAS POR TIPO
    tipos_encontrados = list(set([col.split('_')[0] for col in df_consolidado.columns if '_' in col]))

    for tipo in tipos_encontrados:
        ws_tipo = wb.create_sheet(f'Análise {tipo.title()}')

        # Filtrar colunas deste tipo
        colunas_tipo = ['id', 'nome_arquivo'] + [col for col in df_consolidado.columns if col.startswith(tipo)]

        if len(colunas_tipo) > 2:  # Tem dados além do id e nome
            df_tipo = df_consolidado[colunas_tipo]

            # Adicionar ao worksheet
            for r_idx, row in enumerate(df_tipo.itertuples(), 1):
                for c_idx, value in enumerate(row):
                    cell = ws_tipo.cell(row=r_idx, column=c_idx)
                    cell.value = value
                    if r_idx == 1:
                        cell.font = Font(bold=True)

    # ABA 4: INSIGHTS AUTOMATICOS
    ws_insights = wb.create_sheet('Insights Automáticos')

    insights_automaticos = gerar_insights_automaticos(df_consolidado)

    ws_insights.cell(row=1, column=1).value = 'INSIGHTS GERADOS AUTOMATICAMENTE'
    ws_insights.cell(row=1, column=1).font = Font(bold=True, size=16)

    for i, insight in enumerate(insights_automaticos, 3):
        ws_insights.cell(row=i, column=1).value = f"• {insight}"
        ws_insights.cell(row=i, column=1).alignment = Alignment(wrap_text=True)

    # Salvar
    output_path = os.path.join(pasta_trabalho, "dashboard", "RELATORIO_COMPLETO_DINAMICO.xlsx")
    os.makedirs(os.path.dirname(output_path), exist_ok=True)
    wb.save(output_path)

    return output_path

def gerar_insights_automaticos(df):
    """Gera insights automáticos baseados em qualquer conjunto de dados"""
    insights = []

    # Análise de correlações automáticas
    colunas_numericas = df.select_dtypes(include=['int64', 'float64']).columns

    if len(colunas_numericas) > 1:
        correlacoes = df[colunas_numericas].corr()

        # Encontrar correlações fortes
        for col1 in correlacoes.columns:
            for col2 in correlacoes.columns:
                if col1 != col2:
                    corr_val = correlacoes.loc[col1, col2]
                    if abs(corr_val) > 0.7:
                        insights.append(f"CORRELAÇÃO FORTE: {col1} e {col2} têm correlação de {corr_val:.2f}")

    # Identificar outliers automáticos
    for col in colunas_numericas:
        if df[col].std() > 0:  # Evitar divisão por zero
            media = df[col].mean()
            std = df[col].std()
            outliers = df[(df[col] > media + 2*std) | (df[col] < media - 2*std)]

            if len(outliers) > 0:
                insights.append(f"OUTLIERS DETECTADOS: {len(outliers)} vídeos têm valores extremos em {col}")

    # Análise de distribuições
    for col in colunas_numericas:
        if col.endswith('_score') or 'score' in col:
            media = df[col].mean()
            if media > 80:
                insights.append(f"PERFORMANCE ALTA: Score médio de {col} é {media:.1f} - excelente resultado")
            elif media < 50:
                insights.append(f"OPORTUNIDADE: Score médio de {col} é {media:.1f} - há espaço para melhorias")

    return insights if insights else ["Análise de insights em andamento - dados sendo processados"]

def atualizar_config_com_novas_analises(pasta_trabalho, analises_encontradas):
    """Atualiza config.json com status de todas as análises encontradas"""
    config_path = os.path.join(pasta_trabalho, "config", "config.json")

    # Carregar config existente
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    # Atualizar status das análises encontradas
    for tipo in analises_encontradas["base"]:
        config["status_etapas"][tipo] = True

    for tipo in analises_encontradas["adicionais"]:
        config["status_etapas"][f"analise_{tipo}"] = True

    config["ultima_consolidacao"] = datetime.now().isoformat()
    config["total_analises_integradas"] = len(analises_encontradas["base"]) + len(analises_encontradas["adicionais"])

    # Salvar config atualizado
    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

def main_integracao_automatica():
    """Função principal da integração automática"""
    print("🚀 INICIANDO INTEGRAÇÃO AUTOMÁTICA DE TODAS AS ANÁLISES")

    # Usar variável global da pasta de trabalho
    if "PASTA_TRABALHO" not in globals():
        print("❌ ERRO: Execute as células anteriores primeiro")
        return False

    pasta_trabalho = PASTA_TRABALHO

    try:
        # Passo 1: Descobrir análises
        print("\n🔍 DESCOBRINDO ANÁLISES DISPONÍVEIS...")
        analises = descobrir_analises_disponiveis(pasta_trabalho)

        total_analises = len(analises["base"]) + len(analises["adicionais"])
        print(f"📊 Total de análises encontradas: {total_analises}")

        # Passo 2: Consolidar dados
        print("\n🔄 CONSOLIDANDO TODOS OS DADOS...")
        df_consolidado = consolidar_todos_dados(analises)

        print(f"📈 {len(df_consolidado)} vídeos consolidados com {len(df_consolidado.columns)} métricas totais")

        # Passo 3: Gerar dashboard dinâmico
        print("\n📊 GERANDO DASHBOARD DINÂMICO...")
        dashboard_path = gerar_dashboard_dinamico(df_consolidado, pasta_trabalho)

        # Passo 4: Salvar dados consolidados
        csv_path = os.path.join(pasta_trabalho, "dashboard", "dados_completos_consolidados.csv")
        df_consolidado.to_csv(csv_path, index=False, encoding='utf-8')

        json_path = os.path.join(pasta_trabalho, "dashboard", "dados_completos_consolidados.json")
        df_consolidado.to_json(json_path, orient='records', indent=2, force_ascii=False)

        # Passo 5: Atualizar configuração
        print("\n⚙️ ATUALIZANDO CONFIGURAÇÕES...")
        atualizar_config_com_novas_analises(pasta_trabalho, analises)

        # Resultados finais
        print("\n✅ INTEGRAÇÃO AUTOMÁTICA CONCLUÍDA COM SUCESSO!")
        print(f"📁 Dashboard dinâmico: {dashboard_path}")
        print(f"📁 Dados CSV: {csv_path}")
        print(f"📁 Dados JSON: {json_path}")
        print(f"📊 {len(df_consolidado)} vídeos processados")
        print(f"📈 {len(df_consolidado.columns)} métricas totais integradas")

        print("\n🎯 PRÓXIMOS PASSOS:")
        print("• Abra o arquivo Excel para ver todas as análises integradas")
        print("• Use os dados CSV/JSON em outras ferramentas de análise")
        print("• Execute novamente sempre que adicionar novas análises")

        return True

    except Exception as e:
        print(f"\n❌ ERRO NA INTEGRAÇÃO AUTOMÁTICA: {e}")
        print("Verifique se todas as análises anteriores foram executadas com sucesso")
        return False

# Executar integração automática
if __name__ == "__main__":
    main_integracao_automatica()

In [None]:
# ============================================================================
# CÉLULA 4.3: DASHBOARD MASTER EXECUTIVO INTELIGENTE APRIMORADO
# ============================================================================
import pandas as pd
import json
import os
import numpy as np
from datetime import datetime
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows
from openpyxl.styles import Font, Alignment, PatternFill
from collections import Counter
import warnings
warnings.filterwarnings('ignore')

def log_progress(message):
    """Log de progresso em tempo real"""
    timestamp = datetime.now().strftime("%H:%M:%S")
    print(f"[{timestamp}] {message}")

def calculate_viral_score(row):
    """Calcula score de viralidade baseado em múltiplos fatores"""
    try:
        score = 0

        # Fator 1: Ritmo (cortes por segundo) - peso 25%
        if pd.notna(row['duracao_segundos']) and row['duracao_segundos'] > 0:
            cortes_por_seg = row['cortes_detectados_count'] / row['duracao_segundos']
            if cortes_por_seg > 20: score += 25
            elif cortes_por_seg > 10: score += 20
            elif cortes_por_seg > 5: score += 15
            else: score += 10

        # Fator 2: Complexidade Visual - peso 20%
        if pd.notna(row['complexidade_visual_media']):
            if row['complexidade_visual_media'] > 600: score += 20
            elif row['complexidade_visual_media'] > 400: score += 15
            else: score += 10

        # Fator 3: Presença de Texto (OCR) - peso 15%
        if pd.notna(row['ocr_textos_count']):
            if row['ocr_textos_count'] > 10: score += 15
            elif row['ocr_textos_count'] > 5: score += 12
            elif row['ocr_textos_count'] > 0: score += 8

        # Fator 4: Duração Ideal - peso 20%
        if pd.notna(row['duracao_segundos']):
            if 15 <= row['duracao_segundos'] <= 30: score += 20
            elif 10 <= row['duracao_segundos'] <= 45: score += 15
            else: score += 10

        # Fator 5: Gatilhos Psicológicos - peso 20%
        gatilhos = str(row['gatilhos_psicologicos']).lower()
        if 'urgência' in gatilhos or 'escassez' in gatilhos: score += 8
        if 'estímulo' in gatilhos: score += 7
        if 'atenção' in gatilhos: score += 5

        return min(score, 100)
    except:
        return 50

def calculate_technical_score(row):
    """Score técnico baseado em qualidade de produção"""
    try:
        score = 0

        if pd.notna(row['brilho_medio']):
            if 120 <= row['brilho_medio'] <= 180: score += 25
            elif 100 <= row['brilho_medio'] <= 200: score += 20
            else: score += 10

        formato = str(row['formato_detectado'])
        if 'vertical_9_16' in formato: score += 25
        elif 'horizontal_16_9' in formato: score += 20
        else: score += 15

        if row['tem_audio']: score += 25
        else: score += 5

        if pd.notna(row['total_frames']) and row['total_frames'] > 0:
            if row['total_frames'] > 300: score += 25
            elif row['total_frames'] > 150: score += 20
            else: score += 15

        return min(score, 100)
    except:
        return 50

def calculate_content_score(row):
    """Score de conteúdo baseado em riqueza informacional"""
    try:
        score = 0

        ocr_count = row['ocr_textos_count'] if pd.notna(row['ocr_textos_count']) else 0
        audio_len = row['audio_transcrito_len'] if pd.notna(row['audio_transcrito_len']) else 0

        if ocr_count > 5 or audio_len > 100: score += 30
        elif ocr_count > 2 or audio_len > 50: score += 20
        elif ocr_count > 0 or audio_len > 0: score += 15
        else: score += 5

        if pd.notna(row['bpm_audio']):
            if 120 <= row['bpm_audio'] <= 140: score += 35
            elif 100 <= row['bpm_audio'] <= 160: score += 25
            else: score += 15

        if pd.notna(row['duracao_segundos']) and row['duracao_segundos'] > 0:
            densidade = (ocr_count + audio_len/10) / row['duracao_segundos']
            if densidade > 2: score += 35
            elif densidade > 1: score += 25
            else: score += 15

        return min(score, 100)
    except:
        return 50

def generate_insights_from_data(df):
    """Gera insights inteligentes baseados nos dados"""
    insights = []

    try:
        best_performing = df.nlargest(3, 'viral_score')
        avg_duration = best_performing['duracao_segundos'].mean()
        insights.append(f"DURAÇÃO VENCEDORA: Seus top 3 vídeos têm duração média de {avg_duration:.1f}s. Este é seu sweet spot comprovado.")

        avg_cuts_per_sec = (best_performing['cortes_detectados_count'] / best_performing['duracao_segundos']).mean()
        insights.append(f"RITMO IDEAL: {avg_cuts_per_sec:.1f} cortes por segundo é sua fórmula de edição mais eficaz.")

        formato_winner = df['formato_detectado'].mode()[0] if not df['formato_detectado'].empty else 'N/A'
        formato_count = df['formato_detectado'].value_counts().iloc[0] if not df['formato_detectado'].empty else 0
        insights.append(f"FORMATO DOMINANTE: {formato_count} vídeos em {formato_winner}. Este é seu formato de maior alcance.")

        high_viral = df[df['viral_score'] > 70]
        if not high_viral.empty:
            avg_complexity = high_viral['complexidade_visual_media'].mean()
            insights.append(f"COMPLEXIDADE VISUAL ÓTIMA: Vídeos com score viral alto têm complexidade média de {avg_complexity:.0f}. Use como referência.")

        text_heavy = df[df['ocr_textos_count'] > 5]
        if not text_heavy.empty:
            insights.append(f"ESTRATÉGIA DE TEXTO: {len(text_heavy)} vídeos com muito texto têm score médio de {text_heavy['viral_score'].mean():.0f}. Texto na tela impacta performance.")

        # CORRIGIDO: bpm_audio em vez de bmp_audio
        if df['bpm_audio'].notna().any():
            successful_bpm = df[df['viral_score'] > 60]['bpm_audio'].mean()
            insights.append(f"BPM DE SUCESSO: {successful_bpm:.0f} BPM é o ritmo de áudio dos seus vídeos mais virais.")

    except Exception as e:
        log_progress(f"Erro ao gerar insights: {e}")
        insights.append("Insights parciais disponíveis devido a limitações nos dados.")

    return insights

def add_data_to_sheet(ws, data, start_row=1, start_col=1, headers=None):
    """Adiciona dados a uma planilha de forma segura"""
    current_row = start_row

    # Adicionar cabeçalhos se fornecidos
    if headers:
        for col_idx, header in enumerate(headers):
            cell = ws.cell(row=current_row, column=start_col + col_idx)
            cell.value = header
            cell.font = Font(bold=True)
        current_row += 1

    # Adicionar dados
    for row_data in data:
        for col_idx, value in enumerate(row_data):
            cell = ws.cell(row=current_row, column=start_col + col_idx)
            cell.value = value
        current_row += 1

    return current_row

def create_enhanced_dashboard_master(csv_path, json_path, output_path):
    """Cria dashboard master executivo aprimorado"""

    log_progress("INICIANDO CRIAÇÃO DO DASHBOARD MASTER EXECUTIVO INTELIGENTE")

    try:
        # Carregar dados
        log_progress("Carregando dados consolidados...")
        df_consolidado = pd.read_csv(csv_path, encoding='utf-8')

        with open(json_path, 'r', encoding='utf-8') as f:
            dados_detalhados = json.load(f)

        log_progress(f"Dados carregados: {len(df_consolidado)} vídeos encontrados")

        # Pré-processamento inteligente
        log_progress("Processando inteligência artificial dos dados...")

        # Limpar e converter dados
        try:
            df_consolidado['emocoes_predominantes'] = df_consolidado['emocoes_predominantes'].apply(
                lambda x: json.loads(x.replace("'", '"')) if pd.notna(x) and x != '{}' else {}
            )
        except:
            df_consolidado['emocoes_predominantes'] = [{}] * len(df_consolidado)

        # Calcular scores inteligentes
        log_progress("Calculando scores de performance...")
        df_consolidado['viral_score'] = df_consolidado.apply(calculate_viral_score, axis=1)
        df_consolidado['technical_score'] = df_consolidado.apply(calculate_technical_score, axis=1)
        df_consolidado['content_score'] = df_consolidado.apply(calculate_content_score, axis=1)
        df_consolidado['overall_score'] = (df_consolidado['viral_score'] + df_consolidado['technical_score'] + df_consolidado['content_score']) / 3

        # Calcular métricas avançadas
        df_consolidado['cortes_por_segundo'] = df_consolidado['cortes_detectados_count'] / df_consolidado['duracao_segundos'].replace(0, 1)
        df_consolidado['densidade_texto'] = df_consolidado['ocr_textos_count'] / df_consolidado['duracao_segundos'].replace(0, 1)
        df_consolidado['eficiencia_audio'] = df_consolidado['audio_transcrito_len'] / df_consolidado['duracao_segundos'].replace(0, 1)

        log_progress("Gerando insights estratégicos...")
        insights = generate_insights_from_data(df_consolidado)

        # Criar workbook
        log_progress("Criando estrutura do dashboard...")
        wb = Workbook()

        # === ABA 1: EXECUTIVE SUMMARY ===
        log_progress("Criando Executive Summary...")
        ws_summary = wb.active
        ws_summary.title = 'Executive Summary'

        # Header principal
        header_cell = ws_summary.cell(row=1, column=1)
        header_cell.value = 'DASHBOARD MASTER EXECUTIVO - ENGENHARIA REVERSA DE VÍDEOS'
        header_cell.font = Font(bold=True, size=18, color='FFFFFF')
        header_cell.fill = PatternFill(start_color='1F4E79', end_color='1F4E79', fill_type='solid')
        header_cell.alignment = Alignment(horizontal='center', vertical='center')

        # Expandir header manualmente
        for col in range(2, 9):
            cell = ws_summary.cell(row=1, column=col)
            cell.fill = PatternFill(start_color='1F4E79', end_color='1F4E79', fill_type='solid')

        # KPIs Principais
        kpi_cell = ws_summary.cell(row=3, column=1)
        kpi_cell.value = 'INDICADORES DE PERFORMANCE PRINCIPAIS'
        kpi_cell.font = Font(bold=True, size=14)
        kpi_cell.fill = PatternFill(start_color='E7E6E6', end_color='E7E6E6', fill_type='solid')

        kpis_data = [
            ['Total de Vídeos Analisados', len(df_consolidado)],
            ['Score Viral Médio', f"{df_consolidado['viral_score'].mean():.1f}/100"],
            ['Score Técnico Médio', f"{df_consolidado['technical_score'].mean():.1f}/100"],
            ['Score de Conteúdo Médio', f"{df_consolidado['content_score'].mean():.1f}/100"],
            ['Duração Média Otimizada', f"{df_consolidado['duracao_segundos'].mean():.1f}s"],
            ['Ritmo Médio de Cortes', f"{df_consolidado['cortes_por_segundo'].mean():.1f}/seg"],
        ]

        add_data_to_sheet(ws_summary, kpis_data, start_row=4, start_col=1)

        # Top 3 Vídeos
        top3_cell = ws_summary.cell(row=3, column=4)
        top3_cell.value = 'TOP 3 VÍDEOS POR PERFORMANCE'
        top3_cell.font = Font(bold=True, size=14)
        top3_cell.fill = PatternFill(start_color='E7E6E6', end_color='E7E6E6', fill_type='solid')

        top3 = df_consolidado.nlargest(3, 'overall_score')[['nome_arquivo', 'overall_score', 'viral_score', 'technical_score', 'content_score']]

        top3_data = []
        for _, video in top3.iterrows():
            nome_curto = video['nome_arquivo'][:30] + "..." if len(video['nome_arquivo']) > 30 else video['nome_arquivo']
            top3_data.append([
                nome_curto,
                f"{video['overall_score']:.1f}",
                f"{video['viral_score']:.1f}",
                f"{video['technical_score']:.1f}",
                f"{video['content_score']:.1f}"
            ])

        top3_headers = ['Vídeo', 'Score Geral', 'Viral', 'Técnico', 'Conteúdo']
        add_data_to_sheet(ws_summary, top3_data, start_row=4, start_col=4, headers=top3_headers)

        # Insights Estratégicos
        insights_cell = ws_summary.cell(row=12, column=1)
        insights_cell.value = 'INSIGHTS ESTRATÉGICOS BASEADOS EM IA'
        insights_cell.font = Font(bold=True, size=14, color='FFFFFF')
        insights_cell.fill = PatternFill(start_color='C5504B', end_color='C5504B', fill_type='solid')
        insights_cell.alignment = Alignment(horizontal='center')

        # Adicionar insights
        for i, insight in enumerate(insights, 13):
            insight_cell = ws_summary.cell(row=i, column=1)
            insight_cell.value = f"• {insight}"
            insight_cell.alignment = Alignment(wrap_text=True)

        # === ABA 2: ANÁLISE DE PERFORMANCE ===
        log_progress("Criando Análise de Performance...")
        ws_performance = wb.create_sheet('Análise de Performance')

        perf_header = ws_performance.cell(row=1, column=1)
        perf_header.value = 'ANÁLISE DETALHADA DE PERFORMANCE'
        perf_header.font = Font(bold=True, size=16)
        perf_header.alignment = Alignment(horizontal='center')

        # Ranking completo
        ranking_data = df_consolidado[['nome_arquivo', 'overall_score', 'viral_score', 'technical_score', 'content_score',
                                     'duracao_segundos', 'cortes_por_segundo', 'formato_detectado']].sort_values('overall_score', ascending=False)

        ranking_list = []
        for _, video in ranking_data.iterrows():
            nome_curto = video['nome_arquivo'][:40] + "..." if len(video['nome_arquivo']) > 40 else video['nome_arquivo']
            ranking_list.append([
                nome_curto,
                f"{video['overall_score']:.1f}",
                f"{video['viral_score']:.1f}",
                f"{video['technical_score']:.1f}",
                f"{video['content_score']:.1f}",
                f"{video['duracao_segundos']:.1f}s",
                f"{video['cortes_por_segundo']:.1f}",
                video['formato_detectado']
            ])

        ranking_headers = ['Vídeo', 'Score Geral', 'Viral', 'Técnico', 'Conteúdo', 'Duração', 'Cortes/s', 'Formato']
        add_data_to_sheet(ws_performance, ranking_list, start_row=3, start_col=1, headers=ranking_headers)

        # === ABA 3: INTELIGÊNCIA TÉCNICA ===
        log_progress("Criando Inteligência Técnica...")
        ws_tecnica = wb.create_sheet('Inteligência Técnica')

        tec_header = ws_tecnica.cell(row=1, column=1)
        tec_header.value = 'ANÁLISE TÉCNICA AVANÇADA'
        tec_header.font = Font(bold=True, size=16)
        tec_header.alignment = Alignment(horizontal='center')

        # Análise de correlações
        corr_header = ws_tecnica.cell(row=3, column=1)
        corr_header.value = 'CORRELAÇÕES DESCOBERTAS'
        corr_header.font = Font(bold=True, size=12)

        correlations_data = [
            ['Duração vs Score Viral', f"{df_consolidado['duracao_segundos'].corr(df_consolidado['viral_score']):.3f}", 'CORRELAÇÃO MODERADA'],
            ['Cortes/s vs Score Viral', f"{df_consolidado['cortes_por_segundo'].corr(df_consolidado['viral_score']):.3f}", 'CORRELAÇÃO MODERADA'],
            ['Complexidade Visual vs Performance', f"{df_consolidado['complexidade_visual_media'].corr(df_consolidado['overall_score']):.3f}", 'CORRELAÇÃO FRACA'],
            ['BPM vs Engajamento', f"{df_consolidado['bpm_audio'].corr(df_consolidado['viral_score']) if df_consolidado['bpm_audio'].notna().any() else 0:.3f}", 'CORRELAÇÃO FRACA'],
        ]

        corr_headers = ['Métrica', 'Correlação', 'Classificação']
        add_data_to_sheet(ws_tecnica, correlations_data, start_row=4, start_col=1, headers=corr_headers)

        # === ABA 4: BLUEPRINT DE PRODUÇÃO ===
        log_progress("Criando Blueprint de Produção...")
        ws_blueprint = wb.create_sheet('Blueprint de Produção')

        bp_header = ws_blueprint.cell(row=1, column=1)
        bp_header.value = 'BLUEPRINT ESTRATÉGICO DE PRODUÇÃO'
        bp_header.font = Font(bold=True, size=16, color='FFFFFF')
        bp_header.fill = PatternFill(start_color='1F4E79', end_color='1F4E79', fill_type='solid')
        bp_header.alignment = Alignment(horizontal='center')

        # Receita de sucesso baseada nos top performers
        top_performers = df_consolidado[df_consolidado['overall_score'] > df_consolidado['overall_score'].quantile(0.7)]

        blueprint_data = [
            ['DURAÇÃO IDEAL', f"{top_performers['duracao_segundos'].mean():.1f} segundos (±{top_performers['duracao_segundos'].std():.1f}s)"],
            ['RITMO DE EDIÇÃO', f"{top_performers['cortes_por_segundo'].mean():.1f} cortes por segundo"],
            ['FORMATO VENCEDOR', top_performers['formato_detectado'].mode()[0] if not top_performers.empty else 'N/A'],
            ['COMPLEXIDADE VISUAL', f"Nível {top_performers['complexidade_visual_media'].mean():.0f} (escala de estímulo)"],
            ['BPM RECOMENDADO', f"{top_performers['bpm_audio'].mean():.0f} BPM" if top_performers['bpm_audio'].notna().any() else 'N/A'],
            ['DENSIDADE DE TEXTO', f"{top_performers['densidade_texto'].mean():.1f} textos por segundo"],
        ]

        bp_sub_header = ws_blueprint.cell(row=3, column=1)
        bp_sub_header.value = 'FÓRMULA DE SUCESSO BASEADA EM DADOS'
        bp_sub_header.font = Font(bold=True, size=12)

        add_data_to_sheet(ws_blueprint, blueprint_data, start_row=4, start_col=1)

        # === ABA 5: RECOMENDAÇÕES ESTRATÉGICAS ===
        log_progress("Criando Recomendações Estratégicas...")
        ws_recomendacoes = wb.create_sheet('Recomendações Estratégicas')

        rec_header = ws_recomendacoes.cell(row=1, column=1)
        rec_header.value = 'RECOMENDAÇÕES ESTRATÉGICAS BASEADAS EM IA'
        rec_header.font = Font(bold=True, size=16, color='FFFFFF')
        rec_header.fill = PatternFill(start_color='C5504B', end_color='C5504B', fill_type='solid')
        rec_header.alignment = Alignment(horizontal='center')

        # Recomendações inteligentes baseadas nos dados
        recommendations = []

        # Análise de duração
        if df_consolidado['duracao_segundos'].mean() > 60:
            recommendations.append(['DURAÇÃO', 'REDUZA DURAÇÃO', 'Seus vídeos estão longos demais. Vídeos de 15-30s têm melhor performance.', 'ALTA'])
        elif df_consolidado['duracao_segundos'].mean() < 15:
            recommendations.append(['DURAÇÃO', 'AUMENTE DURAÇÃO', 'Vídeos muito curtos podem não transmitir valor suficiente.', 'MÉDIA'])

        # Análise de ritmo
        avg_cuts_per_sec = df_consolidado['cortes_por_segundo'].mean()
        if avg_cuts_per_sec < 5:
            recommendations.append(['EDIÇÃO', 'ACELERE O RITMO', 'Aumente o número de cortes para manter atenção. Meta: 8-12 cortes/segundo.', 'ALTA'])
        elif avg_cuts_per_sec > 20:
            recommendations.append(['EDIÇÃO', 'DIMINUA CORTES', 'Muitos cortes podem causar fadiga visual. Encontre o equilíbrio.', 'MÉDIA'])

        # Análise de formato
        formato_dominante = df_consolidado['formato_detectado'].mode()[0] if not df_consolidado['formato_detectado'].empty else 'N/A'
        if 'horizontal' in formato_dominante.lower():
            recommendations.append(['FORMATO', 'FOQUE EM VERTICAL', 'Formato vertical (9:16) tem melhor performance em redes sociais.', 'ALTA'])

        # Análise de texto
        if df_consolidado['densidade_texto'].mean() < 1:
            recommendations.append(['CONTEÚDO', 'ADICIONE MAIS TEXTO', 'Textos na tela aumentam retenção e acessibilidade.', 'MÉDIA'])

        rec_headers = ['Categoria', 'Ação', 'Justificativa', 'Prioridade']
        add_data_to_sheet(ws_recomendacoes, recommendations, start_row=3, start_col=1, headers=rec_headers)

        # Salvar arquivo
        log_progress("Salvando dashboard...")
        wb.save(output_path)

        log_progress("DASHBOARD MASTER EXECUTIVO CRIADO COM SUCESSO!")
        log_progress(f"Arquivo salvo em: {output_path}")
        log_progress(f"{len(df_consolidado)} vídeos analisados")
        log_progress(f"{len(insights)} insights estratégicos gerados")
        log_progress(f"{len(recommendations)} recomendações criadas")

        return True

    except Exception as e:
        log_progress(f"ERRO CRÍTICO: {e}")
        log_progress("Verifique os arquivos de entrada e tente novamente")
        return False

def main():
    """Função principal de execução"""
    log_progress("INICIANDO SISTEMA DE DASHBOARD INTELIGENTE")

    # Configurar caminhos
    BASE_PATH = "/content/drive/MyDrive/Videos Dona Done/_engenharia_reversa"
    CSV_PATH = os.path.join(BASE_PATH, "dashboard", "dados_consolidados.csv")
    JSON_PATH = os.path.join(BASE_PATH, "dashboard", "dados_detalhados.json")
    OUTPUT_PATH = os.path.join(BASE_PATH, "dashboard", "DASHBOARD_MASTER_EXECUTIVO_INTELIGENTE.xlsx")

    # Verificar se arquivos existem
    if not os.path.exists(CSV_PATH):
        log_progress(f"ERRO: Arquivo CSV não encontrado: {CSV_PATH}")
        return False

    if not os.path.exists(JSON_PATH):
        log_progress(f"ERRO: Arquivo JSON não encontrado: {JSON_PATH}")
        return False

    # Executar criação do dashboard
    success = create_enhanced_dashboard_master(CSV_PATH, JSON_PATH, OUTPUT_PATH)

    if success:
        log_progress("PROCESSO CONCLUÍDO COM SUCESSO!")
        log_progress("Dashboard inteligente pronto para uso estratégico")
    else:
        log_progress("PROCESSO FALHOU - Verifique os logs acima")

    return success

if __name__ == "__main__":
    main()

[23:42:03] INICIANDO SISTEMA DE DASHBOARD INTELIGENTE
[23:42:03] INICIANDO CRIAÇÃO DO DASHBOARD MASTER EXECUTIVO INTELIGENTE
[23:42:03] Carregando dados consolidados...
[23:42:03] Dados carregados: 5 vídeos encontrados
[23:42:03] Processando inteligência artificial dos dados...
[23:42:03] Calculando scores de performance...
[23:42:03] Gerando insights estratégicos...
[23:42:03] Criando estrutura do dashboard...
[23:42:03] Criando Executive Summary...
[23:42:03] Criando Análise de Performance...
[23:42:03] Criando Inteligência Técnica...
[23:42:03] Criando Blueprint de Produção...
[23:42:03] Criando Recomendações Estratégicas...
[23:42:03] Salvando dashboard...
[23:42:03] DASHBOARD MASTER EXECUTIVO CRIADO COM SUCESSO!
[23:42:03] Arquivo salvo em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/dashboard/DASHBOARD_MASTER_EXECUTIVO_INTELIGENTE.xlsx
[23:42:03] 5 vídeos analisados
[23:42:03] 6 insights estratégicos gerados
[23:42:03] 2 recomendações criadas
[23:42:03] PROCESSO C