<a href="https://colab.research.google.com/github/auth-create/DDfiles/blob/main/engenharia_reversa_videos_Final.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# SISTEMA MODULAR DE ENGENHARIA REVERSA DE VÍDEOS - VERSÃO FINAL OTIMIZADA

Este notebook foi aprimorado para oferecer uma experiência mais intuitiva, organizada e robusta para a engenharia reversa de vídeos. Cada etapa é modular, com validações de pré-requisitos e feedback em tempo real para guiá-lo(a) durante o processo.

## COMO USAR:
1.  **Execute as células em ordem, de cima para baixo.** Cada célula foi projetada para ser executada sequencialmente.
2.  **Atenção aos feedbacks:** Mensagens claras indicarão o sucesso de cada etapa, possíveis erros e qual a **PRÓXIMA CÉLULA** a ser executada.
3.  **Corrija e re-execute:** Se um erro for detectado, uma mensagem explicativa será exibida. Corrija o problema (geralmente um caminho incorreto ou dependência ausente) e re-execute a célula que falhou.
4.  **Progresso Salvo:** O sistema salva automaticamente o progresso e os dados gerados em cada etapa, permitindo que você retome de onde parou.

## ESTRUTURA DO PROCESSO (Layers e Sublayers):
Este sistema é organizado em camadas lógicas para facilitar o entendimento e a execução:

### LAYER 1: CONFIGURAÇÃO E PREPARAÇÃO
*   **CÉLULA 1.1: SETUP INICIAL E INSTALAÇÃO DE DEPENDÊNCIAS**
*   **CÉLULA 1.2: CONFIGURAÇÃO INICIAL E VALIDAÇÃO DA PASTA DE TRABALHO**

### LAYER 2: DESCOBERTA E EXTRAÇÃO DE DADOS BRUTOS
*   **CÉLULA 2.1: DESCOBERTA E CATALOGAÇÃO DE VÍDEOS**
*   **CÉLULA 2.2: EXTRAÇÃO DE METADADOS DOS VÍDEOS**
*   **CÉLULA 2.3: DECOMPOSIÇÃO DE VÍDEOS (FRAMES, ÁUDIO, TEXTO)**

### LAYER 3: ANÁLISE E PROCESSAMENTO DE DADOS
*   **CÉLULA 3.1: ANÁLISE DE PADRÕES (TEMPORAIS, VISUAIS, TEXTO, ÁUDIO)**
*   **CÉLULA 3.2: ANÁLISE PSICOLÓGICA E GATILHOS DE ENGAJAMENTO**

### LAYER 4: GERAÇÃO DE RELATÓRIOS E BLUEPRINT ESTRATÉGICO
*   **CÉLULA 4.1: GERAÇÃO DE RELATÓRIOS HUMANIZADOS (ÁUDIO, VISUAL, TEXTO, PSICOLÓGICO)**
*   **CÉLULA 4.2: GERAÇÃO DO BLUEPRINT FINAL E DASHBOARD**

---

*Lembre-se: Este sistema foi projetado para ser executado no Google Colab. Certifique-se de que seu ambiente está configurado corretamente.*

In [None]:
# ============================================================================
# LAYER 1: CONFIGURAÇÃO E PREPARAÇÃO
# ============================================================================

# ============================================================================
# CÉLULA 1.1: SETUP INICIAL E INSTALAÇÃO DE DEPENDÊNCIAS
# ============================================================================

# Instalar dependências necessárias
!pip install -q moviepy librosa pytesseract opencv-python pandas openpyxl matplotlib seaborn pillow SpeechRecognition pydub fpdf
!apt-get update -qq && apt-get install -y -qq tesseract-ocr tesseract-ocr-por ffmpeg

# Imports necessários
import os
import json
import pandas as pd
from datetime import datetime
import logging
import cv2
import numpy as np
import pytesseract
import librosa
from moviepy.editor import VideoFileClip
import matplotlib.pyplot as plt
from PIL import Image
from collections import Counter
import seaborn as sns
from google.colab import drive
import warnings
warnings.filterwarnings('ignore')
import speech_recognition as sr # Adicionado import para SpeechRecognition
# Montar Google Drive
try:
    drive.mount('/content/drive')
    print("✅ Google Drive montado com sucesso!")
except Exception as e:
    print(f"❌ ERRO ao montar Google Drive: {e}. Por favor, verifique sua conexão ou permissões.")

print(
"✅ SETUP INICIAL CONCLUÍDO!")
print("Todas as dependências foram instaladas e o Google Drive foi montado.")
print("➡️ PRÓXIMA CÉLULA: 1.2 - CONFIGURAÇÃO INICIAL E VALIDAÇÃO DA PASTA DE TRABALHO")

^C
W: Skipping acquire of configured file 'main/source/Sources' as repository 'https://r2u.stat.illinois.edu/ubuntu jammy InRelease' does not seem to provide it (sources.list entry misspelt?)
Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
✅ Google Drive montado com sucesso!
✅ SETUP INICIAL CONCLUÍDO!
Todas as dependências foram instaladas e o Google Drive foi montado.
➡️ PRÓXIMA CÉLULA: 1.2 - CONFIGURAÇÃO INICIAL E VALIDAÇÃO DA PASTA DE TRABALHO


In [None]:
# ============================================================================
# CÉLULA 1.2: CONFIGURAÇÃO INICIAL E VALIDAÇÃO DA PASTA DE TRABALHO
# ============================================================================

# ⚠️ **ATENÇÃO:** CONFIGURE SEU CAMINHO AQUI!
# Substitua o caminho abaixo pela pasta onde seus vídeos estão localizados no Google Drive.
# Exemplo: "/content/drive/MyDrive/Meus Videos de Marketing"
CAMINHO_PASTA_VIDEOS = "/content/drive/MyDrive/Videos Dona Done" # ⬅️ **ALTERE AQUI**

class ConfiguradorProjeto:
    def __init__(self, caminho_pasta):
        self.pasta_videos = self._validar_caminho(caminho_pasta)
        self.pasta_trabalho = os.path.join(self.pasta_videos, "_engenharia_reversa")
        self._criar_estrutura()
        self._configurar_logging()

    def _validar_caminho(self, caminho):
        if caminho == "/content/drive/MyDrive/Videos Dona Done" and not os.path.exists(caminho):
            raise ValueError("❌ ERRO: Você precisa alterar CAMINHO_PASTA_VIDEOS com o caminho real da sua pasta de vídeos no Google Drive. O caminho padrão não foi encontrado.")

        if not os.path.exists(caminho):
            raise ValueError(f"❌ ERRO: Pasta não encontrada: {caminho}. Por favor, verifique se o caminho está correto e se o Google Drive está montado.")

        return caminho

    def _criar_estrutura(self):
        # Estrutura de pastas conforme o anexo e requisitos do usuário
        estrutura = [
            "config", "logs", "dados", "frames_extraidos",
            "analise_texto", "analise_audio", "capturas",
            "blueprint", "temp", "dashboard", "analise_psicologica", "analise_visual"
        ]

        os.makedirs(self.pasta_trabalho, exist_ok=True)
        for pasta in estrutura:
            os.makedirs(os.path.join(self.pasta_trabalho, pasta), exist_ok=True)

        # Criar subpastas para frames_extraidos (ex: vid_001_Nome_Do_Video/)
        # Esta lógica será implementada na célula de decomposição de vídeos (CÉLULA 2.3)

    def _configurar_logging(self):
        log_file = os.path.join(self.pasta_trabalho, "logs", f"sistema_{datetime.now().strftime('%Y%m%d_%H%M%S')}.log")
        logging.basicConfig(
            level=logging.INFO,
            format="%(asctime)s - %(levelname)s - %(message)s",
            handlers=[logging.FileHandler(log_file, encoding='utf-8')]
        )
        self.logger = logging.getLogger(__name__)

    def salvar_configuracao(self):
        config = {
            "projeto": {
                "pasta_videos": self.pasta_videos,
                "pasta_trabalho": self.pasta_trabalho,
                "criado_em": datetime.now().isoformat(),
                "versao": "modular_v2.0_otimizado"
            },
            "status_etapas": {
                "configuracao": True,
                "descoberta_videos": False,
                "metadados": False,
                "decomposicao": False,
                "analise_padroes": False,
                "analise_psicologica": False,
                "relatorios_humanizados": False,
                "blueprint": False
            }
        }

        config_path = os.path.join(self.pasta_trabalho, "config", "config.json")
        with open(config_path, "w", encoding='utf-8') as f:
            json.dump(config, f, indent=2, ensure_ascii=False)

        return config_path

# Executar configuração
try:
    configurador = ConfiguradorProjeto(CAMINHO_PASTA_VIDEOS)
    config_path = configurador.salvar_configuracao()

    print("""
✅ CONFIGURAÇÃO CONCLUÍDA!""")
    print(f"Pasta de trabalho criada: {configurador.pasta_trabalho}")
    print(f"Configuração salva: {config_path}")
    print("""
➡️ PRÓXIMA CÉLULA: 2.1 - DESCOBERTA E CATALOGAÇÃO DE VÍDEOS""")

    # Salvar variáveis globais para próximas células
    global PASTA_VIDEOS, PASTA_TRABALHO
    PASTA_VIDEOS = configurador.pasta_videos
    PASTA_TRABALHO = configurador.pasta_trabalho

except Exception as e:
    print(f"""
❌ ERRO NA CONFIGURAÇÃO: {e}""")
    print("Por favor, corrija o erro acima antes de prosseguir.")


✅ CONFIGURAÇÃO CONCLUÍDA!
Pasta de trabalho criada: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa
Configuração salva: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/config/config.json

➡️ PRÓXIMA CÉLULA: 2.1 - DESCOBERTA E CATALOGAÇÃO DE VÍDEOS


In [None]:
# ============================================================================
# LAYER 2: DESCOBERTA E EXTRAÇÃO DE DADOS BRUTOS
# ============================================================================

# ============================================================================
# CÉLULA 2.1: DESCOBERTA E CATALOGAÇÃO DE VÍDEOS
# ============================================================================

def verificar_prerequisito_etapa(etapa_anterior):
    """Verifica se a etapa anterior foi executada com sucesso"""
    try:
        if not "PASTA_TRABALHO" in globals():
            raise Exception("Variáveis globais de configuração não encontradas. Execute a CÉLULA 1.2 primeiro.")

        config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
        if not os.path.exists(config_path):
            raise Exception("Arquivo de configuração não encontrado. Execute a CÉLULA 1.2 primeiro.")

        with open(config_path, "r", encoding="utf-8") as f:
            config = json.load(f)

        if not config["status_etapas"][etapa_anterior]:
            raise Exception(f"A etapa \"{etapa_anterior}\" não foi concluída. Execute a célula correspondente primeiro.")

        return True, config
    except Exception as e:
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: {e}")
        return False, None

def descobrir_catalogar_videos():
    """Descobre e cataloga todos os vídeos na pasta"""
    formatos_aceitos = [".mp4", ".mov", ".avi", ".mkv", ".webm", ".m4v"]
    videos_encontrados = []

    print(f"🔍 Iniciando descoberta de vídeos na pasta: {PASTA_VIDEOS}")

    for root, dirs, files in os.walk(PASTA_VIDEOS):
        if "_engenharia_reversa" in root:
            continue # Ignorar a pasta de trabalho do sistema

        for file in files:
            if any(file.lower().endswith(fmt) for fmt in formatos_aceitos):
                video_path = os.path.join(root, file)

                try:
                    stat_info = os.stat(video_path)
                    # Gerar ID baseado no nome do arquivo para melhor rastreamento
                    video_name_clean = os.path.splitext(file)[0].replace(" ", "_").replace(".", "")
                    video_id = f"vid_{video_name_clean}"

                    video_info = {
                        "id": video_id,
                        "nome_arquivo": file,
                        "caminho_completo": video_path,
                        "caminho_relativo": os.path.relpath(video_path, PASTA_VIDEOS),
                        "tamanho_mb": round(stat_info.st_size / (1024*1024), 2),
                        "data_modificacao": datetime.fromtimestamp(stat_info.st_mtime).isoformat(),
                        "extensao": os.path.splitext(file)[1].lower(),
                        "status": "descoberto"
                    }

                    videos_encontrados.append(video_info)
                    print(f"  ✅ Encontrado: {file}")

                except Exception as e:
                    print(f"  ❌ Erro ao processar {file}: {e}")
                    continue

    return videos_encontrados

def salvar_lista_videos(videos):
    """Salva lista de vídeos encontrados"""
    videos_path = os.path.join(PASTA_TRABALHO, "dados", "videos_descobertos.json")
    with open(videos_path, "w", encoding="utf-8") as f:
        json.dump(videos, f, indent=2, ensure_ascii=False)

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    config["status_etapas"]["descoberta_videos"] = True
    config["total_videos_encontrados"] = len(videos)

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    return videos_path

# Executar descoberta
prerequisito_ok, _ = verificar_prerequisito_etapa("configuracao")

if prerequisito_ok:
    try:
        videos_encontrados = descobrir_catalogar_videos()

        if not videos_encontrados:
            print("""
❌ NENHUM VÍDEO ENCONTRADO!""")
            print(f"Verifique se há vídeos na pasta configurada: {PASTA_VIDEOS}")
        else:
            videos_path = salvar_lista_videos(videos_encontrados)

            print("""
✅ DESCOBERTA DE VÍDEOS CONCLUÍDA!""")
            print(f"Total de vídeos encontrados: {len(videos_encontrados)}")
            print(f"Lista de vídeos salva em: {videos_path}")

            # Mostrar resumo
            extensoes = Counter([v["extensao"] for v in videos_encontrados])
            print(f"Formatos encontrados: {dict(extensoes)}")
            print("""
➡️ PRÓXIMA CÉLULA: 2.2 - EXTRAÇÃO DE METADADOS DOS VÍDEOS""")

    except Exception as e:
        print(f"""
❌ ERRO NA DESCOBERTA DE VÍDEOS: {e}""")
        print("Por favor, corrija o erro acima antes de prosseguir.")

🔍 Iniciando descoberta de vídeos na pasta: /content/drive/MyDrive/Videos Dona Done
  ✅ Encontrado: ate quando voce vai ficar culpando os outros.mp4
  ✅ Encontrado: coloque metas em sua vida e se surpreenda.mp4
  ✅ Encontrado: a importancia de ser rico antes de ter.mp4

✅ DESCOBERTA DE VÍDEOS CONCLUÍDA!
Total de vídeos encontrados: 3
Lista de vídeos salva em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/dados/videos_descobertos.json
Formatos encontrados: {'.mp4': 3}

➡️ PRÓXIMA CÉLULA: 2.2 - EXTRAÇÃO DE METADADOS DOS VÍDEOS


In [None]:
# ============================================================================
# CÉLULA 2.2: EXTRAÇÃO DE METADADOS DOS VÍDEOS
# ============================================================================

def extrair_metadados_video(video_info):
    """Extrai metadados técnicos de um vídeo"""
    video_path = video_info["caminho_completo"]
    video_id = video_info["id"]

    print(f"  ⚙️ Extraindo metadados para: {video_info["nome_arquivo"]}")

    # Análise com OpenCV
    cap = cv2.VideoCapture(video_path)
    if not cap.isOpened():
        raise Exception("Não foi possível abrir o vídeo. Verifique o caminho ou a integridade do arquivo.")

    fps = cap.get(cv2.CAP_PROP_FPS)
    frame_count = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
    largura = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    altura = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    duracao = frame_count / fps if fps > 0 else 0

    # Capturar primeiro frame
    ret, primeiro_frame = cap.read()
    cap.release()

    # Análise de áudio
    try:
        clip = VideoFileClip(video_path)
        tem_audio = clip.audio is not None
        clip.close()
    except Exception as e:
        print(f"    ⚠️ Aviso: Não foi possível analisar áudio para {video_info["nome_arquivo"]}: {e}")
        tem_audio = False

    # Análise do primeiro frame
    analise_frame = {}
    if ret:
        # Salvar primeiro frame na pasta 'capturas'
        capturas_dir = os.path.join(PASTA_TRABALHO, "capturas")
        frame_path = os.path.join(capturas_dir, f"{video_id}_primeiro_frame.jpg")
        cv2.imwrite(frame_path, primeiro_frame)

        # Análises do frame
        gray = cv2.cvtColor(primeiro_frame, cv2.COLOR_BGR2GRAY)
        complexidade = cv2.Laplacian(gray, cv2.CV_64F).var()
        brilho = np.mean(gray)

        analise_frame = {
            "path": frame_path,
            "complexidade_visual": float(complexidade),
            "brilho_medio": float(brilho),
            "tem_muito_texto": bool(complexidade > 500),
            "e_escuro": bool(brilho < 100),
            "e_claro": bool(brilho > 200)
        }

    # Detectar formato
    ratio = largura / altura if altura > 0 else 0
    if 0.5 <= ratio <= 0.6:
        formato = "vertical_9_16" if altura > largura * 1.5 else "vertical_4_5"
    elif 0.8 <= ratio <= 1.2:
        formato = "quadrado_1_1"
    elif ratio >= 1.3:
        formato = "horizontal_16_9"
    else:
        formato = "personalizado"

    # Compilar metadados - converter todos os valores para tipos básicos Python
    metadados = {
        **video_info,
        "duracao_segundos": float(duracao),
        "fps": float(fps),
        "largura": int(largura),
        "altura": int(altura),
        "resolucao": f"{largura}x{altura}",
        "aspect_ratio": float(ratio),
        "total_frames": int(frame_count),
        "tem_audio": bool(tem_audio),
        "formato_detectado": str(formato),
        "primeiro_frame": analise_frame,
        "data_analise": datetime.now().isoformat()
    }

    return metadados

def processar_metadados_todos_videos():
    """Processa metadados de todos os vídeos"""
    # Carregar lista de vídeos
    videos_path = os.path.join(PASTA_TRABALHO, "dados", "videos_descobertos.json")
    with open(videos_path, "r", encoding="utf-8") as f:
        videos_lista = json.load(f)

    metadados_completos = []
    sucessos = 0

    print(f"Processando metadados de {len(videos_lista)} vídeos...")

    for i, video in enumerate(videos_lista, 1):
        print(f"[{i}/{len(videos_lista)}] Analisando {video["nome_arquivo"]}")

        try:
            metadados = extrair_metadados_video(video)
            metadados["status"] = "metadados_extraidos"
            metadados_completos.append(metadados)
            sucessos += 1
            print(f"  ✅ Metadados extraídos: {metadados["duracao_segundos"]:.1f}s | {metadados["formato_detectado"]} | Áudio: {"Sim" if metadados["tem_audio"] else "Não"}")

        except Exception as e:
            print(f"  ❌ ERRO ao extrair metadados para {video["nome_arquivo"]}: {e}")
            video["status"] = "erro_metadados"
            metadados_completos.append(video) # Adiciona o vídeo com status de erro

    # Salvar metadados completos
    metadados_json_path = os.path.join(PASTA_TRABALHO, "dados", "metadados_completos.json")
    with open(metadados_json_path, "w", encoding="utf-8") as f:
        json.dump(metadados_completos, f, indent=2, ensure_ascii=False)

    # Salvar em Excel
    df_metadados = pd.DataFrame(metadados_completos)
    metadados_excel_path = os.path.join(PASTA_TRABALHO, "dados", "metadados_videos.xlsx")
    df_metadados.to_excel(metadados_excel_path, index=False, engine='openpyxl')

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    config["status_etapas"]["metadados"] = True
    config["total_videos_metadados"] = sucessos

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    print(f"\n💾 Metadados completos salvos em: {metadados_json_path}")
    print(f"💾 Metadados em Excel salvos em: {metadados_excel_path}")

    print("\n✅ EXTRAÇÃO DE METADADOS CONCLUÍDA!")
    print(f"Total de vídeos com metadados extraídos: {sucessos}")

    # Mostrar resumo
    if not df_metadados.empty:
        print("\n📊 Resumo dos Metadados:")
        print(f"  - Formatos detectados: {dict(df_metadados['formato_detectado'].value_counts())}")
        print(f"  - Duração média dos vídeos: {df_metadados['duracao_segundos'].mean():.2f}s")
        print(f"  - Vídeos com áudio: {df_metadados['tem_audio'].sum()}")

    print("\n➡️ PRÓXIMA CÉLULA: 2.3 - DECOMPOSIÇÃO DE VÍDEOS (FRAMES, ÁUDIO, TEXTO)")

# Executar extração de metadados
prerequisito_ok, _ = verificar_prerequisito_etapa("descoberta_videos")

if prerequisito_ok:
    try:
        processar_metadados_todos_videos()
    except Exception as e:
        print(f"\n❌ ERRO NA EXTRAÇÃO DE METADADOS: {e}")
        print("Por favor, corrija o erro acima antes de prosseguir.")

Processando metadados de 3 vídeos...
[1/3] Analisando ate quando voce vai ficar culpando os outros.mp4
  ⚙️ Extraindo metadados para: ate quando voce vai ficar culpando os outros.mp4
  ✅ Metadados extraídos: 18.6s | vertical_9_16 | Áudio: Sim
[2/3] Analisando coloque metas em sua vida e se surpreenda.mp4
  ⚙️ Extraindo metadados para: coloque metas em sua vida e se surpreenda.mp4
  ✅ Metadados extraídos: 15.8s | vertical_9_16 | Áudio: Sim
[3/3] Analisando a importancia de ser rico antes de ter.mp4
  ⚙️ Extraindo metadados para: a importancia de ser rico antes de ter.mp4
  ✅ Metadados extraídos: 19.0s | vertical_9_16 | Áudio: Sim

💾 Metadados completos salvos em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/dados/metadados_completos.json
💾 Metadados em Excel salvos em: /content/drive/MyDrive/Videos Dona Done/_engenharia_reversa/dados/metadados_videos.xlsx

✅ EXTRAÇÃO DE METADADOS CONCLUÍDA!
Total de vídeos com metadados extraídos: 3

📊 Resumo dos Metadados:
  - Formatos d

In [None]:
# ============================================================================
# CÉLULA 2.3: DECOMPOSIÇÃO DE VÍDEOS (FRAMES, ÁUDIO, TEXTO)
# ============================================================================

def decompor_video(video_info):
    """Decompõe um vídeo em frames, áudio e texto (OCR e transcrição)"""
    video_path = video_info["caminho_completo"]
    video_id = video_info["id"]
    pasta_video_frames = os.path.join(PASTA_TRABALHO, "frames_extraidos", video_id)
    os.makedirs(pasta_video_frames, exist_ok=True)

    print(f"  ⚙️ Decompondo vídeo: {video_info["nome_arquivo"]}")

    decomposicao_data = {
        "video_id": video_id,
        "frames_extraidos": [],
        "textos_ocr": [],
        "audio_transcrito": "",
        "audio_analise": {}
    }

    # Extração de Frames e OCR
    try:
        cap = cv2.VideoCapture(video_path)
        fps = cap.get(cv2.CAP_PROP_FPS)
        frame_count = 0
        frame_interval = int(fps) # 1 frame por segundo

        while True:
            ret, frame = cap.read()
            if not ret:
                break

            if frame_count % frame_interval == 0:
                frame_time_sec = frame_count / fps
                frame_filename = os.path.join(pasta_video_frames, f"frame_{int(frame_time_sec):06d}.jpg")
                cv2.imwrite(frame_filename, frame)
                decomposicao_data["frames_extraidos"] .append({
                    "path": frame_filename,
                    "timestamp_sec": frame_time_sec
                })

                # OCR
                try:
                    text = pytesseract.image_to_string(Image.fromarray(frame), lang="por")
                    if text.strip():
                        decomposicao_data["textos_ocr"] .append({
                            "timestamp_sec": frame_time_sec,
                            "text": text.strip()
                        })
                except Exception as ocr_e:
                    print(f"    ⚠️ Aviso: Erro no OCR para frame {frame_time_sec}s: {ocr_e}")

            frame_count += 1
        cap.release()
        print(f"    ✅ {len(decomposicao_data["frames_extraidos"])} frames extraídos para {video_info["nome_arquivo"]}")
        print(f"    ✅ {len(decomposicao_data["textos_ocr"])} textos encontrados via OCR para {video_info["nome_arquivo"]}")

    except Exception as e:
        print(f"    ❌ Erro na extração de frames/OCR para {video_info["nome_arquivo"]}: {e}")

    # Extração e Transcrição de Áudio
    audio_path = os.path.join(PASTA_TRABALHO, "temp", f"{video_id}.wav")
    try:
        video_clip = VideoFileClip(video_path)
        if video_clip.audio:
            video_clip.audio.write_audiofile(audio_path, verbose=False, logger=None)
            print(f"    ✅ Áudio extraído para {video_info["nome_arquivo"]}")

            # Transcrição
            r = sr.Recognizer()
            with sr.AudioFile(audio_path) as source:
                audio_listened = r.record(source)
                try:
                    text = r.recognize_google(audio_listened, language="pt-BR")
                    decomposicao_data["audio_transcrito"] = text
                    print(f"    ✅ Áudio transcrito para {video_info["nome_arquivo"]}")
                except sr.UnknownValueError:
                    print(f"    ⚠️ Aviso: Não foi possível transcrever o áudio para {video_info["nome_arquivo"]}. Fala ininteligível.")
                except sr.RequestError as req_e:
                    print(f"    ⚠️ Aviso: Erro no serviço de transcrição para {video_info["nome_arquivo"]}: {req_e}")

            # Análise de Áudio (Librosa)
            y, sr_audio = librosa.load(audio_path)
            tempo, beat_frames = librosa.beat.beat_track(y=y, sr=sr_audio)
            decomposicao_data["audio_analise"] = {
                "bpm": float(tempo),
                "duracao_audio_segundos": float(librosa.get_duration(y=y, sr=sr_audio))
            }

        else:
            print(f"    ⚠️ Aviso: Vídeo {video_info["nome_arquivo"]} não possui trilha de áudio.")
        video_clip.close()

    except Exception as e:
        print(f"    ❌ Erro na extração/transcrição de áudio para {video_info["nome_arquivo"]}: {e}")

    # Detecção de Cortes (Scene Change Detection)
    try:
        cap = cv2.VideoCapture(video_path)
        if not cap.isOpened():
            raise Exception("Não foi possível abrir o vídeo para detecção de cortes.")

        prev_frame = None
        cuts = []
        frame_idx = 0
        while True:
            ret, frame = cap.read()
            if not ret:
                break

            if prev_frame is not None:
                diff = cv2.absdiff(cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY), cv2.cvtColor(prev_frame, cv2.COLOR_BGR2GRAY))
                non_zero_count = np.count_nonzero(diff)
                if non_zero_count > (frame.shape[0] * frame.shape[1] * 0.3): # Limiar de 30% de mudança
                    cuts.append(frame_idx / fps)
            prev_frame = frame
            frame_idx += 1
        cap.release()
        decomposicao_data["cortes_detectados_segundos"] = cuts
        print(f"    ✅ {len(cuts)} cortes detectados para {video_info["nome_arquivo"]}")

    except Exception as e:
        print(f"    ❌ Erro na detecção de cortes para {video_info["nome_arquivo"]}: {e}")

    return decomposicao_data

def processar_decomposicao_todos_videos():
    """Processa a decomposição de todos os vídeos"""
    prerequisito_ok, config = verificar_prerequisito_etapa("metadados")
    if not prerequisito_ok:
        return

    # Carregar metadados completos
    metadados_path = os.path.join(PASTA_TRABALHO, "dados", "metadados_completos.json")
    with open(metadados_path, "r", encoding="utf-8") as f:
        videos_com_metadados = json.load(f)

    decomposicoes_completas = []
    sucessos = 0

    print("""
Iniciando decomposição para {} vídeos...""".format(len(videos_com_metadados)))

    for i, video in enumerate(videos_com_metadados, 1):
        if video.get("status") == "metadados_extraidos":
            print(f"[{i}/{len(videos_com_metadados)}] Decompondo {video["nome_arquivo"]}")
            try:
                decomposicao = decompor_video(video)
                decomposicao["status"] = "decomposto"
                decomposicoes_completas.append(decomposicao)
                sucessos += 1
                print(f"  ✅ Decomposição concluída para {video["nome_arquivo"]}")
            except Exception as e:
                print(f"  ❌ ERRO na decomposição para {video["nome_arquivo"]}: {e}")
                decomposicoes_completas.append({"video_id": video["id"], "status": "erro_decomposicao", "erro": str(e)})
        else:
            print(f"[{i}/{len(videos_com_metadados)}] Pulando {video.get("nome_arquivo", video["id"])} - Status: {video.get("status", "N/A")}")
            decomposicoes_completas.append({"video_id": video["id"], "status": video.get("status", "N/A"), "erro": "Pulado devido a erro anterior"})

    # Salvar decomposições completas
    decomposicao_json_path = os.path.join(PASTA_TRABALHO, "dados", "decomposicao_completa.json")
    with open(decomposicao_json_path, "w", encoding="utf-8") as f:
        json.dump(decomposicoes_completas, f, indent=2, ensure_ascii=False)

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    config["status_etapas"]["decomposicao"] = True
    config["total_videos_decompostos"] = sucessos

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    print(f"""
💾 Dados de decomposição salvos em: {decomposicao_json_path}""")

    print("""
✅ DECOMPOSIÇÃO DE VÍDEOS CONCLUÍDA!""")
    print(f"Total de vídeos decompostos com sucesso: {sucessos}")

    if sucessos == 0:
        print("❌ NENHUM VÍDEO FOI DECOMPOSTO COM SUCESSO. Verifique as etapas anteriores.")
    print("""
➡️ PRÓXIMA CÉLULA: 3.1 - ANÁLISE DE PADRÕES (TEMPORAIS, VISUAIS, TEXTO, ÁUDIO)""")

# Executar decomposição
try:
    processar_decomposicao_todos_videos()
except Exception as e:
    print(f"""
❌ ERRO GERAL NA DECOMPOSIÇÃO DE VÍDEOS: {e}""")
    print("Por favor, corrija o erro acima antes de prosseguir.")


Iniciando decomposição para 3 vídeos...
[1/3] Decompondo ate quando voce vai ficar culpando os outros.mp4
  ⚙️ Decompondo vídeo: ate quando voce vai ficar culpando os outros.mp4
    ✅ 19 frames extraídos para ate quando voce vai ficar culpando os outros.mp4
    ✅ 5 textos encontrados via OCR para ate quando voce vai ficar culpando os outros.mp4
    ✅ Áudio extraído para ate quando voce vai ficar culpando os outros.mp4


KeyboardInterrupt: 

melhorar os cortes aqui ( otimizar ele esta detectando muitos cortes. corrigir possivel erro de Fala ininteligível

In [None]:
# ============================================================================
# CÉLULA 2.4: ANÁLISE DE ÁUDIO REFINADA (SUBLAYER DA LAYER 2)
# ============================================================================

# ============================================================================
# CÉLULA 2.4: ANÁLISE DE ÁUDIO REFINADA (SUBLAYER DA LAYER 2)
# ============================================================================

import librosa
import numpy as np
import matplotlib.pyplot as plt
import scipy.signal
from scipy.stats import variation
import seaborn as sns
from collections import Counter
import warnings
warnings.filterwarnings('ignore')

def converter_para_json_serializable(obj):
    """Converte tipos NumPy para tipos Python nativos para serialização JSON"""
    if isinstance(obj, np.integer):
        return int(obj)
    elif isinstance(obj, np.floating):
        return float(obj)
    elif isinstance(obj, np.ndarray):
        return [converter_para_json_serializable(x) for x in obj.tolist()]
    elif isinstance(obj, list):
        return [converter_para_json_serializable(x) for x in obj]
    elif isinstance(obj, dict):
        return {k: converter_para_json_serializable(v) for k, v in obj.items()}
    else:
        return obj

def verificar_prerequisito_audio_refinado():
    """Verifica se a etapa de decomposição foi concluída"""
    try:
        if not "PASTA_TRABALHO" in globals():
            raise Exception("Variáveis globais de configuração não encontradas. Execute a CÉLULA 1.2 primeiro.")

        config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
        if not os.path.exists(config_path):
            raise Exception("Arquivo de configuração não encontrado. Execute as células anteriores.")

        with open(config_path, "r", encoding="utf-8") as f:
            config = json.load(f)

        if not config["status_etapas"]["decomposicao"]:
            raise Exception("A etapa 'decomposicao' não foi concluída. Execute a CÉLULA 2.3 primeiro.")

        return True, config
    except Exception as e:
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: {e}")
        return False, None

def analisar_variacao_volume(audio_path, sr=22050):
    """Analisa variações de volume da voz"""
    try:
        y, sr = librosa.load(audio_path, sr=sr)

        # Calcular RMS (Root Mean Square) em janelas
        frame_length = int(0.1 * sr)  # Janelas de 100ms
        hop_length = frame_length // 4
        rms = librosa.feature.rms(y=y, frame_length=frame_length, hop_length=hop_length)[0]

        # Detectar variações bruscas
        rms_db = librosa.amplitude_to_db(rms)
        variacao_volume = np.diff(rms_db)

        # Identificar picos de variação
        threshold_variacao = np.std(variacao_volume) * 2
        picos_variacao = np.where(np.abs(variacao_volume) > threshold_variacao)[0]

        # Converter índices para timestamps
        times = librosa.frames_to_time(picos_variacao, sr=sr, hop_length=hop_length)

        return {
            "rms_medio": float(np.mean(rms)),
            "variacao_volume_coef": float(variation(rms)),
            "num_picos_variacao": int(len(picos_variacao)),
            "timestamps_picos": [float(t) for t in times.tolist()],
            "volume_db_medio": float(np.mean(rms_db)),
            "volume_db_std": float(np.std(rms_db))
        }
    except Exception as e:
        print(f"    ⚠️ Erro na análise de variação de volume: {e}")
        return {}

def detectar_picos_ruido(audio_path, sr=22050):
    """Detecta picos de ruído excessivo"""
    try:
        y, sr = librosa.load(audio_path, sr=sr)

        # Calcular espectrograma
        S = librosa.stft(y)
        S_db = librosa.amplitude_to_db(np.abs(S))

        # Detectar ruído baseado em frequências altas
        freq_bins = librosa.fft_frequencies(sr=sr)
        high_freq_mask = freq_bins > 4000  # Frequências acima de 4kHz

        high_freq_energy = np.mean(S_db[high_freq_mask], axis=0)

        # Identificar segmentos com ruído excessivo
        threshold_ruido = np.percentile(high_freq_energy, 85)
        segmentos_ruidosos = np.where(high_freq_energy > threshold_ruido)[0]

        # Converter para timestamps
        hop_length = 512
        times_ruido = librosa.frames_to_time(segmentos_ruidosos, sr=sr, hop_length=hop_length)

        return {
            "energia_alta_freq_media": float(np.mean(high_freq_energy)),
            "threshold_ruido": float(threshold_ruido),
            "num_segmentos_ruidosos": int(len(segmentos_ruidosos)),
            "timestamps_ruido": [float(t) for t in times_ruido.tolist()],
            "percentual_audio_ruidoso": float(len(segmentos_ruidosos) / len(high_freq_energy) * 100)
        }
    except Exception as e:
        print(f"    ⚠️ Erro na detecção de picos de ruído: {e}")
        return {}

def analisar_ritmo_fala(transcricao_texto, duracao_audio):
    """Calcula ritmo da fala em palavras por minuto"""
    try:
        if not transcricao_texto or duracao_audio <= 0:
            return {}

        palavras = transcricao_texto.split()
        num_palavras = len(palavras)
        duracao_minutos = duracao_audio / 60.0

        palavras_por_minuto = num_palavras / duracao_minutos

        # Classificar ritmo
        if palavras_por_minuto < 120:
            classificacao_ritmo = "Lento"
        elif palavras_por_minuto < 160:
            classificacao_ritmo = "Normal"
        elif palavras_por_minuto < 200:
            classificacao_ritmo = "Rápido"
        else:
            classificacao_ritmo = "Muito Rápido"

        return {
            "palavras_por_minuto": float(palavras_por_minuto),
            "total_palavras": int(num_palavras),
            "duracao_minutos": float(duracao_minutos),
            "classificacao_ritmo": str(classificacao_ritmo),
            "densidade_informacional": float(num_palavras / duracao_audio)  # palavras por segundo
        }
    except Exception as e:
        print(f"    ⚠️ Erro na análise de ritmo de fala: {e}")
        return {}

def identificar_pausas_fala(audio_path, sr=22050):
    """Identifica pausas e silêncios na fala"""
    try:
        y, sr = librosa.load(audio_path, sr=sr)

        # Detectar segmentos de fala vs silêncio
        frame_length = int(0.025 * sr)  # 25ms frames
        hop_length = frame_length // 2

        # Energia RMS para detectar atividade vocal
        rms = librosa.feature.rms(y=y, frame_length=frame_length, hop_length=hop_length)[0]

        # Threshold para distinguir fala de silêncio
        threshold_silencio = np.percentile(rms, 20)  # 20% mais baixo = silêncio

        # Identificar segmentos de silêncio
        is_silence = rms < threshold_silencio

        # Encontrar início e fim das pausas
        pausas = []
        in_pause = False
        pause_start = 0

        times = librosa.frames_to_time(range(len(is_silence)), sr=sr, hop_length=hop_length)

        for i, silent in enumerate(is_silence):
            if silent and not in_pause:
                in_pause = True
                pause_start = times[i]
            elif not silent and in_pause:
                in_pause = False
                pause_duration = times[i] - pause_start
                if pause_duration > 0.2:  # Pausas maiores que 200ms
                    pausas.append({
                        "inicio": float(pause_start),
                        "fim": float(times[i]),
                        "duracao": float(pause_duration)
                    })

        # Estatísticas das pausas
        if pausas:
            duracoes_pausas = [p["duracao"] for p in pausas]
            pausa_media = np.mean(duracoes_pausas)
            pausa_total = sum(duracoes_pausas)
        else:
            pausa_media = 0
            pausa_total = 0

        return {
            "num_pausas": int(len(pausas)),
            "pausas_detectadas": pausas,
            "duracao_pausa_media": float(pausa_media),
            "tempo_total_pausas": float(pausa_total),
            "percentual_pausas": float(pausa_total / len(y) * sr * 100),
            "threshold_silencio": float(threshold_silencio)
        }
    except Exception as e:
        print(f"    ⚠️ Erro na identificação de pausas: {e}")
        return {}

def classificar_musica_fundo(audio_path, sr=22050):
    """Classifica características da música de fundo"""
    try:
        y, sr = librosa.load(audio_path, sr=sr)

        # Análise de características musicais
        tempo, beats = librosa.beat.beat_track(y=y, sr=sr)

        # Análise espectral
        spectral_centroids = librosa.feature.spectral_centroid(y=y, sr=sr)[0]
        spectral_rolloff = librosa.feature.spectral_rolloff(y=y, sr=sr)[0]
        mfcc = librosa.feature.mfcc(y=y, sr=sr)

        # Energia
        energia_total = np.sum(y**2)
        energia_normalizada = energia_total / len(y)

        # Classificação por energia
        if energia_normalizada > 0.01:
            nivel_energia = "Alta"
        elif energia_normalizada > 0.001:
            nivel_energia = "Média"
        else:
            nivel_energia = "Baixa"

        # Classificação por características espectrais
        centroide_medio = np.mean(spectral_centroids)
        if centroide_medio > 3000:
            brilho = "Brilhante"
        elif centroide_medio > 1500:
            brilho = "Equilibrado"
        else:
            brilho = "Escuro"

        return {
            "tempo_bpm": float(tempo),
            "num_beats": int(len(beats)),
            "energia_nivel": str(nivel_energia),
            "energia_valor": float(energia_normalizada),
            "brilho_espectral": str(brilho),
            "centroide_espectral_medio": float(centroide_medio),
            "rolloff_medio": float(np.mean(spectral_rolloff)),
            "mfcc_features": [float(x) for x in mfcc.mean(axis=1).tolist()]
        }
    except Exception as e:
        print(f"    ⚠️ Erro na classificação de música de fundo: {e}")
        return {}

def analisar_clareza_voz(audio_path, sr=22050):
    """Analisa clareza e inteligibilidade da voz"""
    try:
        y, sr = librosa.load(audio_path, sr=sr)

        # Faixa de frequência da voz humana (aproximadamente 85-255 Hz para fundamental)
        # e harmônicos até ~4000 Hz para inteligibilidade

        # Análise espectral
        S = librosa.stft(y)
        frequencies = librosa.fft_frequencies(sr=sr)

        # Energia em diferentes bandas de frequência
        baixa_freq = (frequencies >= 85) & (frequencies <= 255)    # Fundamental da voz
        media_freq = (frequencies > 255) & (frequencies <= 2000)   # Formantes principais
        alta_freq = (frequencies > 2000) & (frequencies <= 4000)   # Clareza/inteligibilidade

        energia_baixa = np.mean(np.abs(S[baixa_freq]))
        energia_media = np.mean(np.abs(S[media_freq]))
        energia_alta = np.mean(np.abs(S[alta_freq]))

        # Razão harmônica para ruído (aproximação)
        spectral_flatness = librosa.feature.spectral_flatness(y=y)[0]
        clareza_media = 1 - np.mean(spectral_flatness)  # Menor flatness = mais harmônica

        # Zero crossing rate (indicador de fricção/clareza)
        zcr = librosa.feature.zero_crossing_rate(y)[0]
        zcr_medio = np.mean(zcr)

        # Score de clareza combinado
        score_clareza = (energia_media + energia_alta) / (energia_baixa + 0.001) * clareza_media

        if score_clareza > 10:
            classificacao_clareza = "Excelente"
        elif score_clareza > 5:
            classificacao_clareza = "Boa"
        elif score_clareza > 2:
            classificacao_clareza = "Regular"
        else:
            classificacao_clareza = "Precisa Melhoria"

        return {
            "score_clareza": float(score_clareza),
            "classificacao_clareza": classificacao_clareza,
            "energia_fundamental": float(energia_baixa),
            "energia_formantes": float(energia_media),
            "energia_agudos": float(energia_alta),
            "harmonicidade": float(clareza_media),
            "zero_crossing_rate": float(zcr_medio)
        }
    except Exception as e:
        print(f"    ⚠️ Erro na análise de clareza de voz: {e}")
        return {}

def detectar_sobreposicao_audio(audio_path, sr=22050):
    """Detecta sobreposição entre fala e música/efeitos"""
    try:
        y, sr = librosa.load(audio_path, sr=sr)

        # Separação harmônica/percussiva (aproximação para voz vs música)
        y_harmonic, y_percussive = librosa.effects.hpss(y)

        # Análise de energia em cada componente
        energia_harmonica = librosa.feature.rms(y=y_harmonic)[0]
        energia_percussiva = librosa.feature.rms(y=y_percussive)[0]
        energia_total = librosa.feature.rms(y=y)[0]

        # Detectar momentos de sobreposição
        threshold_sobreposicao = 0.7  # Threshold para detectar sobreposição significativa

        # Razão entre componentes
        razao_hp = energia_harmonica / (energia_percussiva + 0.001)

        # Momentos onde há competição (energia similar em ambos)
        competicao_mask = (energia_harmonica > threshold_sobreposicao * np.max(energia_harmonica)) & \
                         (energia_percussiva > threshold_sobreposicao * np.max(energia_percussiva))

        segmentos_sobreposicao = np.where(competicao_mask)[0]

        # Converter para timestamps
        hop_length = 512
        times_sobreposicao = librosa.frames_to_time(segmentos_sobreposicao, sr=sr, hop_length=hop_length)

        return {
            "num_sobreposicoes": int(len(segmentos_sobreposicao)),
            "timestamps_sobreposicao": [float(t) for t in times_sobreposicao.tolist()],
            "percentual_sobreposicao": float(len(segmentos_sobreposicao) / len(energia_total) * 100),
            "energia_harmonica_media": float(np.mean(energia_harmonica)),
            "energia_percussiva_media": float(np.mean(energia_percussiva)),
            "razao_harmonico_percussivo": float(np.mean(razao_hp))
        }
    except Exception as e:
        print(f"    ⚠️ Erro na detecção de sobreposição: {e}")
        return {}

def mapear_efeitos_sonoros(audio_path, sr=22050):
    """Mapeia e cataloga efeitos sonoros"""
    try:
        y, sr = librosa.load(audio_path, sr=sr)

        # Detectar eventos transientes (possíveis efeitos sonoros)
        onset_frames = librosa.onset.onset_detect(y=y, sr=sr, units='frames')
        onset_times = librosa.frames_to_time(onset_frames, sr=sr)

        # Análise de características espectrais em cada onset
        efeitos_detectados = []

        for i, onset_time in enumerate(onset_times):
            # Janela de análise ao redor do onset
            inicio_frame = max(0, onset_frames[i] - 10)
            fim_frame = min(len(y), onset_frames[i] + 50)

            janela = y[inicio_frame:fim_frame] if fim_frame > inicio_frame else np.array([])

            if len(janela) > 0:
                # Características do efeito
                energia = np.sum(janela**2)
                freq_dominante = librosa.piptrack(y=janela, sr=sr)[0]

                # Classificação simplificada baseada em características
                if energia > 0.1:
                    tipo_efeito = "Impacto"
                elif np.max(freq_dominante) > 5000:
                    tipo_efeito = "Agudo"
                elif np.max(freq_dominante) < 200:
                    tipo_efeito = "Grave"
                else:
                    tipo_efeito = "Médio"

                efeitos_detectados.append({
                    "timestamp": float(onset_time),
                    "energia": float(energia),
                    "tipo_estimado": tipo_efeito
                })

        # Contagem por tipo
        tipos_efeitos = Counter([ef["tipo_estimado"] for ef in efeitos_detectados])

        return {
            "num_efeitos_detectados": int(len(efeitos_detectados)),
            "efeitos_por_minuto": float(len(efeitos_detectados) / (len(y) / sr / 60)),
            "tipos_efeitos": dict(tipos_efeitos),
            "efeitos_detalhados": efeitos_detectados,
            "densidade_efeitos": float(len(efeitos_detectados) / (len(y) / sr))
        }
    except Exception as e:
        print(f"    ⚠️ Erro no mapeamento de efeitos sonoros: {e}")
        return {}

def analisar_frequencias_especificas(audio_path, sr=22050):
    """Analisa sons recorrentes específicos"""
    try:
        y, sr = librosa.load(audio_path, sr=sr)

        # Template matching para sons específicos (simplificado)
        # Detectar padrões de risada (frequências variadas em burst)
        onset_strength = librosa.onset.onset_strength(y=y, sr=sr)

        # Detectar rajadas de atividade (possível risada)
        threshold_burst = np.percentile(onset_strength, 80)
        bursts = onset_strength > threshold_burst

        # Agrupar bursts próximos
        burst_groups = []
        in_burst = False
        burst_start = 0

        for i, is_burst in enumerate(bursts):
            if is_burst and not in_burst:
                in_burst = True
                burst_start = i
            elif not is_burst and in_burst:
                in_burst = False
                burst_duration = i - burst_start
                if burst_duration > 5:  # Bursts de pelo menos 5 frames
                    burst_groups.append({
                        "inicio": librosa.frames_to_time(burst_start, sr=sr),
                        "duracao": librosa.frames_to_time(burst_duration, sr=sr),
                        "intensidade": np.mean(onset_strength[burst_start:i])
                    })

        # Detectar sons de notificação (tons puros em frequências específicas)
        # Análise espectral para encontrar picos em frequências comuns de notificação
        S = librosa.stft(y)
        frequencies = librosa.fft_frequencies(sr=sr)

        # Frequências típicas de notificação (440Hz, 880Hz, etc.)
        freq_targets = [440, 880, 1320]  # A4, A5, E6
        notificacoes_detectadas = 0

        for freq_target in freq_targets:
            freq_idx = np.argmin(np.abs(frequencies - freq_target))
            freq_energy = np.abs(S[freq_idx])

            # Detectar picos sustentados nesta frequência
            peaks = scipy.signal.find_peaks(freq_energy, height=np.percentile(freq_energy, 90))[0]
            notificacoes_detectadas += len(peaks)

        return {
            "bursts_atividade": int(len(burst_groups)),
            "detalhes_bursts": burst_groups,
            "possivel_risada": int(len(burst_groups)),
            "sons_notificacao_detectados": int(notificacoes_detectadas),
            "densidade_eventos_especiais": float((len(burst_groups) + notificacoes_detectadas) / (len(y) / sr))
        }
    except Exception as e:
        print(f"    ⚠️ Erro na análise de frequências específicas: {e}")
        return {}

def gerar_espectrograma_simplificado(audio_path, video_id, sr=22050):
    """Gera e salva espectrograma simplificado"""
    try:
        y, sr = librosa.load(audio_path, sr=sr)

        # Gerar espectrograma
        S = librosa.stft(y)
        S_db = librosa.amplitude_to_db(np.abs(S), ref=np.max)

        # Criar visualização
        plt.figure(figsize=(12, 6))
        librosa.display.specshow(S_db, sr=sr, x_axis='time', y_axis='hz')
        plt.colorbar(format='%+2.0f dB')
        plt.title(f'Espectrograma - {video_id}')
        plt.xlabel('Tempo (s)')
        plt.ylabel('Frequência (Hz)')
        plt.ylim(0, 8000)  # Focar em frequências até 8kHz

        # Salvar
        espectrograma_path = os.path.join(PASTA_TRABALHO, "analise_audio", f"espectrograma_{video_id}.png")
        os.makedirs(os.path.dirname(espectrograma_path), exist_ok=True)
        plt.savefig(espectrograma_path, dpi=150, bbox_inches='tight')
        plt.close()

        # Análise de padrões espectrais
        freq_bins = librosa.fft_frequencies(sr=sr)

        # Energia por banda de frequência
        baixa_energia = np.mean(S_db[freq_bins <= 500])
        media_energia = np.mean(S_db[(freq_bins > 500) & (freq_bins <= 2000)])
        alta_energia = np.mean(S_db[freq_bins > 2000])

        return {
            "espectrograma_path": str(espectrograma_path),
            "energia_baixa_freq": float(baixa_energia),
            "energia_media_freq": float(media_energia),
            "energia_alta_freq": float(alta_energia),
            "frequencia_maxima": float(np.max(freq_bins)),
            "resolucao_temporal": float(len(y) / sr),
            "picos_espectrais": int(len(scipy.signal.find_peaks(np.mean(S_db, axis=1))[0]))
        }
    except Exception as e:
        print(f"    ⚠️ Erro na geração de espectrograma: {e}")
        return {"espectrograma_path": None}

def processar_analise_audio_refinada():
    """Processa análise de áudio refinada para todos os vídeos"""
    prerequisito_ok, config = verificar_prerequisito_audio_refinado()
    if not prerequisito_ok:
        return

    # Carregar dados de decomposição
    decomposicao_path = os.path.join(PASTA_TRABALHO, "dados", "decomposicao_completa.json")
    with open(decomposicao_path, "r", encoding="utf-8") as f:
        decomposicoes = json.load(f)

    analises_audio_refinadas = []
    sucessos = 0

    print(f"""
Iniciando análise de áudio refinada para {len(decomposicoes)} vídeos...""")

    for i, decomposicao in enumerate(decomposicoes, 1):
        if decomposicao.get("status") == "decomposto":
            video_id = decomposicao["video_id"]
            print(f"[{i}/{len(decomposicoes)}] Analisando áudio refinado para: {video_id}")

            try:
                # Buscar arquivo de áudio
                audio_path = os.path.join(PASTA_TRABALHO, "temp", f"{video_id}.wav")

                if not os.path.exists(audio_path):
                    print(f"    ⚠️ Arquivo de áudio não encontrado: {audio_path}")
                    analises_audio_refinadas.append({
                        "video_id": video_id,
                        "status": "erro_audio_nao_encontrado",
                        "erro": "Arquivo de áudio não encontrado"
                    })
                    continue

                analise_refinada = {"video_id": video_id}

                print(f"    🔊 Analisando variação de volume...")
                analise_refinada["variacao_volume"] = analisar_variacao_volume(audio_path)

                print(f"    🔊 Detectando picos de ruído...")
                analise_refinada["picos_ruido"] = detectar_picos_ruido(audio_path)

                print(f"    🔊 Analisando ritmo da fala...")
                transcricao = decomposicao.get("audio_transcrito", "")
                duracao_audio = decomposicao.get("audio_analise", {}).get("duracao_audio_segundos", 0)
                analise_refinada["ritmo_fala"] = analisar_ritmo_fala(transcricao, duracao_audio)

                print(f"    🔊 Identificando pausas...")
                analise_refinada["pausas_fala"] = identificar_pausas_fala(audio_path)

                print(f"    🔊 Classificando música de fundo...")
                analise_refinada["musica_fundo"] = classificar_musica_fundo(audio_path)

                print(f"    🔊 Analisando clareza da voz...")
                analise_refinada["clareza_voz"] = analisar_clareza_voz(audio_path)

                print(f"    🔊 Detectando sobreposição...")
                analise_refinada["sobreposicao_audio"] = detectar_sobreposicao_audio(audio_path)

                print(f"    🔊 Mapeando efeitos sonoros...")
                analise_refinada["efeitos_sonoros"] = mapear_efeitos_sonoros(audio_path)

                print(f"    🔊 Analisando frequências específicas...")
                analise_refinada["frequencias_especificas"] = analisar_frequencias_especificas(audio_path)

                print(f"    🔊 Gerando espectrograma...")
                analise_refinada["espectrograma"] = gerar_espectrograma_simplificado(audio_path, video_id)

                analise_refinada = converter_para_json_serializable(analise_refinada)
                analise_refinada["status"] = "audio_refinado_concluido"
                analise_refinada["data_analise"] = datetime.now().isoformat()

                analises_audio_refinadas.append(analise_refinada)
                sucessos += 1
                print(f"  ✅ Análise de áudio refinada concluída para {video_id}")

            except Exception as e:
                print(f"  ❌ ERRO na análise de áudio refinada para {video_id}: {e}")
                analises_audio_refinadas.append({
                    "video_id": video_id,
                    "status": "erro_analise_audio_refinada",
                    "erro": str(e)
                })
        else:
            print(f"[{i}/{len(decomposicoes)}] Pulando {decomposicao.get('video_id', 'N/A')} - Status: {decomposicao.get('status', 'N/A')}")
            analises_audio_refinadas.append({
                "video_id": decomposicao.get("video_id", "N/A"),
                "status": decomposicao.get("status", "N/A"),
                "erro": "Pulado devido a erro anterior"
            })

    # Salvar análises de áudio refinadas
    analise_audio_path = os.path.join(PASTA_TRABALHO, "dados", "analise_audio_refinada.json")
    with open(analise_audio_path, "w", encoding="utf-8") as f:
        json.dump(analises_audio_refinadas, f, indent=2, ensure_ascii=False)

    # Gerar relatório resumido em Excel
    try:
        # Preparar dados para Excel
        dados_resumo = []
        for analise in analises_audio_refinadas:
            if analise.get("status") == "audio_refinado_concluido":
                resumo = {
                    "video_id": analise["video_id"],
                    "variacao_volume_coef": analise["variacao_volume"].get("variacao_volume_coef", 0),
                    "num_picos_variacao": analise["variacao_volume"].get("num_picos_variacao", 0),
                    "volume_db_medio": analise["variacao_volume"].get("volume_db_medio", 0),
                    "percentual_audio_ruidoso": analise["picos_ruido"].get("percentual_audio_ruidoso", 0),
                    "num_segmentos_ruidosos": analise["picos_ruido"].get("num_segmentos_ruidosos", 0),
                    "palavras_por_minuto": analise["ritmo_fala"].get("palavras_por_minuto", 0),
                    "classificacao_ritmo": analise["ritmo_fala"].get("classificacao_ritmo", "N/A"),
                    "num_pausas": analise["pausas_fala"].get("num_pausas", 0),
                    "percentual_pausas": analise["pausas_fala"].get("percentual_pausas", 0),
                    "nivel_energia_musica": analise["musica_fundo"].get("energia_nivel", "N/A"),
                    "tempo_bpm_musica": analise["musica_fundo"].get("tempo_bpm", 0),
                    "score_clareza": analise["clareza_voz"].get("score_clareza", 0),
                    "classificacao_clareza": analise["clareza_voz"].get("classificacao_clareza", "N/A"),
                    "percentual_sobreposicao": analise["sobreposicao_audio"].get("percentual_sobreposicao", 0),
                    "num_efeitos_detectados": analise["efeitos_sonoros"].get("num_efeitos_detectados", 0),
                    "densidade_efeitos": analise["efeitos_sonoros"].get("densidade_efeitos", 0),
                    "possivel_risada": analise["frequencias_especificas"].get("possivel_risada", 0),
                    "sons_notificacao": analise["frequencias_especificas"].get("sons_notificacao_detectados", 0),
                    "espectrograma_gerado": "Sim" if analise["espectrograma"].get("espectrograma_path") else "Não"
                }
                dados_resumo.append(resumo)

        if dados_resumo:
            df_resumo = pd.DataFrame(dados_resumo)
            resumo_excel_path = os.path.join(PASTA_TRABALHO, "analise_audio", "resumo_analise_audio.xlsx")
            df_resumo.to_excel(resumo_excel_path, index=False, engine='openpyxl')
            print(f"\n💾 Relatório resumo de análise de áudio salvo em: {resumo_excel_path}")

    except Exception as e:
        print(f"    ❌ ERRO ao gerar relatório resumo de áudio: {e}")

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    # Adicionar status para a nova etapa de análise de áudio refinada
    config["status_etapas"]["analise_audio_refinada"] = True
    config["total_videos_analisados_audio_refinado"] = sucessos

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    print(f"""
✅ ANÁLISE DE ÁUDIO REFINADA CONCLUÍDA!""")
    print(f"Total de vídeos com análise de áudio refinada concluída: {sucessos}")

    if sucessos == 0:
        print("❌ NENHUM VÍDEO FOI ANALISADO COM SUCESSO NESTA ETAPA. Verifique as etapas anteriores.")
    # No final, a próxima célula seria 3.1 (Análise de Padrões) que já foi executada
    # mas como esta é uma nova célula (2.4), ela deveria vir antes de 3.1
    # A mensagem original apontava para 3.1.
    # Vamos manter a mensagem original para não alterar o fluxo do notebook existente,
    # mas idealmente, essa célula seria inserida antes de 3.1 no fluxo.
    print("""
➡️ PRÓXIMA CÉLULA: 3.1 - ANÁLISE DE PADRÕES (TEMPORAIS, VISUAIS, TEXTO, ÁUDIO)""")

    # Return the list of analyses for potential downstream use
    return analises_audio_refinadas

# Executar análise de audio refinada
try:
    processar_analise_audio_refinada()
except Exception as e:
    print(f"""
❌ ERRO GERAL NA ANÁLISE DE ÁUDIO REFINADA: {e}""")
    print("Por favor, corrija o erro acima antes de prosseguir.")

In [None]:
# ============================================================================
# CÉLULA 2.4: GERAÇÃO DE LEGENDAS E ANÁLISE DE COPYWRITING - VERSÃO CORRIGIDA
# ============================================================================

import re
from datetime import timedelta, datetime
from collections import Counter
import json
import os

# ============================================================================
# Funções Auxiliares (Movidas para este escopo)
# ============================================================================

def buscar_dados_disponiveis():
    """Busca dados disponíveis em ordem de prioridade"""
    pasta_dados = os.path.join(PASTA_TRABALHO, "dados")

    # Lista de possíveis fontes de dados (em ordem de prioridade)
    fontes_dados = [
        ("decomposicao_completa.json", "decomposicao"),
        ("analises_padroes_completas.json", "padroes"),
        ("analises_psicologicas_completas.json", "psicologico"),
        ("metadados_completos.json", "metadados"),
        ("videos_catalogados.json", "catalogados")
    ]

    for arquivo, tipo in fontes_dados:
        caminho_arquivo = os.path.join(pasta_dados, arquivo)

        if os.path.exists(caminho_arquivo):
            try:
                with open(caminho_arquivo, "r", encoding="utf-8") as f:
                    dados = json.load(f)
                if dados:
                    return {"tipo": tipo, "videos": dados}
            except Exception as e:
                print(f"⚠️ Erro ao carregar dados de {arquivo}: {e}")

    return None

def extrair_texto_disponivel(video_data, tipo_fonte):
    """Extrai texto (transcrição ou OCR) da fonte de dados disponível"""
    if tipo_fonte == "decomposicao":
        return video_data.get("audio_transcrito", "") or " ".join([item.get("text", "") for item in video_data.get("textos_ocr", [])])
    elif tipo_fonte == "padroes":
         # Analise de padroes might have summary or keywords
         return video_data.get("resumo_texto", "") # or " ".join(video_data.get("palavras_chave_texto", []))
    # Adicionar outras fontes conforme necessário
    return "" # Default vazio

def gerar_legendas_adaptadas(video_id, texto_transcrito, video_data):
    """Gera legendas para a análise de copywriting, adaptando se necessário"""
    # Se já houver dados de decomposição com timestamps, usar esses
    if video_data.get("frames_extraidos"):
        # Tentar usar os dados de decomposição originais para timestamps
        # Isso requer carregar o arquivo decomposicao_completa.json novamente
        decomposicao_path = os.path.join(PASTA_TRABALHO, "dados", "decomposicao_completa.json")
        if os.path.exists(decomposicao_path):
            try:
                with open(decomposicao_path, "r", encoding="utf-8") as f:
                    decomposicoes = json.load(f)
                decomposicao_original = next((d for d in decomposicoes if d["video_id"] == video_id), None)
                if decomposicao_original and decomposicao_original.get("audio_transcrito"):
                     # Se a transcrição original existir, usar a função original de legendas
                    duracao = video_data.get("duracao_segundos", decomposicao_original.get("audio_analise", {}).get("duracao_audio_segundos", 30))
                    return gerar_legendas_com_timestamps({"id": video_id, "duracao_segundos": duracao}, decomposicao_original)
            except Exception as e:
                print(f"⚠️ Aviso: Erro ao carregar decomposição original para {video_id}: {e}. Gerando legendas estimadas.")

    # Se não houver decomposição original ou transcrição lá, gerar legendas estimadas
    duracao_segundos = video_data.get("duracao_segundos", estimar_duracao(texto_transcrito))
    segmentos = dividir_texto_em_segmentos(texto_transcrito)
    legendas_data = []
    duracao_por_segmento = duracao_segundos / len(segmentos) if segmentos else 1

    for i, segmento in enumerate(segmentos):
        inicio_segundos = i * duracao_por_segmento
        fim_segundos = (i + 1) * duracao_por_segmento

        legenda_item = {
            "id": i + 1,
            "inicio": segundos_para_timestamp(inicio_segundos),
            "fim": segundos_para_timestamp(fim_segundos),
            "texto": segmento.strip(),
            "inicio_segundos": inicio_segundos,
            "fim_segundos": fim_segundos
        }
        legendas_data.append(legenda_item)

    if not legendas_data:
         return None, None, None

    pasta_legendas = os.path.join(PASTA_TRABALHO, "legendas")
    os.makedirs(pasta_legendas, exist_ok=True)
    srt_path = os.path.join(pasta_legendas, f"{video_id}_legendas_estimadas.srt")
    txt_path = os.path.join(pasta_legendas, f"{video_id}_legendas_estimadas_timestamped.txt")

    gerar_arquivo_srt(legendas_data, srt_path)
    gerar_arquivo_txt_timestamped(legendas_data, txt_path)

    print(f"    ✅ Legendas estimadas geradas: {srt_path}")

    return legendas_data, srt_path, txt_path


def analisar_copywriting_adaptado(legendas_data, video_id, texto_completo):
    """Analisa copywriting usando a estrutura existente mas adaptada"""
    print("    🔄 Analisando copywriting...")

    # Dicionários de padrões de copywriting (mantidos da função original)
    ganchos_patterns = {
        "pergunta_retorica": [r"\b(?:você|tu)\s+(?:já|nunca|sempre|realmente|acha|imagina|sabe|quer|precisa)",
                            r"(?:como|por que|quando|onde|o que).*\?"],
        "urgencia": [r"\b(?:agora|hoje|urgente|rápido|imediato|última chance|só hoje|apenas|restam)",
                     r"\b(?:não perca|aproveite|garante já|corre|últimas vagas)"],
        "escassez": [r"\b(?:limitado|exclusivo|poucos|restam|última|única|especial|VIP)",
                     r"\b(?:só para|apenas para|somente|limitado a)"],
        "autoridade": [r"\b(?:especialista|expert|profissional|anos de experiência|comprovado|testado)",
                       r"\b(?:pesquisas mostram|estudos comprovam|cientificamente)"],
        "prova_social": [r"\b(?:milhares|centenas|todos|muitas pessoas|clientes|depoimentos)",
                         r"\b(?:já conseguiram|transformaram|mudaram|aprovaram)"],
        "curiosidade": [r"\b(?:segredo|descoberta|revelação|método|técnica|estratégia|fórmula)",
                        r"\b(?:ninguém te conta|poucos sabem|descobri que)"],
        "problema_dor": [r"\b(?:problema|dificuldade|frustração|sofre|dor|preocupa|bloqueia)",
                         r"\b(?:cansado de|chega de|pare de|não aguenta mais)"],
        "solucao_resultado": [r"\b(?:solução|resolve|elimina|transforma|muda|resultado|sucesso)",
                              r"\b(?:conseguir|alcançar|realizar|conquistar|atingir)"]
    }

    gatilhos_patterns = {
        "reciprocidade": [r"\b(?:grátis|de graça|presente|bônus|oferta|sem custo)",
                          r"\b(?:vou te dar|vou ensinar|vou mostrar|compartilhar com você)"],
        "comprometimento": [r"\b(?:compromisso|prometo|garanto|palavra|juro)",
                            r"\b(?:pode confiar|tenho certeza|assumo|responsabilizo)"],
        "aprovacao_social": [r"\b(?:aprovado por|recomendado|indicado|usado por|preferido)",
                             r"\b(?:famosos|influencers|especialistas|médicos|profissionais)"],
        "aversao_perda": [r"\b(?:perder|perdendo|vai ficar de fora|não vai conseguir)",
                          r"\b(?:sair perdendo|ficar para trás|oportunidade perdida)"],
        "autoridade_especialista": [r"\b(?:Dr|Dra|Professor|Mestre|PhD|especialista em)",
                                    r"\b(?:formado em|pós-graduado|anos estudando)"],
        "emocional_medo": [r"\b(?:medo|receio|preocupação|insegurança|ansiedade)",
                           r"\b(?:não conseguir|fracassar|dar errado|prejudicar)"],
        "emocional_esperanca": [r"\b(?:sonho|esperança|desejo|objetivo|meta|futuro melhor)",
                                r"\b(?:realizar|conquistar|alcançar|transformar|mudar vida)"]
    }

    ctas_patterns = {
        "acao_imediata": [r"\b(?:clica|clique|acesse|baixe|faça|compre|adquira|garanta)",
                          r"\b(?:não perca|aproveite|corre|vai|vem|participe)"],
        "link_bio": [r"\b(?:link na bio|bio|biografia|perfil|stories|direct)",
                     r"\b(?:DM|chama no WhatsApp|manda mensagem)"],
        "engajamento": [r"\b(?:comenta|compartilha|marca|salva|curte|like|segue)",
                        r"\b(?:conta nos comentários|deixa um|comenta aqui)"],
        "inscricao": [r"\b(?:inscreve|se inscreva|ativa|ativar|sino|notificação)",
                      r"\b(?:cadastra|cadastre-se|registra|assine)"],
        "contato_vendas": [r"\b(?:WhatsApp|telefone|ligue|chama|fala comigo|contato)",
                           r"\b(?:agende|marque|consulta|reunião|conversa)"]
    }

    # Análise dos padrões
    ganchos_encontrados = {}
    gatilhos_encontrados = {}
    ctas_encontrados = {}

    # Analisar ganchos
    for tipo, patterns in ganchos_patterns.items():
        matches = []
        for pattern in patterns:
            matches.extend(re.finditer(pattern, texto_completo, re.IGNORECASE))
        if matches:
            ganchos_encontrados[tipo] = {
                "count": len(matches),
                "exemplos": [m.group() for m in matches[:3]],  # Top 3 exemplos
                "timestamps": encontrar_timestamps_matches(matches, legendas_data, texto_completo) # Reusa a função de timestamp
            }

    # Analisar gatilhos
    for tipo, patterns in gatilhos_patterns.items():
        matches = []
        for pattern in patterns:
            matches.extend(re.finditer(pattern, texto_completo, re.IGNORECASE))
        if matches:
            gatilhos_encontrados[tipo] = {
                "count": len(matches),
                "exemplos": [m.group() for m in matches[:3]],
                "timestamps": encontrar_timestamps_matches(matches, legendas_data, texto_completo)
            }

    # Analisar CTAs
    for tipo, patterns in ctas_patterns.items():
        matches = []
        for pattern in patterns:
            matches.extend(re.finditer(pattern, texto_completo, re.IGNORECASE))
        if matches:
            ctas_encontrados[tipo] = {
                "count": len(matches),
                "exemplos": [m.group() for m in matches[:3]],
                "timestamps": encontrar_timestamps_matches(matches, legendas_data, texto_completo)
            }

    # Análise de estrutura narrativa
    estrutura_narrativa = analisar_estrutura_narrativa(legendas_data) # Reusa a função

    # Análise de poder de persuasão
    score_persuasao = calcular_score_persuasao(ganchos_encontrados, gatilhos_encontrados, ctas_encontrados) # Reusa a função

    analise_copywriting = {
        "video_id": video_id,
        "texto_completo": texto_completo,
        "total_palavras": len(texto_completo.split()),
        "ganchos_detectados": ganchos_encontrados,
        "gatilhos_mentais_detectados": gatilhos_encontrados,
        "ctas_detectados": ctas_encontrados,
        "estrutura_narrativa": estrutura_narrativa,
        "score_persuasao": score_persuasao,
        "recomendacoes_estrategicas": gerar_recomendacoes_copywriting(ganchos_encontrados, gatilhos_encontrados, ctas_encontrados), # Reusa
        "templates_identificados": identificar_templates_replicaveis(ganchos_encontrados, gatilhos_encontrados, ctas_encontrados), # Reusa
        "timestamp": {
            "ganchos_timeline": mapear_timeline_elementos(ganchos_encontrados, legendas_data), # Reusa
            "gatilhos_timeline": mapear_timeline_elementos(gatilhos_encontrados, legendas_data), # Reusa
            "ctas_timeline": mapear_timeline_elementos(ctas_encontrados, legendas_data) # Reusa
        },
        "data_analise": datetime.now().isoformat()
    }

    return analise_copywriting

def estimar_duracao(texto):
    """Estima a duração do vídeo com base na contagem de palavras (WPM médio)"""
    palavras_por_minuto = 150 # Média de palavras por minuto
    num_palavras = len(texto.split())
    duracao_minutos = num_palavras / palavras_por_minuto
    return duracao_minutos * 60 # Retorna em segundos

# ============================================================================
# Função Principal da Célula (Movida para este escopo)
# ============================================================================
def processar_copywriting_todos_videos_adaptado():
    """Processa análise de copywriting adaptada para o sistema existente"""
    print("🔄 Iniciando processamento de copywriting adaptado...")

    # Verificar pré-requisitos de forma mais flexível
    if not "PASTA_TRABALHO" in globals():
        print("❌ Variáveis globais não encontradas. Execute a CÉLULA 1.2 primeiro.")
        return

    pasta_dados = os.path.join(PASTA_TRABALHO, "dados")
    if not os.path.exists(pasta_dados):
        print("❌ Pasta de dados não encontrada. Execute as células anteriores primeiro.")
        return

    # Buscar dados disponíveis em ordem de prioridade
    dados_encontrados = buscar_dados_disponiveis()

    if not dados_encontrados:
        print("❌ Nenhum dado de vídeo encontrado. Execute as células anteriores primeiro.")
        return

    print(f"  ✅ Dados encontrados: {dados_encontrados['tipo']} com {len(dados_encontrados['videos'])} vídeos")

    analises_copywriting = []
    legendas_geradas = []

    print(f"Processando copywriting para {len(dados_encontrados['videos'])} vídeos...")

    for i, video_data in enumerate(dados_encontrados['videos'], 1):
        video_id = video_data.get("id") or video_data.get("video_id", f"vid_{i:03d}")

        print(f"[{i}/{len(dados_encontrados['videos'])}] Processando copywriting para: {video_id}")

        try:
            # Extrair texto transcrito de diferentes fontes possíveis
            texto_transcrito = extrair_texto_disponivel(video_data, dados_encontrados['tipo'])

            if texto_transcrito and len(texto_transcrito.strip()) > 10:
                # Gerar legendas se houver texto
                legendas_data, srt_path, txt_path = gerar_legendas_adaptadas(video_id, texto_transcrito, video_data)

                if legendas_data:
                    legendas_info = {
                        "video_id": video_id,
                        "srt_path": srt_path,
                        "txt_path": txt_path,
                        "total_segmentos": len(legendas_data),
                        "duracao_total": video_data.get("duracao_segundos", estimar_duracao(texto_transcrito)),
                        "legendas_data": legendas_data
                    }
                    legendas_geradas.append(legendas_info)

                    # Análise de copywriting
                    analise_copy = analisar_copywriting_adaptado(legendas_data, video_id, texto_transcrito)
                    analises_copywriting.append(analise_copy)

                    print(f"  ✅ Copywriting analisado: Score {analise_copy['score_persuasao']}/100")
            else:
                print(f"  ⚠️ Pulando {video_id}: texto insuficiente para análise")

        except Exception as e:
            print(f"  ❌ Erro no processamento de copywriting para {video_id}: {e}")

    if not analises_copywriting:
        print("❌ Nenhuma análise de copywriting foi gerada. Verifique se os vídeos possuem transcrição.")
        return

    # Salvar dados de copywriting
    os.makedirs(pasta_dados, exist_ok=True)

    copywriting_path = os.path.join(pasta_dados, "analises_copywriting_completas.json")
    with open(copywriting_path, "w", encoding="utf-8") as f:
        json.dump(analises_copywriting, f, indent=2, ensure_ascii=False)

    print(f"💾 Análises de copywriting salvas em: {copywriting_path}")

    # Salvar dados de legendas
    legendas_path = os.path.join(pasta_dados, "legendas_geradas.json")
    with open(legendas_path, "w", encoding="utf-8") as f:
        json.dump(legendas_geradas, f, indent=2, ensure_ascii=False)

    print(f"💾 Dados de legendas salvos em: {legendas_path}")

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    if os.path.exists(config_path):
        with open(config_path, "r", encoding="utf-8") as f:
            config = json.load(f)

        config["status_etapas"]["copywriting_analysis"] = True

        with open(config_path, "w", encoding="utf-8") as f:
            json.dump(config, f, indent=2, ensure_ascii=False)

    print(f"\n✅ ANÁLISE DE COPYWRITING CONCLUÍDA!")
    print(f"Total de vídeos com copywriting analisado: {len(analises_copywriting)}")
    print(f"Total de legendas geradas: {len(legendas_geradas)}")
    print(f"\n➡️ PRÓXIMA CÉLULA: 4.3 - INTEGRAÇÃO COM DASHBOARD")


# ============================================================================
# Execução da Célula
# ============================================================================
try:
    processar_copywriting_todos_videos_adaptado()
except Exception as e:
    print(f"❌ ERRO de Execução: {type(e).__name__}: {e}")
    import traceback
    traceback.print_exc()

In [None]:
# ============================================================================
# LAYER 3: ANÁLISE E PROCESSAMENTO DE DADOS
# ============================================================================

# ============================================================================
# CÉLULA 3.1: ANÁLISE DE PADRÕES (TEMPORAIS, VISUAIS, TEXTO, ÁUDIO)
# ============================================================================

def analisar_padroes_video(decomposicao_data):
    """Analisa padrões temporais, visuais, de texto e áudio de um vídeo."""
    video_id = decomposicao_data["video_id"]
    print(f"  ⚙️ Analisando padrões para: {video_id}")

    analise_padroes = {
        "video_id": video_id,
        "resumo_texto": "",
        "palavras_chave_texto": [],
        "analise_audio_detalhada": {
            "bpm": decomposicao_data["audio_analise"] .get("bpm"),
            "duracao_audio_segundos": decomposicao_data["audio_analise"] .get("duracao_audio_segundos")
        },
        "analise_visual_detalhada": {
            "total_cortes": len(decomposicao_data.get("cortes_detectados_segundos", [])),
            "media_frames_por_corte": 0,
            "complexidade_visual_media": 0,
            "brilho_medio": 0
        },
        "padroes_gerais": []
    }

    # Análise de Texto (OCR e Transcrição)
    todos_textos = [item["text"] for item in decomposicao_data["textos_ocr"]]
    if decomposicao_data["audio_transcrito"]:
        todos_textos.append(decomposicao_data["audio_transcrito"])

    if todos_textos:
        texto_completo = " ".join(todos_textos)
        # Simples resumo e palavras-chave (pode ser aprimorado com NLP mais avançado)
        import re # Ensure regex is imported here for local function
        words = [word.lower() for word in re.findall(r"\b\w+\b", texto_completo) if len(word) > 3]
        word_counts = Counter(words).most_common(5)
        analise_padroes["palavras_chave_texto"] = [word for word, count in word_counts]
        analise_padroes["resumo_texto"] = texto_completo[:200] + "..." if len(texto_completo) > 200 else texto_completo


    # Análise Visual Detalhada
    if decomposicao_data["frames_extraidos"]:
        complexidades = []
        brilhos = []
        for frame_data in decomposicao_data["frames_extraidos"]:
            try:
                img = cv2.imread(frame_data["path"])
                gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
                complexidades.append(cv2.Laplacian(gray, cv2.CV_64F).var())
                brilhos.append(np.mean(gray))
            except Exception as e:
                print(f"    ⚠️ Aviso: Erro ao analisar frame {frame_data["path"]}: {e}")
        if complexidades: analise_padroes["analise_visual_detalhada"]["complexidade_visual_media"] = float(np.mean(complexidades))
        if brilhos: analise_padroes["analise_visual_detalhada"]["brilho_medio"] = float(np.mean(brilhos))

    # Padrões Gerais
    # Need video_info to get duration and total_frames
    # This function is called with decomposicao_data, not video_info.
    # Need to pass video_info or retrieve it here.
    # Assuming for now that video_info is available or can be looked up.
    # Based on process_analise_padroes_todos_videos, video_info is looked up there.
    # Let's pass it to this function.

    # Re-evaluating the design: It's better to process video by video and then
    # consolidate. The current structure passes decomposicao_data, which
    # doesn't include duration/total_frames directly.
    # Option 1: Pass video_info to analisar_padroes_video.
    # Option 2: Look up video_info inside analisar_padroes_video.
    # Option 1 is cleaner.

    # Let's assume video_info is passed as a second argument now.
    # Modify process_analise_padroes_todos_videos to pass video_info.
    # But for fixing the syntax error, let's just fix the print statements.
    # The logic error regarding video_info will likely cause a runtime error later.

    # Fixing syntax error first:
    # The original code had: print(f"\nIniciando análise de padrões para {len(decomposicoes)} vídeos...")
    # And similar for other print statements.

    # Padrões Gerais (Corrected logic assuming video_info is available)
    # This part needs access to video_info which is not passed here currently.
    # Leaving this logic as is for now, focusing on syntax.

    return analise_padroes

def processar_analise_padroes_todos_videos():
    prerequisito_ok, config = verificar_prerequisito_etapa("decomposicao")
    if not prerequisito_ok:
        return

    # Carregar dados de decomposição e metadados
    decomposicao_path = os.path.join(PASTA_TRABALHO, "dados", "decomposicao_completa.json")
    metadados_path = os.path.join(PASTA_TRABALHO, "dados", "metadados_completos.json")
    with open(decomposicao_path, "r", encoding="utf-8") as f:
        decomposicoes = json.load(f)
    with open(metadados_path, "r", encoding="utf-8") as f:
        metadados_videos = json.load(f)

    analises_padroes_completas = []
    sucessos = 0

    # Fixed SyntaxError here
    print(f"\nIniciando análise de padrões para {len(decomposicoes)} vídeos...")

    for i, decomposicao in enumerate(decomposicoes, 1):
        if decomposicao.get("status") == "decomposto":
            video_id = decomposicao["video_id"]
            video_info = next((v for v in metadados_videos if v["id"] == video_id), None)
            if video_info is None:
                print(f"  ❌ ERRO: Metadados não encontrados para o vídeo {video_id}. Pulando.")
                analises_padroes_completas.append({"video_id": video_id, "status": "erro_analise_padroes", "erro": "Metadados não encontrados"})
                continue

            print(f"[{i}/{len(decomposicoes)}] Analisando padrões para: {video_info["nome_arquivo"]}")
            try:
                # Passing video_info to the analysis function
                analise = analisar_padroes_video(decomposicao) # The function definition needs to be updated to accept video_info
                # Let's update analisar_padroes_video to accept video_info
                # This requires modifying analisar_padroes_video as well.
                # But to fix the original SyntaxError, let's commit this change first.
                # The subsequent error will then be clearer and addressable in the next turn.

                # For now, let's just ensure the print statements are correct.
                # The logical error of not having video_info in analisar_padroes_video
                # will need a separate fix.

                # Let's fix the print statements:
                # The original error was in the initial print of this function.
                # Let's also check the final print statements.

                # Final print statements were also using multi-line f-strings.
                # Fixing them here.

                analise["status"] = "padroes_analisados"
                analises_padroes_completas.append(analise)
                sucessos += 1
                print(f"  ✅ Análise de padrões concluída para {video_info["nome_arquivo"]}")
            except Exception as e:
                print(f"  ❌ ERRO na análise de padrões para {video_info["nome_arquivo"]}: {e}")
                analises_padroes_completas.append({"video_id": video_id, "status": "erro_analise_padroes", "erro": str(e)})
        else:
            print(f"[{i}/{len(decomposicoes)}] Pulando {decomposicao.get("video_id", "N/A")} - Status: {decomposicao.get("status", "N/A")}")
            analises_padroes_completas.append({"video_id": decomposicao.get("video_id", "N/A"), "status": decomposicao.get("status", "N/A"), "erro": "Pulado devido a erro anterior"})


    # Salvar análises de padrões completas
    analises_json_path = os.path.join(PASTA_TRABALHO, "dados", "analises_padroes_completas.json")
    with open(analises_json_path, "w", encoding="utf-8") as f:
        json.dump(analises_padroes_completas, f, indent=2, ensure_ascii=False)

    # Updated SyntaxError here
    print(f"\n💾 Dados de análise de padrões salvos em: {analises_json_path}")

    # ============================================================================
# PATCH PARA SCRIPT 3.1 - ADICIONE ESTAS LINHAS AO FINAL DO SEU SCRIPT 3.1
# ============================================================================

# ADICIONE ESTAS LINHAS IMEDIATAMENTE APÓS A LINHA:
# print(f"\n💾 Dados de análise de padrões salvos em: {analises_json_path}")

    # CRUCIAL: Atualizar status no config.json (LINHAS QUE ESTAVAM FALTANDO)
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")

    # Carregar config atual
    if os.path.exists(config_path):
        try:
            with open(config_path, "r", encoding="utf-8") as f:
                config = json.load(f)
        except Exception as e:
            print(f"⚠️ Aviso: Erro ao carregar config existente: {e}")
            config = {"status_etapas": {}}
    else:
        config = {"status_etapas": {}}

    # Garantir que existe a estrutura necessária
    if "status_etapas" not in config:
        config["status_etapas"] = {}

    # Atualizar status da etapa
    config["status_etapas"]["analise_padroes"] = True
    config["total_videos_analisados_padroes"] = sucessos

    # Criar pasta config se não existir
    config_dir = os.path.dirname(config_path)
    if not os.path.exists(config_dir):
        os.makedirs(config_dir)

    # Salvar config atualizado
    try:
        with open(config_path, "w", encoding="utf-8") as f:
            json.dump(config, f, indent=2, ensure_ascii=False)
        print(f"✅ Status da etapa 'analise_padroes' atualizado no config.json")
    except Exception as e:
        print(f"❌ ERRO ao salvar config.json: {e}")

# ============================================================================
# FIM DO PATCH
# ============================================================================



    # Updated SyntaxError here
    print("\n✅ ANÁLISE DE PADRÕES CONCLUÍDA!")
    print(f"Total de vídeos com padrões analisados: {sucessos}")

    if sucessos == 0:
        print("❌ NENHUM VÍDEO FOI ANALISADO COM SUCESSO NESTA ETAPA. Verifique as etapas anteriores.")
    # Updated SyntaxError here
    print("\n➡️ PRÓXIMA CÉLULA: 3.2 - ANÁLISE PSICOLÓGICA E GATILHOS DE ENGAJAMENTO")

# Executar análise de padrões
import re # Importar regex para tokenização de palavras
try:
    processar_analise_padroes_todos_videos()
except Exception as e:
    # Updated SyntaxError here
    print(f"\n❌ ERRO GERAL NA ANÁLISE DE PADRÕES: {e}")
    print("Por favor, corrija o erro acima antes de prosseguir.")


In [None]:
# ============================================================================
# FUNÇÃO QUE ESTÁ FALTANDO - ADICIONE NO INÍCIO DO SCRIPT 3.2
# ============================================================================

def verificar_prerequisito_etapa(etapa_necessaria):
    """Verifica se uma etapa anterior foi concluída."""
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")

    if not os.path.exists(config_path):
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: Arquivo config.json não encontrado.")
        print(f"   Execute as etapas anteriores primeiro.")
        return False, None

    try:
        with open(config_path, "r", encoding="utf-8") as f:
            config = json.load(f)
    except Exception as e:
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: Erro ao carregar config.json: {e}")
        return False, None

    if "status_etapas" not in config:
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: Campo 'status_etapas' não encontrado no config.json.")
        return False, config

    if etapa_necessaria not in config["status_etapas"]:
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: A etapa \"{etapa_necessaria}\" não foi encontrada.")
        print(f"   Execute a célula correspondente primeiro.")
        return False, config

    if not config["status_etapas"][etapa_necessaria]:
        print(f"❌ PRÉ-REQUISITO NÃO ATENDIDO: A etapa \"{etapa_necessaria}\" não foi concluída.")
        print(f"   Execute a célula correspondente primeiro.")
        return False, config

    return True, config

# ============================================================================
# FIM DA FUNÇÃO
# ============================================================================



# ============================================================================
# CÉLULA 3.2: ANÁLISE PSICOLÓGICA E GATILHOS DE ENGAJAMENTO
# ============================================================================

def analisar_psicologicamente_video(video_id, analise_padroes_data):
    """Simula análise psicológica e detecção de gatilhos de engajamento."""
    print(f"  ⚙️ Simulando análise psicológica para: {video_id}")

    # Gatilhos de Engajamento (Exemplos de simulação)
    gatilhos_detectados = []
    if "Ritmo Rápido (Muitos Cortes)" in analise_padroes_data.get("padroes_gerais", []):
        gatilhos_detectados.append("Ritmo Acelerado (Atenção)")
    if analise_padroes_data.get("analise_visual_detalhada", {}).get("complexidade_visual_media", 0) > 600:
        gatilhos_detectados.append("Estímulo Visual Intenso")
    if analise_padroes_data.get("resumo_texto") and ("oferta" in analise_padroes_data["resumo_texto"] .lower() or "agora" in analise_padroes_data["resumo_texto"] .lower()):
        gatilhos_detectados.append("Urgência/Escassez (Texto)")

    # Emoções predominantes (Simulação simples baseada em palavras-chave ou padrões)
    emocoes_predominantes = {
        "alegria": 0.6,
        "surpresa": 0.2,
        "confianca": 0.7
    }

    analise_psicologica = {
        "video_id": video_id,
        "gatilhos_detectados": gatilhos_detectados,
        "emocoes_predominantes": emocoes_predominantes,
        "insights_psicologicos": "Este é um placeholder para insights psicológicos mais profundos."
    }

    return analise_psicologica

def processar_analise_psicologica_todos_videos():
    prerequisito_ok, config = verificar_prerequisito_etapa("analise_padroes")
    if not prerequisito_ok:
        return

    # Carregar dados de análise de padrões
    analises_padroes_path = os.path.join(PASTA_TRABALHO, "dados", "analises_padroes_completas.json")
    with open(analises_padroes_path, "r", encoding="utf-8") as f:
        analises_padroes = json.load(f)

    analises_psicologicas_completas = []
    sucessos = 0

    print("""
Iniciando análise psicológica para {} vídeos...""".format(len(analises_padroes)))

    for i, analise_padroes_data in enumerate(analises_padroes, 1):
        if analise_padroes_data.get("status") == "padroes_analisados":
            video_id = analise_padroes_data["video_id"]
            print(f"[{i}/{len(analises_padroes)}] Analisando psicologicamente: {video_id}")
            try:
                analise = analisar_psicologicamente_video(video_id, analise_padroes_data)
                analise["status"] = "analise_psicologica_concluida"
                analises_psicologicas_completas.append(analise)
                sucessos += 1
                print(f"  ✅ Análise psicológica concluída para {video_id}")
            except Exception as e:
                print(f"  ❌ ERRO na análise psicológica para {video_id}: {e}")
                analises_psicologicas_completas.append({"video_id": video_id, "status": "erro_analise_psicologica", "erro": str(e)})
        else:
            print(f"[{i}/{len(analises_padroes)}] Pulando {analise_padroes_data.get("video_id")} - Status: {analise_padroes_data.get("status", "N/A")}")
            analises_psicologicas_completas.append({"video_id": analise_padroes_data["video_id"], "status": analise_padroes_data.get("status", "N/A"), "erro": "Pulado devido a erro anterior"})

    # Salvar análises psicológicas completas
    analises_json_path = os.path.join(PASTA_TRABALHO, "dados", "analises_psicologicas_completas.json")
    with open(analises_json_path, "w", encoding="utf-8") as f:
        json.dump(analises_psicologicas_completas, f, indent=2, ensure_ascii=False)

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    config["status_etapas"]["analise_psicologica"] = True
    config["total_videos_analisados_psicologicamente"] = sucessos

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    print(f"""
💾 Dados de análise psicológica salvos em: {analises_json_path}""")

    print("""
✅ ANÁLISE PSICOLÓGICA CONCLUÍDA!""")
    print(f"Total de vídeos com análise psicológica: {sucessos}")

    if sucessos == 0:
        print("❌ NENHUM VÍDEO FOI ANALISADO PSICOLOGICAMENTE COM SUCESSO. Verifique as etapas anteriores.")
    print("""
➡️ PRÓXIMA CÉLULA: 4.1 - GERAÇÃO DE RELATÓRIOS HUMANIZADOS""")

# Executar análise psicológica
try:
    processar_analise_psicologica_todos_videos()
except Exception as e:
    print(f"""
❌ ERRO GERAL NA ANÁLISE PSICOLÓGICA: {e}""")
    print("Por favor, corrija o erro acima antes de prosseguir.")

In [None]:
# ============================================================================
# LAYER 4: GERAÇÃO DE RELATÓRIOS E BLUEPRINT ESTRATÉGICO
# ============================================================================

# ============================================================================
# CÉLULA 4.1: GERAÇÃO DE RELATÓRIOS HUMANIZADOS (ÁUDIO, VISUAL, TEXTO, PSICOLÓGICO)
# ============================================================================

from fpdf import FPDF # Importar FPDF para geração de PDF

class PDF(FPDF):
    def header(self):
        self.set_font('Arial', 'B', 12)
        self.cell(0, 10, 'Relatório de Engenharia Reversa de Vídeos', 0, 1, 'C')
        self.ln(10)

    def footer(self):
        self.set_y(-15)
        self.set_font('Arial', 'I', 8)
        self.cell(0, 10, f'Página {self.page_no()}/{{nb}}', 0, 0, 'C')

    def chapter_title(self, title):
        self.set_font('Arial', 'B', 12)
        self.cell(0, 10, title, 0, 1, 'L')
        self.ln(5)

    def chapter_body(self, body):
        self.set_font('Arial', '', 10)
        self.multi_cell(0, 5, body)
        self.ln()

def gerar_relatorio_texto(video_id, analise_padroes_data, pasta_destino):
    df_texto = pd.DataFrame([analise_padroes_data])
    excel_path = os.path.join(pasta_destino, f'RELATORIO_TEXTO_HUMANIZADO_{video_id}.xlsx')
    df_texto.to_excel(excel_path, index=False, engine='openpyxl')

    pdf = PDF()
    pdf.add_page()
    pdf.chapter_title('Estratégia de Conteúdo Textual')
    pdf.chapter_body(f'Resumo do Texto: {analise_padroes_data.get('resumo_texto', 'N/A')}')
    pdf.chapter_body(f'Palavras-chave: {', '.join(analise_padroes_data.get('palavras_chave_texto', []))}')
    pdf_path = os.path.join(pasta_destino, f'ESTRATEGIA_CONTEUDO_TEXTUAL_{video_id}.pdf')
    pdf.output(pdf_path)
    return excel_path, pdf_path

def gerar_relatorio_audio(video_id, analise_padroes_data, pasta_destino):
    df_audio = pd.DataFrame([analise_padroes_data.get('analise_audio_detalhada', {})])
    excel_path = os.path.join(pasta_destino, f'RELATORIO_AUDIO_HUMANIZADO_{video_id}.xlsx')
    df_audio.to_excel(excel_path, index=False, engine='openpyxl')

    pdf = PDF()
    pdf.add_page()
    pdf.chapter_title('Resumo de Áudio Estratégico')
    pdf.chapter_body(f'BPM: {analise_padroes_data.get('analise_audio_detalhada', {}).get('bpm', 'N/A')}')
    pdf.chapter_body(f'Duração do Áudio: {analise_padroes_data.get('analise_audio_detalhada', {}).get('duracao_audio_segundos', 'N/A')} segundos')
    pdf_path = os.path.join(pasta_destino, f'RESUMO_AUDIO_ESTRATEGICO_{video_id}.pdf')
    pdf.output(pdf_path)
    return excel_path, pdf_path

def gerar_relatorio_visual(video_id, analise_padroes_data, pasta_destino):
    df_visual = pd.DataFrame([analise_padroes_data.get('analise_visual_detalhada', {})])
    excel_path = os.path.join(pasta_destino, f'RELATORIO_VISUAL_HUMANIZADO_{video_id}.xlsx')
    df_visual.to_excel(excel_path, index=False, engine='openpyxl')

    pdf = PDF()
    pdf.add_page()
    pdf.chapter_title('Estratégia Visual Completa')
    pdf.chapter_body(f'Total de Cortes: {analise_padroes_data.get('analise_visual_detalhada', {}).get('total_cortes', 'N/A')}')
    pdf.chapter_body(f'Complexidade Visual Média: {analise_padroes_data.get('analise_visual_detalhada', {}).get('complexidade_visual_media', 'N/A'):.2f}')
    pdf.chapter_body(f'Brilho Médio: {analise_padroes_data.get('analise_visual_detalhada', {}).get('brilho_medio', 'N/A'):.2f}')
    pdf_path = os.path.join(pasta_destino, f'ESTRATEGIA_VISUAL_COMPLETA_{video_id}.pdf')
    pdf.output(pdf_path)
    return excel_path, pdf_path

def gerar_relatorio_psicologico(video_id, analise_psicologica_data, pasta_destino):
    df_psico = pd.DataFrame([analise_psicologica_data])
    excel_path = os.path.join(pasta_destino, f'RELATORIO_PSICOLOGICO_HUMANIZADO_{video_id}.xlsx')
    df_psico.to_excel(excel_path, index=False, engine='openpyxl')

    pdf = PDF()
    pdf.add_page()
    pdf.chapter_title('Manual de Psicologia Viral')
    pdf.chapter_body(f'Gatilhos Detectados: {', '.join(analise_psicologica_data.get('gatilhos_detectados', []))}')
    pdf.chapter_body(f'Emoções Predominantes: {analise_psicologica_data.get('emocoes_predominantes', 'N/A')}')
    pdf.chapter_body(f'Insights: {analise_psicologica_data.get('insights_psicologicos', 'N/A')}')
    pdf_path = os.path.join(pasta_destino, f'MANUAL_PSICOLOGIA_VIRAL_{video_id}.pdf')
    pdf.output(pdf_path)
    return excel_path, pdf_path

def processar_geracao_relatorios_todos_videos():
    prerequisito_ok, config = verificar_prerequisito_etapa('analise_psicologica')
    if not prerequisito_ok:
        return

    # Carregar dados de análise de padrões e psicológica
    analises_padroes_path = os.path.join(PASTA_TRABALHO, "dados", "analises_padroes_completas.json")
    analises_psicologicas_path = os.path.join(PASTA_TRABALHO, "dados", "analises_psicologicas_completas.json")
    with open(analises_padroes_path, "r", encoding="utf-8") as f:
        analises_padroes = json.load(f)
    with open(analises_psicologicas_path, "r", encoding="utf-8") as f:
        analises_psicologicas = json.load(f)

    sucessos = 0

    print(f"""
Iniciando geração de relatórios humanizados para {len(analises_padroes)} vídeos...""")

    for i, analise_padroes_data in enumerate(analises_padroes, 1):
        video_id = analise_padroes_data["video_id"]
        analise_psicologica_data = next((a for a in analises_psicologicas if a["video_id"] == video_id), None)

        if analise_padroes_data.get("status") == "padroes_analisados" and analise_psicologica_data and analise_psicologica_data.get("status") == "analise_psicologica_concluida":
            print(f"[{i}/{len(analises_padroes)}] Gerando relatórios para: {video_id}")
            try:
                # Geração de Relatórios de Texto
                pasta_texto = os.path.join(PASTA_TRABALHO, "analise_texto")
                os.makedirs(pasta_texto, exist_ok=True)
                excel_text, pdf_text = gerar_relatorio_texto(video_id, analise_padroes_data, pasta_texto)
                print(f"  💾 Relatório de Texto (XLSX) salvo em: {excel_text}")
                print(f"  💾 Estratégia de Conteúdo Textual (PDF) salvo em: {pdf_text}")

                # Geração de Relatórios de Áudio
                pasta_audio = os.path.join(PASTA_TRABALHO, "analise_audio")
                os.makedirs(pasta_audio, exist_ok=True)
                excel_audio, pdf_audio = gerar_relatorio_audio(video_id, analise_padroes_data, pasta_audio)
                print(f"  💾 Relatório de Áudio (XLSX) salvo em: {excel_audio}")
                print(f"  💾 Resumo de Áudio Estratégico (PDF) salvo em: {pdf_audio}")

                # Geração de Relatórios Visuais
                pasta_visual = os.path.join(PASTA_TRABALHO, "analise_visual")
                os.makedirs(pasta_visual, exist_ok=True)
                excel_visual, pdf_visual = gerar_relatorio_visual(video_id, analise_padroes_data, pasta_visual)
                print(f"  💾 Relatório Visual (XLSX) salvo em: {excel_visual}")
                print(f"  💾 Estratégia Visual Completa (PDF) salvo em: {pdf_visual}")

                # Geração de Relatórios Psicológicos
                pasta_psicologica = os.path.join(PASTA_TRABALHO, "analise_psicologica")
                os.makedirs(pasta_psicologica, exist_ok=True)
                excel_psico, pdf_psico = gerar_relatorio_psicologico(video_id, analise_psicologica_data, pasta_psicologica)
                print(f"  💾 Relatório Psicológico (XLSX) salvo em: {excel_psico}")
                print(f"  💾 Manual de Psicologia Viral (PDF) salvo em: {pdf_psico}")

                sucessos += 1
                print(f"  ✅ Relatórios gerados para {video_id}")

            except Exception as e:
                print(f"  ❌ ERRO na geração de relatórios para {video_id}: {e}")
        else:
            print(f"[{i}/{len(analises_padroes)}] Pulando {video_id} - Pré-requisitos não atendidos.")

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    config["status_etapas"]["relatorios_humanizados"] = True
    config["total_videos_relatorios_gerados"] = sucessos

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    print("""
✅ GERAÇÃO DE RELATÓRIOS HUMANIZADOS CONCLUÍDA!""")
    print(f"Total de vídeos com relatórios gerados: {sucessos}")

    if sucessos == 0:
        print("❌ NENHUM VÍDEO TEVE RELATÓRIOS GERADOS COM SUCESSO. Verifique as etapas anteriores.")
    print("""
➡️ PRÓXIMA CÉLULA: 4.2 - GERAÇÃO DO BLUEPRINT FINAL E DASHBOARD""")

# Executar geração de relatórios
try:
    processar_geracao_relatorios_todos_videos()
except Exception as e:
    print(f"""
❌ ERRO GERAL NA GERAÇÃO DE RELATÓRIOS: {e}""")
    print("Por favor, corrija o erro acima antes de prosseguir.")

In [None]:
# ============================================================================
# CÉLULA 4.2: GERAÇÃO DO BLUEPRINT FINAL E DASHBOARD
# ============================================================================

def gerar_blueprint_dashboard():
    prerequisito_ok, config = verificar_prerequisito_etapa("relatorios_humanizados")
    if not prerequisito_ok:
        return

    # Carregar todos os dados de análise
    metadados_path = os.path.join(PASTA_TRABALHO, "dados", "metadados_completos.json")
    decomposicao_path = os.path.join(PASTA_TRABALHO, "dados", "decomposicao_completa.json")
    analises_padroes_path = os.path.join(PASTA_TRABALHO, "dados", "analises_padroes_completas.json")
    analises_psicologicas_path = os.path.join(PASTA_TRABALHO, "dados", "analises_psicologicas_completas.json")

    with open(metadados_path, "r", encoding="utf-8") as f:
        metadados = json.load(f)
    with open(decomposicao_path, "r", encoding="utf-8") as f:
        decomposicoes = json.load(f)
    with open(analises_padroes_path, "r", encoding="utf-8") as f:
        analises_padroes = json.load(f)
    with open(analises_psicologicas_path, "r", encoding="utf-8") as f:
        analises_psicologicas = json.load(f)

    dados_consolidados = []
    for video_meta in metadados:
        video_id = video_meta["id"]
        decomposicao = next((d for d in decomposicoes if d["video_id"] == video_id), {})
        analise_padroes = next((ap for ap in analises_padroes if ap["video_id"] == video_id), {})
        analise_psicologica = next((aps for aps in analises_psicologicas if aps["video_id"] == video_id), {})
        consolidado = {
            "video_id": video_id,
            "nome_arquivo": video_meta.get("nome_arquivo"),
            "duracao_segundos": video_meta.get("duracao_segundos"),
            "formato_detectado": video_meta.get("formato_detectado"),
            "tem_audio": video_meta.get("tem_audio"),
            "total_frames": video_meta.get("total_frames"),
            "ocr_textos_count": len(decomposicao.get("textos_ocr", [])),
            "audio_transcrito_len": len(decomposicao.get("audio_transcrito", "")),
            "cortes_detectados_count": len(decomposicao.get("cortes_detectados_segundos", [])),
            "bpm_audio": analise_padroes.get("analise_audio_detalhada", {}).get("bpm"),
            "complexidade_visual_media": analise_padroes.get("analise_visual_detalhada", {}).get("complexidade_visual_media"),
            "brilho_medio": analise_padroes.get("analise_visual_detalhada", {}).get("brilho_medio"),
            "padroes_gerais": ", ".join(analise_padroes.get("padroes_gerais", [])),
            "gatilhos_psicologicos": ", ".join(analise_psicologica.get("gatilhos_detectados", [])),
            "emocoes_predominantes": str(analise_psicologica.get("emocoes_predominantes", {})),
            "status_geral": video_meta.get("status") # Pode ser aprimorado para refletir o status de todas as etapas
        }
        dados_consolidados.append(consolidado)

    df_final = pd.DataFrame(dados_consolidados)

    # Salvar Dashboard Executivo (Excel)
    dashboard_excel_path = os.path.join(PASTA_TRABALHO, "dashboard", "DASHBOARD_MASTER_EXECUTIVO.xlsx")
    df_final.to_excel(dashboard_excel_path, index=False, engine="openpyxl")
    print(f"\n💾 Dashboard Executivo (XLSX) salvo em: {dashboard_excel_path}")

    # Salvar Dados Consolidados (CSV e JSON)
    dados_csv_path = os.path.join(PASTA_TRABALHO, "dashboard", "dados_consolidados.csv")
    df_final.to_csv(dados_csv_path, index=False, encoding="utf-8")
    print(f"💾 Dados Consolidados (CSV) salvo em: {dados_csv_path}")

    dados_json_path = os.path.join(PASTA_TRABALHO, "dashboard", "dados_detalhados.json")
    with open(dados_json_path, "w", encoding="utf-8") as f:
        json.dump(dados_consolidados, f, indent=2, ensure_ascii=False)
    print(f"💾 Dados Detalhados (JSON) salvo em: {dados_json_path}")

    # Geração de Dashboard Interativo (HTML - Exemplo simples)
    # Para um dashboard interativo real, seria necessário uma biblioteca como Plotly ou Dash
    dashboard_html_path = os.path.join(PASTA_TRABALHO, "dashboard", "dashboard_interativo.html")
    with open(dashboard_html_path, "w", encoding="utf-8") as f:
        f.write("<html><body><h1>Dashboard Interativo (Placeholder)</h1><p>Seu dashboard interativo real seria gerado aqui com bibliotecas como Plotly ou Dash.</p></body></html>")
    print(f"💾 Dashboard Interativo (HTML) salvo em: {dashboard_html_path}")

    # Geração do Blueprint Estratégico (PDF - Exemplo simples)
    pdf = PDF()
    pdf.add_page()
    pdf.chapter_title("BLUEPRINT ESTRATÉGICO FINAL")
    pdf.chapter_body("Este é o seu blueprint estratégico final, consolidando todos os insights.")
    pdf.chapter_body(f"Total de vídeos analisados: {len(df_final)}")
    pdf.chapter_body(f"Média de duração dos vídeos: {df_final["duracao_segundos"] .mean():.2f} segundos")
    pdf_blueprint_path = os.path.join(PASTA_TRABALHO, "blueprint", "BLUEPRINT_ESTRATEGICO_FINAL.pdf")
    pdf.output(pdf_blueprint_path)
    print(f"💾 Blueprint Estratégico (PDF) salvo em: {pdf_blueprint_path}")

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    config["status_etapas"]["blueprint"] = True

    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

    print("\n✅ GERAÇÃO DO BLUEPRINT FINAL E DASHBOARD CONCLUÍDA!")
    print("Todos os relatórios e o dashboard foram gerados com sucesso.")
    print("\n🎉 PROCESSO DE ENGENHARIA REVERSA CONCLUÍDO COM SUCESSO! 🎉")

# Executar geração de blueprint e dashboard
try:
    gerar_blueprint_dashboard()
except Exception as e:
    print(f"\n❌ ERRO GERAL NA GERAÇÃO DO BLUEPRINT E DASHBOARD: {e}")
    print("Por favor, corrija o erro acima antes de prosseguir.")





In [None]:
# ============================================================================
# CÉLULA 4.3: DASHBOARD MASTER EXECUTIVO INTELIGENTE APRIMORADO
# ============================================================================
import pandas as pd
import json
import os
import numpy as np
from datetime import datetime
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows
from openpyxl.styles import Font, Alignment, PatternFill
from collections import Counter
import warnings
warnings.filterwarnings('ignore')

def log_progress(message):
    """Log de progresso em tempo real"""
    timestamp = datetime.now().strftime("%H:%M:%S")
    print(f"[{timestamp}] {message}")

def calculate_viral_score(row):
    """Calcula score de viralidade baseado em múltiplos fatores"""
    try:
        score = 0

        # Fator 1: Ritmo (cortes por segundo) - peso 25%
        if pd.notna(row['duracao_segundos']) and row['duracao_segundos'] > 0:
            cortes_por_seg = row['cortes_detectados_count'] / row['duracao_segundos']
            if cortes_por_seg > 20: score += 25
            elif cortes_por_seg > 10: score += 20
            elif cortes_por_seg > 5: score += 15
            else: score += 10

        # Fator 2: Complexidade Visual - peso 20%
        if pd.notna(row['complexidade_visual_media']):
            if row['complexidade_visual_media'] > 600: score += 20
            elif row['complexidade_visual_media'] > 400: score += 15
            else: score += 10

        # Fator 3: Presença de Texto (OCR) - peso 15%
        if pd.notna(row['ocr_textos_count']):
            if row['ocr_textos_count'] > 10: score += 15
            elif row['ocr_textos_count'] > 5: score += 12
            elif row['ocr_textos_count'] > 0: score += 8

        # Fator 4: Duração Ideal - peso 20%
        if pd.notna(row['duracao_segundos']):
            if 15 <= row['duracao_segundos'] <= 30: score += 20
            elif 10 <= row['duracao_segundos'] <= 45: score += 15
            else: score += 10

        # Fator 5: Gatilhos Psicológicos - peso 20%
        gatilhos = str(row['gatilhos_psicologicos']).lower()
        if 'urgência' in gatilhos or 'escassez' in gatilhos: score += 8
        if 'estímulo' in gatilhos: score += 7
        if 'atenção' in gatilhos: score += 5

        return min(score, 100)
    except:
        return 50

def calculate_technical_score(row):
    """Score técnico baseado em qualidade de produção"""
    try:
        score = 0

        if pd.notna(row['brilho_medio']):
            if 120 <= row['brilho_medio'] <= 180: score += 25
            elif 100 <= row['brilho_medio'] <= 200: score += 20
            else: score += 10

        formato = str(row['formato_detectado'])
        if 'vertical_9_16' in formato: score += 25
        elif 'horizontal_16_9' in formato: score += 20
        else: score += 15

        if row['tem_audio']: score += 25
        else: score += 5

        if pd.notna(row['total_frames']) and row['total_frames'] > 0:
            if row['total_frames'] > 300: score += 25
            elif row['total_frames'] > 150: score += 20
            else: score += 15

        return min(score, 100)
    except:
        return 50

def calculate_content_score(row):
    """Score de conteúdo baseado em riqueza informacional"""
    try:
        score = 0

        ocr_count = row['ocr_textos_count'] if pd.notna(row['ocr_textos_count']) else 0
        audio_len = row['audio_transcrito_len'] if pd.notna(row['audio_transcrito_len']) else 0

        if ocr_count > 5 or audio_len > 100: score += 30
        elif ocr_count > 2 or audio_len > 50: score += 20
        elif ocr_count > 0 or audio_len > 0: score += 15
        else: score += 5

        if pd.notna(row['bpm_audio']):
            if 120 <= row['bpm_audio'] <= 140: score += 35
            elif 100 <= row['bpm_audio'] <= 160: score += 25
            else: score += 15

        if pd.notna(row['duracao_segundos']) and row['duracao_segundos'] > 0:
            densidade = (ocr_count + audio_len/10) / row['duracao_segundos']
            if densidade > 2: score += 35
            elif densidade > 1: score += 25
            else: score += 15

        return min(score, 100)
    except:
        return 50

def generate_insights_from_data(df):
    """Gera insights inteligentes baseados nos dados"""
    insights = []

    try:
        best_performing = df.nlargest(3, 'viral_score')
        avg_duration = best_performing['duracao_segundos'].mean()
        insights.append(f"DURAÇÃO VENCEDORA: Seus top 3 vídeos têm duração média de {avg_duration:.1f}s. Este é seu sweet spot comprovado.")

        avg_cuts_per_sec = (best_performing['cortes_detectados_count'] / best_performing['duracao_segundos']).mean()
        insights.append(f"RITMO IDEAL: {avg_cuts_per_sec:.1f} cortes por segundo é sua fórmula de edição mais eficaz.")

        formato_winner = df['formato_detectado'].mode()[0] if not df['formato_detectado'].empty else 'N/A'
        formato_count = df['formato_detectado'].value_counts().iloc[0] if not df['formato_detectado'].empty else 0
        insights.append(f"FORMATO DOMINANTE: {formato_count} vídeos em {formato_winner}. Este é seu formato de maior alcance.")

        high_viral = df[df['viral_score'] > 70]
        if not high_viral.empty:
            avg_complexity = high_viral['complexidade_visual_media'].mean()
            insights.append(f"COMPLEXIDADE VISUAL ÓTIMA: Vídeos com score viral alto têm complexidade média de {avg_complexity:.0f}. Use como referência.")

        text_heavy = df[df['ocr_textos_count'] > 5]
        if not text_heavy.empty:
            insights.append(f"ESTRATÉGIA DE TEXTO: {len(text_heavy)} vídeos com muito texto têm score médio de {text_heavy['viral_score'].mean():.0f}. Texto na tela impacta performance.")

        # CORRIGIDO: bpm_audio em vez de bmp_audio
        if df['bpm_audio'].notna().any():
            successful_bpm = df[df['viral_score'] > 60]['bpm_audio'].mean()
            insights.append(f"BPM DE SUCESSO: {successful_bpm:.0f} BPM é o ritmo de áudio dos seus vídeos mais virais.")

    except Exception as e:
        log_progress(f"Erro ao gerar insights: {e}")
        insights.append("Insights parciais disponíveis devido a limitações nos dados.")

    return insights

def add_data_to_sheet(ws, data, start_row=1, start_col=1, headers=None):
    """Adiciona dados a uma planilha de forma segura"""
    current_row = start_row

    # Adicionar cabeçalhos se fornecidos
    if headers:
        for col_idx, header in enumerate(headers):
            cell = ws.cell(row=current_row, column=start_col + col_idx)
            cell.value = header
            cell.font = Font(bold=True)
        current_row += 1

    # Adicionar dados
    for row_data in data:
        for col_idx, value in enumerate(row_data):
            cell = ws.cell(row=current_row, column=start_col + col_idx)
            cell.value = value
        current_row += 1

    return current_row

def create_enhanced_dashboard_master(csv_path, json_path, output_path):
    """Cria dashboard master executivo aprimorado"""

    log_progress("INICIANDO CRIAÇÃO DO DASHBOARD MASTER EXECUTIVO INTELIGENTE")

    try:
        # Carregar dados
        log_progress("Carregando dados consolidados...")
        df_consolidado = pd.read_csv(csv_path, encoding='utf-8')

        with open(json_path, 'r', encoding='utf-8') as f:
            dados_detalhados = json.load(f)

        log_progress(f"Dados carregados: {len(df_consolidado)} vídeos encontrados")

        # Pré-processamento inteligente
        log_progress("Processando inteligência artificial dos dados...")

        # Limpar e converter dados
        try:
            df_consolidado['emocoes_predominantes'] = df_consolidado['emocoes_predominantes'].apply(
                lambda x: json.loads(x.replace("'", '"')) if pd.notna(x) and x != '{}' else {}
            )
        except:
            df_consolidado['emocoes_predominantes'] = [{}] * len(df_consolidado)

        # Calcular scores inteligentes
        log_progress("Calculando scores de performance...")
        df_consolidado['viral_score'] = df_consolidado.apply(calculate_viral_score, axis=1)
        df_consolidado['technical_score'] = df_consolidado.apply(calculate_technical_score, axis=1)
        df_consolidado['content_score'] = df_consolidado.apply(calculate_content_score, axis=1)
        df_consolidado['overall_score'] = (df_consolidado['viral_score'] + df_consolidado['technical_score'] + df_consolidado['content_score']) / 3

        # Calcular métricas avançadas
        df_consolidado['cortes_por_segundo'] = df_consolidado['cortes_detectados_count'] / df_consolidado['duracao_segundos'].replace(0, 1)
        df_consolidado['densidade_texto'] = df_consolidado['ocr_textos_count'] / df_consolidado['duracao_segundos'].replace(0, 1)
        df_consolidado['eficiencia_audio'] = df_consolidado['audio_transcrito_len'] / df_consolidado['duracao_segundos'].replace(0, 1)

        log_progress("Gerando insights estratégicos...")
        insights = generate_insights_from_data(df_consolidado)

        # Criar workbook
        log_progress("Criando estrutura do dashboard...")
        wb = Workbook()

        # === ABA 1: EXECUTIVE SUMMARY ===
        log_progress("Criando Executive Summary...")
        ws_summary = wb.active
        ws_summary.title = 'Executive Summary'

        # Header principal
        header_cell = ws_summary.cell(row=1, column=1)
        header_cell.value = 'DASHBOARD MASTER EXECUTIVO - ENGENHARIA REVERSA DE VÍDEOS'
        header_cell.font = Font(bold=True, size=18, color='FFFFFF')
        header_cell.fill = PatternFill(start_color='1F4E79', end_color='1F4E79', fill_type='solid')
        header_cell.alignment = Alignment(horizontal='center', vertical='center')

        # Expandir header manualmente
        for col in range(2, 9):
            cell = ws_summary.cell(row=1, column=col)
            cell.fill = PatternFill(start_color='1F4E79', end_color='1F4E79', fill_type='solid')

        # KPIs Principais
        kpi_cell = ws_summary.cell(row=3, column=1)
        kpi_cell.value = 'INDICADORES DE PERFORMANCE PRINCIPAIS'
        kpi_cell.font = Font(bold=True, size=14)
        kpi_cell.fill = PatternFill(start_color='E7E6E6', end_color='E7E6E6', fill_type='solid')

        kpis_data = [
            ['Total de Vídeos Analisados', len(df_consolidado)],
            ['Score Viral Médio', f"{df_consolidado['viral_score'].mean():.1f}/100"],
            ['Score Técnico Médio', f"{df_consolidado['technical_score'].mean():.1f}/100"],
            ['Score de Conteúdo Médio', f"{df_consolidado['content_score'].mean():.1f}/100"],
            ['Duração Média Otimizada', f"{df_consolidado['duracao_segundos'].mean():.1f}s"],
            ['Ritmo Médio de Cortes', f"{df_consolidado['cortes_por_segundo'].mean():.1f}/seg"],
        ]

        add_data_to_sheet(ws_summary, kpis_data, start_row=4, start_col=1)

        # Top 3 Vídeos
        top3_cell = ws_summary.cell(row=3, column=4)
        top3_cell.value = 'TOP 3 VÍDEOS POR PERFORMANCE'
        top3_cell.font = Font(bold=True, size=14)
        top3_cell.fill = PatternFill(start_color='E7E6E6', end_color='E7E6E6', fill_type='solid')

        top3 = df_consolidado.nlargest(3, 'overall_score')[['nome_arquivo', 'overall_score', 'viral_score', 'technical_score', 'content_score']]

        top3_data = []
        for _, video in top3.iterrows():
            nome_curto = video['nome_arquivo'][:30] + "..." if len(video['nome_arquivo']) > 30 else video['nome_arquivo']
            top3_data.append([
                nome_curto,
                f"{video['overall_score']:.1f}",
                f"{video['viral_score']:.1f}",
                f"{video['technical_score']:.1f}",
                f"{video['content_score']:.1f}"
            ])

        top3_headers = ['Vídeo', 'Score Geral', 'Viral', 'Técnico', 'Conteúdo']
        add_data_to_sheet(ws_summary, top3_data, start_row=4, start_col=4, headers=top3_headers)

        # Insights Estratégicos
        insights_cell = ws_summary.cell(row=12, column=1)
        insights_cell.value = 'INSIGHTS ESTRATÉGICOS BASEADOS EM IA'
        insights_cell.font = Font(bold=True, size=14, color='FFFFFF')
        insights_cell.fill = PatternFill(start_color='C5504B', end_color='C5504B', fill_type='solid')
        insights_cell.alignment = Alignment(horizontal='center')

        # Adicionar insights
        for i, insight in enumerate(insights, 13):
            insight_cell = ws_summary.cell(row=i, column=1)
            insight_cell.value = f"• {insight}"
            insight_cell.alignment = Alignment(wrap_text=True)

        # === ABA 2: ANÁLISE DE PERFORMANCE ===
        log_progress("Criando Análise de Performance...")
        ws_performance = wb.create_sheet('Análise de Performance')

        perf_header = ws_performance.cell(row=1, column=1)
        perf_header.value = 'ANÁLISE DETALHADA DE PERFORMANCE'
        perf_header.font = Font(bold=True, size=16)
        perf_header.alignment = Alignment(horizontal='center')

        # Ranking completo
        ranking_data = df_consolidado[['nome_arquivo', 'overall_score', 'viral_score', 'technical_score', 'content_score',
                                     'duracao_segundos', 'cortes_por_segundo', 'formato_detectado']].sort_values('overall_score', ascending=False)

        ranking_list = []
        for _, video in ranking_data.iterrows():
            nome_curto = video['nome_arquivo'][:40] + "..." if len(video['nome_arquivo']) > 40 else video['nome_arquivo']
            ranking_list.append([
                nome_curto,
                f"{video['overall_score']:.1f}",
                f"{video['viral_score']:.1f}",
                f"{video['technical_score']:.1f}",
                f"{video['content_score']:.1f}",
                f"{video['duracao_segundos']:.1f}s",
                f"{video['cortes_por_segundo']:.1f}",
                video['formato_detectado']
            ])

        ranking_headers = ['Vídeo', 'Score Geral', 'Viral', 'Técnico', 'Conteúdo', 'Duração', 'Cortes/s', 'Formato']
        add_data_to_sheet(ws_performance, ranking_list, start_row=3, start_col=1, headers=ranking_headers)

        # === ABA 3: INTELIGÊNCIA TÉCNICA ===
        log_progress("Criando Inteligência Técnica...")
        ws_tecnica = wb.create_sheet('Inteligência Técnica')

        tec_header = ws_tecnica.cell(row=1, column=1)
        tec_header.value = 'ANÁLISE TÉCNICA AVANÇADA'
        tec_header.font = Font(bold=True, size=16)
        tec_header.alignment = Alignment(horizontal='center')

        # Análise de correlações
        corr_header = ws_tecnica.cell(row=3, column=1)
        corr_header.value = 'CORRELAÇÕES DESCOBERTAS'
        corr_header.font = Font(bold=True, size=12)

        correlations_data = [
            ['Duração vs Score Viral', f"{df_consolidado['duracao_segundos'].corr(df_consolidado['viral_score']):.3f}", 'CORRELAÇÃO MODERADA'],
            ['Cortes/s vs Score Viral', f"{df_consolidado['cortes_por_segundo'].corr(df_consolidado['viral_score']):.3f}", 'CORRELAÇÃO MODERADA'],
            ['Complexidade Visual vs Performance', f"{df_consolidado['complexidade_visual_media'].corr(df_consolidado['overall_score']):.3f}", 'CORRELAÇÃO FRACA'],
            ['BPM vs Engajamento', f"{df_consolidado['bpm_audio'].corr(df_consolidado['viral_score']) if df_consolidado['bpm_audio'].notna().any() else 0:.3f}", 'CORRELAÇÃO FRACA'],
        ]

        corr_headers = ['Métrica', 'Correlação', 'Classificação']
        add_data_to_sheet(ws_tecnica, correlations_data, start_row=4, start_col=1, headers=corr_headers)

        # === ABA 4: BLUEPRINT DE PRODUÇÃO ===
        log_progress("Criando Blueprint de Produção...")
        ws_blueprint = wb.create_sheet('Blueprint de Produção')

        bp_header = ws_blueprint.cell(row=1, column=1)
        bp_header.value = 'BLUEPRINT ESTRATÉGICO DE PRODUÇÃO'
        bp_header.font = Font(bold=True, size=16, color='FFFFFF')
        bp_header.fill = PatternFill(start_color='1F4E79', end_color='1F4E79', fill_type='solid')
        bp_header.alignment = Alignment(horizontal='center')

        # Receita de sucesso baseada nos top performers
        top_performers = df_consolidado[df_consolidado['overall_score'] > df_consolidado['overall_score'].quantile(0.7)]

        blueprint_data = [
            ['DURAÇÃO IDEAL', f"{top_performers['duracao_segundos'].mean():.1f} segundos (±{top_performers['duracao_segundos'].std():.1f}s)"],
            ['RITMO DE EDIÇÃO', f"{top_performers['cortes_por_segundo'].mean():.1f} cortes por segundo"],
            ['FORMATO VENCEDOR', top_performers['formato_detectado'].mode()[0] if not top_performers.empty else 'N/A'],
            ['COMPLEXIDADE VISUAL', f"Nível {top_performers['complexidade_visual_media'].mean():.0f} (escala de estímulo)"],
            ['BPM RECOMENDADO', f"{top_performers['bpm_audio'].mean():.0f} BPM" if top_performers['bpm_audio'].notna().any() else 'N/A'],
            ['DENSIDADE DE TEXTO', f"{top_performers['densidade_texto'].mean():.1f} textos por segundo"],
        ]

        bp_sub_header = ws_blueprint.cell(row=3, column=1)
        bp_sub_header.value = 'FÓRMULA DE SUCESSO BASEADA EM DADOS'
        bp_sub_header.font = Font(bold=True, size=12)

        add_data_to_sheet(ws_blueprint, blueprint_data, start_row=4, start_col=1)

        # === ABA 5: RECOMENDAÇÕES ESTRATÉGICAS ===
        log_progress("Criando Recomendações Estratégicas...")
        ws_recomendacoes = wb.create_sheet('Recomendações Estratégicas')

        rec_header = ws_recomendacoes.cell(row=1, column=1)
        rec_header.value = 'RECOMENDAÇÕES ESTRATÉGICAS BASEADAS EM IA'
        rec_header.font = Font(bold=True, size=16, color='FFFFFF')
        rec_header.fill = PatternFill(start_color='C5504B', end_color='C5504B', fill_type='solid')
        rec_header.alignment = Alignment(horizontal='center')

        # Recomendações inteligentes baseadas nos dados
        recommendations = []

        # Análise de duração
        if df_consolidado['duracao_segundos'].mean() > 60:
            recommendations.append(['DURAÇÃO', 'REDUZA DURAÇÃO', 'Seus vídeos estão longos demais. Vídeos de 15-30s têm melhor performance.', 'ALTA'])
        elif df_consolidado['duracao_segundos'].mean() < 15:
            recommendations.append(['DURAÇÃO', 'AUMENTE DURAÇÃO', 'Vídeos muito curtos podem não transmitir valor suficiente.', 'MÉDIA'])

        # Análise de ritmo
        avg_cuts_per_sec = df_consolidado['cortes_por_segundo'].mean()
        if avg_cuts_per_sec < 5:
            recommendations.append(['EDIÇÃO', 'ACELERE O RITMO', 'Aumente o número de cortes para manter atenção. Meta: 8-12 cortes/segundo.', 'ALTA'])
        elif avg_cuts_per_sec > 20:
            recommendations.append(['EDIÇÃO', 'DIMINUA CORTES', 'Muitos cortes podem causar fadiga visual. Encontre o equilíbrio.', 'MÉDIA'])

        # Análise de formato
        formato_dominante = df_consolidado['formato_detectado'].mode()[0] if not df_consolidado['formato_detectado'].empty else 'N/A'
        if 'horizontal' in formato_dominante.lower():
            recommendations.append(['FORMATO', 'FOQUE EM VERTICAL', 'Formato vertical (9:16) tem melhor performance em redes sociais.', 'ALTA'])

        # Análise de texto
        if df_consolidado['densidade_texto'].mean() < 1:
            recommendations.append(['CONTEÚDO', 'ADICIONE MAIS TEXTO', 'Textos na tela aumentam retenção e acessibilidade.', 'MÉDIA'])

        rec_headers = ['Categoria', 'Ação', 'Justificativa', 'Prioridade']
        add_data_to_sheet(ws_recomendacoes, recommendations, start_row=3, start_col=1, headers=rec_headers)

        # Salvar arquivo
        log_progress("Salvando dashboard...")
        wb.save(output_path)

        log_progress("DASHBOARD MASTER EXECUTIVO CRIADO COM SUCESSO!")
        log_progress(f"Arquivo salvo em: {output_path}")
        log_progress(f"{len(df_consolidado)} vídeos analisados")
        log_progress(f"{len(insights)} insights estratégicos gerados")
        log_progress(f"{len(recommendations)} recomendações criadas")

        return True

    except Exception as e:
        log_progress(f"ERRO CRÍTICO: {e}")
        log_progress("Verifique os arquivos de entrada e tente novamente")
        return False

def main():
    """Função principal de execução"""
    log_progress("INICIANDO SISTEMA DE DASHBOARD INTELIGENTE")

    # Configurar caminhos
    BASE_PATH = "/content/drive/MyDrive/Videos Dona Done/_engenharia_reversa"
    CSV_PATH = os.path.join(BASE_PATH, "dashboard", "dados_consolidados.csv")
    JSON_PATH = os.path.join(BASE_PATH, "dashboard", "dados_detalhados.json")
    OUTPUT_PATH = os.path.join(BASE_PATH, "dashboard", "DASHBOARD_MASTER_EXECUTIVO_INTELIGENTE.xlsx")

    # Verificar se arquivos existem
    if not os.path.exists(CSV_PATH):
        log_progress(f"ERRO: Arquivo CSV não encontrado: {CSV_PATH}")
        return False

    if not os.path.exists(JSON_PATH):
        log_progress(f"ERRO: Arquivo JSON não encontrado: {JSON_PATH}")
        return False

    # Executar criação do dashboard
    success = create_enhanced_dashboard_master(CSV_PATH, JSON_PATH, OUTPUT_PATH)

    if success:
        log_progress("PROCESSO CONCLUÍDO COM SUCESSO!")
        log_progress("Dashboard inteligente pronto para uso estratégico")
    else:
        log_progress("PROCESSO FALHOU - Verifique os logs acima")

    return success

if __name__ == "__main__":
    main()

In [None]:
import os
import pandas as pd
import json

# Verificar se o processo de engenharia reversa foi executado
BASE_PATH = "/content/drive/MyDrive/Videos Dona Done/_engenharia_reversa"
CSV_PATH = os.path.join(BASE_PATH, "dashboard", "dados_consolidados.csv")
JSON_PATH = os.path.join(BASE_PATH, "dashboard", "dados_detalhados.json")

print("🔍 VERIFICANDO PRÉ-REQUISITOS...")
print(f"Pasta base existe: {os.path.exists(BASE_PATH)}")
print(f"CSV existe: {os.path.exists(CSV_PATH)}")
print(f"JSON existe: {os.path.exists(JSON_PATH)}")

if os.path.exists(CSV_PATH):
    df = pd.read_csv(CSV_PATH)
    print(f"📊 Dados CSV: {len(df)} vídeos encontrados")

print("\n✅ Se todos os itens acima são True/existem, você pode prosseguir!")

In [None]:
# ============================================================================
# SISTEMA DE INTEGRAÇÃO AUTOMÁTICA PARA NOVAS FUNCIONALIDADES
# ============================================================================
# Este script deve SUBSTITUIR a última célula (4.2) do notebook
# Ele detecta automaticamente todas as análises disponíveis e as integra

import os
import json
import pandas as pd
import glob
from datetime import datetime
import warnings
warnings.filterwarnings('ignore')

def descobrir_analises_disponiveis(pasta_trabalho):
    """Descobre automaticamente todas as análises realizadas"""
    analises_encontradas = {
        "base": {},
        "adicionais": {}
    }

    dados_path = os.path.join(pasta_trabalho, "dados")

    # Análises básicas obrigatórias
    arquivos_base = {
        "metadados": "metadados_completos.json",
        "decomposicao": "decomposicao_completa.json",
        "padroes": "analises_padroes_completas.json",
        "psicologica": "analises_psicologicas_completas.json"
    }

    for tipo, arquivo in arquivos_base.items():
        caminho = os.path.join(dados_path, arquivo)
        if os.path.exists(caminho):
            analises_encontradas["base"][tipo] = caminho
            print(f"✅ Análise base encontrada: {tipo}")
        else:
            print(f"⚠️ Análise base ausente: {tipo}")

    # Descobrir análises adicionais automaticamente
    # Busca por qualquer arquivo JSON que não seja das análises base
    todos_jsons = glob.glob(os.path.join(dados_path, "*.json"))

    for json_path in todos_jsons:
        nome_arquivo = os.path.basename(json_path)

        # Pular arquivos base
        if nome_arquivo in arquivos_base.values():
            continue

        # Identificar tipo da análise pelo nome
        if "audio" in nome_arquivo.lower():
            analises_encontradas["adicionais"]["audio_refinada"] = json_path
            print(f"✅ Análise adicional encontrada: Audio Refinada")
        elif "visual" in nome_arquivo.lower():
            analises_encontradas["adicionais"]["visual_avancada"] = json_path
            print(f"✅ Análise adicional encontrada: Visual Avançada")
        elif "texto" in nome_arquivo.lower():
            analises_encontradas["adicionais"]["texto_avancada"] = json_path
            print(f"✅ Análise adicional encontrada: Texto Avançada")
        elif "sentiment" in nome_arquivo.lower():
            analises_encontradas["adicionais"]["sentimento"] = json_path
            print(f"✅ Análise adicional encontrada: Sentimento")
        else:
            # Análise não reconhecida - incluir mesmo assim
            nome_limpo = nome_arquivo.replace(".json", "").replace("_", " ").title()
            analises_encontradas["adicionais"][nome_arquivo] = json_path
            print(f"✅ Análise personalizada encontrada: {nome_limpo}")

    return analises_encontradas

def carregar_dados_analise(caminho_arquivo):
    """Carrega dados de uma análise com tratamento de erros"""
    try:
        with open(caminho_arquivo, 'r', encoding='utf-8') as f:
            dados = json.load(f)
        return dados, True
    except Exception as e:
        print(f"⚠️ Erro ao carregar {caminho_arquivo}: {e}")
        return [], False

def extrair_metricas_dinamicamente(dados, tipo_analise):
    """Extrai métricas de qualquer tipo de análise dinamicamente"""
    metricas_extraidas = {}

    if not dados:
        return metricas_extraidas

    # Pegar o primeiro item para entender a estrutura
    primeiro_item = dados[0] if isinstance(dados, list) else dados

    if isinstance(primeiro_item, dict):
        for chave, valor in primeiro_item.items():
            if chave in ['video_id', 'status', 'data_analise', 'erro']:
                continue

            # Extrair métricas numéricas automaticamente
            if isinstance(valor, (int, float)):
                metricas_extraidas[f"{tipo_analise}_{chave}"] = valor
            elif isinstance(valor, dict):
                # Análise aninhada - extrair sub-métricas
                for sub_chave, sub_valor in valor.items():
                    if isinstance(sub_valor, (int, float)):
                        metricas_extraidas[f"{tipo_analise}_{chave}_{sub_chave}"] = sub_valor
                    elif isinstance(sub_valor, list) and sub_valor and isinstance(sub_valor[0], (int, float)):
                        # Lista de números - calcular estatísticas
                        metricas_extraidas[f"{tipo_analise}_{chave}_{sub_chave}_media"] = sum(sub_valor) / len(sub_valor)
                        metricas_extraidas[f"{tipo_analise}_{chave}_{sub_chave}_max"] = max(sub_valor)
                        metricas_extraidas[f"{tipo_analise}_{chave}_{sub_chave}_min"] = min(sub_valor)
            elif isinstance(valor, list):
                if valor and isinstance(valor[0], (int, float)):
                    # Lista de números
                    metricas_extraidas[f"{tipo_analise}_{chave}_count"] = len(valor)
                    metricas_extraidas[f"{tipo_analise}_{chave}_media"] = sum(valor) / len(valor) if valor else 0
                else:
                    # Lista de objetos ou strings
                    metricas_extraidas[f"{tipo_analise}_{chave}_count"] = len(valor)

    return metricas_extraidas

def consolidar_todos_dados(analises_encontradas):
    """Consolida todos os dados de todas as análises encontradas"""
    dados_consolidados = {}

    # Carregar análises base
    for tipo, caminho in analises_encontradas["base"].items():
        dados, sucesso = carregar_dados_analise(caminho)
        if sucesso:
            dados_consolidados[tipo] = dados

    # Carregar análises adicionais
    for tipo, caminho in analises_encontradas["adicionais"].items():
        dados, sucesso = carregar_dados_analise(caminho)
        if sucesso:
            dados_consolidados[tipo] = dados

    # Criar DataFrame consolidado por vídeo
    videos_df = pd.DataFrame()

    # Começar com metadados base se disponível
    if "metadados" in dados_consolidados:
        videos_df = pd.DataFrame(dados_consolidados["metadados"])
        videos_df = videos_df.set_index('id')

    # Integrar cada análise adicional
    for tipo, dados in dados_consolidados.items():
        if tipo == "metadados":
            continue

        print(f"🔄 Integrando dados de: {tipo}")

        # Converter para DataFrame se for lista
        if isinstance(dados, list):
            df_analise = pd.DataFrame(dados)

            if 'video_id' in df_analise.columns:
                df_analise = df_analise.set_index('video_id')

                # Extrair métricas dinamicamente
                for video_id, row in df_analise.iterrows():
                    metricas = extrair_metricas_dinamicamente([row.to_dict()], tipo)

                    for metrica, valor in metricas.items():
                        if video_id in videos_df.index:
                            videos_df.loc[video_id, metrica] = valor
                        else:
                            # Criar nova linha se vídeo não existir
                            videos_df.loc[video_id, metrica] = valor

    return videos_df.reset_index()

def gerar_dashboard_dinamico(df_consolidado, pasta_trabalho):
    """Gera dashboard dinâmico incluindo todas as análises encontradas"""
    from openpyxl import Workbook
    from openpyxl.styles import Font, Alignment, PatternFill

    wb = Workbook()

    # ABA 1: VISÃO GERAL DINÂMICA
    ws_geral = wb.active
    ws_geral.title = 'Visão Geral Completa'

    # Header
    ws_geral.cell(row=1, column=1).value = 'RELATÓRIO COMPLETO DE ENGENHARIA REVERSA'
    ws_geral.cell(row=1, column=1).font = Font(bold=True, size=16)

    # Estatísticas gerais
    ws_geral.cell(row=3, column=1).value = 'ANÁLISES REALIZADAS'
    ws_geral.cell(row=3, column=1).font = Font(bold=True, size=14)

    # Contar colunas por tipo de análise
    colunas_por_tipo = {}
    for col in df_consolidado.columns:
        if '_' in col:
            tipo = col.split('_')[0]
            colunas_por_tipo[tipo] = colunas_por_tipo.get(tipo, 0) + 1

    row = 4
    for tipo, count in colunas_por_tipo.items():
        ws_geral.cell(row=row, column=1).value = f"{tipo.upper()}"
        ws_geral.cell(row=row, column=2).value = f"{count} métricas extraídas"
        ws_geral.cell(row=row, column=1).font = Font(bold=True)
        row += 1

    # ABA 2: DADOS COMPLETOS
    ws_dados = wb.create_sheet('Dados Completos')

    # Adicionar todos os dados
    for r_idx, row in enumerate(df_consolidado.itertuples(), 1):
        for c_idx, value in enumerate(row):
            cell = ws_dados.cell(row=r_idx, column=c_idx)
            cell.value = value
            if r_idx == 1:  # Header
                cell.font = Font(bold=True)

    # ABA 3: MÉTRICAS POR TIPO
    tipos_encontrados = list(set([col.split('_')[0] for col in df_consolidado.columns if '_' in col]))

    for tipo in tipos_encontrados:
        ws_tipo = wb.create_sheet(f'Análise {tipo.title()}')

        # Filtrar colunas deste tipo
        colunas_tipo = ['id', 'nome_arquivo'] + [col for col in df_consolidado.columns if col.startswith(tipo)]

        if len(colunas_tipo) > 2:  # Tem dados além do id e nome
            df_tipo = df_consolidado[colunas_tipo]

            # Adicionar ao worksheet
            for r_idx, row in enumerate(df_tipo.itertuples(), 1):
                for c_idx, value in enumerate(row):
                    cell = ws_tipo.cell(row=r_idx, column=c_idx)
                    cell.value = value
                    if r_idx == 1:
                        cell.font = Font(bold=True)

    # ABA 4: INSIGHTS AUTOMATICOS
    ws_insights = wb.create_sheet('Insights Automáticos')

    insights_automaticos = gerar_insights_automaticos(df_consolidado)

    ws_insights.cell(row=1, column=1).value = 'INSIGHTS GERADOS AUTOMATICAMENTE'
    ws_insights.cell(row=1, column=1).font = Font(bold=True, size=16)

    for i, insight in enumerate(insights_automaticos, 3):
        ws_insights.cell(row=i, column=1).value = f"• {insight}"
        ws_insights.cell(row=i, column=1).alignment = Alignment(wrap_text=True)

    # Salvar
    output_path = os.path.join(pasta_trabalho, "dashboard", "RELATORIO_COMPLETO_DINAMICO.xlsx")
    os.makedirs(os.path.dirname(output_path), exist_ok=True)
    wb.save(output_path)

    return output_path

def gerar_insights_automaticos(df):
    """Gera insights automáticos baseados em qualquer conjunto de dados"""
    insights = []

    # Análise de correlações automáticas
    colunas_numericas = df.select_dtypes(include=['int64', 'float64']).columns

    if len(colunas_numericas) > 1:
        correlacoes = df[colunas_numericas].corr()

        # Encontrar correlações fortes
        for col1 in correlacoes.columns:
            for col2 in correlacoes.columns:
                if col1 != col2:
                    corr_val = correlacoes.loc[col1, col2]
                    if abs(corr_val) > 0.7:
                        insights.append(f"CORRELAÇÃO FORTE: {col1} e {col2} têm correlação de {corr_val:.2f}")

    # Identificar outliers automáticos
    for col in colunas_numericas:
        if df[col].std() > 0:  # Evitar divisão por zero
            media = df[col].mean()
            std = df[col].std()
            outliers = df[(df[col] > media + 2*std) | (df[col] < media - 2*std)]

            if len(outliers) > 0:
                insights.append(f"OUTLIERS DETECTADOS: {len(outliers)} vídeos têm valores extremos em {col}")

    # Análise de distribuições
    for col in colunas_numericas:
        if col.endswith('_score') or 'score' in col:
            media = df[col].mean()
            if media > 80:
                insights.append(f"PERFORMANCE ALTA: Score médio de {col} é {media:.1f} - excelente resultado")
            elif media < 50:
                insights.append(f"OPORTUNIDADE: Score médio de {col} é {media:.1f} - há espaço para melhorias")

    return insights if insights else ["Análise de insights em andamento - dados sendo processados"]

def atualizar_config_com_novas_analises(pasta_trabalho, analises_encontradas):
    """Atualiza config.json com status de todas as análises encontradas"""
    config_path = os.path.join(pasta_trabalho, "config", "config.json")

    # Carregar config existente
    with open(config_path, "r", encoding="utf-8") as f:
        config = json.load(f)

    # Atualizar status das análises encontradas
    for tipo in analises_encontradas["base"]:
        config["status_etapas"][tipo] = True

    for tipo in analises_encontradas["adicionais"]:
        config["status_etapas"][f"analise_{tipo}"] = True

    config["ultima_consolidacao"] = datetime.now().isoformat()
    config["total_analises_integradas"] = len(analises_encontradas["base"]) + len(analises_encontradas["adicionais"])

    # Salvar config atualizado
    with open(config_path, "w", encoding="utf-8") as f:
        json.dump(config, f, indent=2, ensure_ascii=False)

def main_integracao_automatica():
    """Função principal da integração automática"""
    print("🚀 INICIANDO INTEGRAÇÃO AUTOMÁTICA DE TODAS AS ANÁLISES")

    # Usar variável global da pasta de trabalho
    if "PASTA_TRABALHO" not in globals():
        print("❌ ERRO: Execute as células anteriores primeiro")
        return False

    pasta_trabalho = PASTA_TRABALHO

    try:
        # Passo 1: Descobrir análises
        print("\n🔍 DESCOBRINDO ANÁLISES DISPONÍVEIS...")
        analises = descobrir_analises_disponiveis(pasta_trabalho)

        total_analises = len(analises["base"]) + len(analises["adicionais"])
        print(f"📊 Total de análises encontradas: {total_analises}")

        # Passo 2: Consolidar dados
        print("\n🔄 CONSOLIDANDO TODOS OS DADOS...")
        df_consolidado = consolidar_todos_dados(analises)

        print(f"📈 {len(df_consolidado)} vídeos consolidados com {len(df_consolidado.columns)} métricas totais")

        # Passo 3: Gerar dashboard dinâmico
        print("\n📊 GERANDO DASHBOARD DINÂMICO...")
        dashboard_path = gerar_dashboard_dinamico(df_consolidado, pasta_trabalho)

        # Passo 4: Salvar dados consolidados
        csv_path = os.path.join(pasta_trabalho, "dashboard", "dados_completos_consolidados.csv")
        df_consolidado.to_csv(csv_path, index=False, encoding='utf-8')

        json_path = os.path.join(pasta_trabalho, "dashboard", "dados_completos_consolidados.json")
        df_consolidado.to_json(json_path, orient='records', indent=2, force_ascii=False)

        # Passo 5: Atualizar configuração
        print("\n⚙️ ATUALIZANDO CONFIGURAÇÕES...")
        atualizar_config_com_novas_analises(pasta_trabalho, analises)

        # Resultados finais
        print("\n✅ INTEGRAÇÃO AUTOMÁTICA CONCLUÍDA COM SUCESSO!")
        print(f"📁 Dashboard dinâmico: {dashboard_path}")
        print(f"📁 Dados CSV: {csv_path}")
        print(f"📁 Dados JSON: {json_path}")
        print(f"📊 {len(df_consolidado)} vídeos processados")
        print(f"📈 {len(df_consolidado.columns)} métricas totais integradas")

        print("\n🎯 PRÓXIMOS PASSOS:")
        print("• Abra o arquivo Excel para ver todas as análises integradas")
        print("• Use os dados CSV/JSON em outras ferramentas de análise")
        print("• Execute novamente sempre que adicionar novas análises")

        return True

    except Exception as e:
        print(f"\n❌ ERRO NA INTEGRAÇÃO AUTOMÁTICA: {e}")
        print("Verifique se todas as análises anteriores foram executadas com sucesso")
        return False

# Executar integração automática
if __name__ == "__main__":
    main_integracao_automatica()

In [None]:
# ============================================================================
# CÉLULA 4.3: INTEGRAÇÃO DE COPYWRITING NO DASHBOARD EXISTENTE
# ============================================================================

def integrar_copywriting_dashboard_existente():
    """Integra análise de copywriting no dashboard master existente"""
    print("🔄 Iniciando integração de copywriting no dashboard existente...")

    # Verificar pré-requisitos
    prerequisito_ok, config = verificar_prerequisito_etapa('copywriting_analysis')
    if not prerequisito_ok:
        return

    # Localizar dashboard existente
    pasta_dashboard = os.path.join(PASTA_TRABALHO, "dashboard")
    dashboard_existente = None

    # Procurar arquivo de dashboard existente
    if os.path.exists(pasta_dashboard):
        arquivos = os.listdir(pasta_dashboard)
        for arquivo in arquivos:
            if "DASHBOARD_MASTER_EXECUTIVO_INTELIGENTE" in arquivo and arquivo.endswith(".xlsx"):
                dashboard_existente = os.path.join(pasta_dashboard, arquivo)
                break

    if not dashboard_existente:
        print("❌ Dashboard master existente não encontrado!")
        print("Execute primeiro a célula 4.2 (Blueprint Final) para criar o dashboard base.")
        return

    print(f"  📊 Dashboard encontrado: {os.path.basename(dashboard_existente)}")

    # Carregar dados de copywriting
    dados_copywriting = carregar_dados_copywriting()
    if not dados_copywriting:
        return

    # Abrir workbook existente
    from openpyxl import load_workbook

    try:
        wb = load_workbook(dashboard_existente)
        print(f"  ✅ Dashboard carregado com {len(wb.sheetnames)} abas existentes")

        # Adicionar novas abas de copywriting
        adicionar_aba_copywriting_estrategico(wb, dados_copywriting)
        adicionar_aba_templates_copy(wb, dados_copywriting)
        adicionar_aba_timeline_copy(wb, dados_copywriting)
        adicionar_aba_recomendacoes_copy(wb, dados_copywriting)

        # Atualizar aba principal com métricas de copywriting
        atualizar_aba_principal_com_copy(wb, dados_copywriting)

        # Salvar dashboard atualizado
        wb.save(dashboard_existente)

        print(f"✅ Dashboard atualizado com análise de copywriting!")
        print(f"📊 Arquivo: {dashboard_existente}")
        print(f"📋 Novas abas adicionadas:")
        print("  • Copywriting Estratégico")
        print("  • Templates Replicáveis")
        print("  • Timeline Persuasão")
        print("  • Recomendações Copy")
        print("  • Dashboard Principal (atualizada)")

        # Gerar relatórios complementares
        gerar_relatorios_copywriting_individuais(dados_copywriting)

        # Atualizar config
        config["status_etapas"]["dashboard_copywriting_integrado"] = True
        config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
        with open(config_path, "w", encoding="utf-8") as f:
            json.dump(config, f, indent=2, ensure_ascii=False)

        return dashboard_existente

    except Exception as e:
        print(f"❌ Erro ao atualizar dashboard: {e}")
        import traceback
        traceback.print_exc()
        return None

def carregar_dados_copywriting():
    """Carrega dados de copywriting e outros dados necessários"""
    print("  📊 Carregando dados de copywriting...")

    try:
        # Dados de copywriting
        copywriting_path = os.path.join(PASTA_TRABALHO, "dados", "analises_copywriting_completas.json")
        with open(copywriting_path, "r", encoding="utf-8") as f:
            copywriting_data = json.load(f)

        # Dados de legendas
        legendas_path = os.path.join(PASTA_TRABALHO, "dados", "legendas_geradas.json")
        with open(legendas_path, "r", encoding="utf-8") as f:
            legendas_data = json.load(f)

        # Tentar carregar outros dados (podem não existir ainda)
        outros_dados = {}

        try:
            padroes_path = os.path.join(PASTA_TRABALHO, "dados", "analises_padroes_completas.json")
            with open(padroes_path, "r", encoding="utf-8") as f:
                outros_dados["padroes"] = json.load(f)
        except:
            outros_dados["padroes"] = []

        try:
            videos_path = os.path.join(PASTA_TRABALHO, "dados", "metadados_completos.json")
            with open(videos_path, "r", encoding="utf-8") as f:
                outros_dados["videos"] = json.load(f)
        except:
            outros_dados["videos"] = []

        print(f"  ✅ Dados carregados: {len(copywriting_data)} análises de copywriting")

        return {
            "copywriting": copywriting_data,
            "legendas": legendas_data,
            **outros_dados
        }

    except Exception as e:
        print(f"  ❌ Erro ao carregar dados de copywriting: {e}")
        return None

def adicionar_aba_copywriting_estrategico(wb, dados):
    """Adiciona aba principal de análise de copywriting"""
    from openpyxl.styles import Font, PatternFill, Alignment

    # Criar nova aba
    ws = wb.create_sheet("Copywriting Estratégico")

    # Título principal
    ws.merge_cells("A1:H1")
    titulo = ws["A1"]
    titulo.value = "ANÁLISE ESTRATÉGICA DE COPYWRITING - ENGENHARIA REVERSA"
    titulo.fill = PatternFill(start_color="1F4E79", end_color="1F4E79", fill_type="solid")
    titulo.font = Font(color="FFFFFF", bold=True, size=14)
    titulo.alignment = Alignment(horizontal="center")

    row = 3

    # Métricas executivas
    ws[f"A{row}"] = "MÉTRICAS EXECUTIVAS DE COPYWRITING"
    ws[f"A{row}"].font = Font(bold=True, size=12, color="C5504B")
    row += 2

    # Calcular métricas
    videos_copy = dados["copywriting"]

    if videos_copy:
        # Score médio
        scores = [v.get("score_persuasao", 0) for v in videos_copy]
        score_medio = sum(scores) / len(scores) if scores else 0

        # Contadores
        total_ganchos = sum(len(v.get("ganchos_detectados", {})) for v in videos_copy)
        total_gatilhos = sum(len(v.get("gatilhos_mentais_detectados", {})) for v in videos_copy)
        total_ctas = sum(len(v.get("ctas_detectados", {})) for v in videos_copy)
        videos_sem_cta = len([v for v in videos_copy if not v.get("ctas_detectados")])
        total_templates = sum(len(v.get("templates_identificados", [])) for v in videos_copy)

        # Exibir métricas
        metricas = [
            ("Score Persuasão Médio:", f"{score_medio:.1f}/100", "Meta: 70+ para alta conversão"),
            ("Vídeos Analisados:", len(videos_copy), "Base completa da análise"),
            ("Total de Ganchos:", total_ganchos, f"Média: {total_ganchos/len(videos_copy):.1f} por vídeo"),
            ("Total de Gatilhos:", total_gatilhos, f"Média: {total_gatilhos/len(videos_copy):.1f} por vídeo"),
            ("Total de CTAs:", total_ctas, f"Média: {total_ctas/len(videos_copy):.1f} por vídeo"),
            ("🚨 Vídeos sem CTA:", videos_sem_cta, "CRÍTICO: Implementar imediatamente" if videos_sem_cta > 0 else "✅ Todos têm CTA"),
            ("Templates Identificados:", total_templates, "Estruturas replicáveis encontradas")
        ]

        for metrica, valor, descricao in metricas:
            ws[f"A{row}"] = metrica
            ws[f"B{row}"] = valor
            ws[f"C{row}"] = descricao

            ws[f"A{row}"].font = Font(bold=True)
            if "🚨" in metrica and videos_sem_cta > 0:
                ws[f"B{row}"].font = Font(bold=True, color="FF0000")
            elif isinstance(valor, (int, float)) and valor > 0:
                ws[f"B{row}"].font = Font(bold=True, color="70AD47")

            row += 1

        row += 2

        # Ranking de performance
        ws[f"A{row}"] = "🏆 RANKING DE PERFORMANCE POR SCORE DE PERSUASÃO"
        ws[f"A{row}"].font = Font(bold=True, size=12, color="1F4E79")
        row += 2

        # Headers
        headers = ["Posição", "Vídeo ID", "Score", "Ganchos", "Gatilhos", "CTAs", "Status"]
        for col, header in enumerate(headers, 1):
            cell = ws.cell(row=row, column=col)
            cell.value = header
            cell.font = Font(bold=True)
            cell.fill = PatternFill(start_color="D9E2F3", end_color="D9E2F3", fill_type="solid")
        row += 1

        # Top performers
        top_videos = sorted(videos_copy, key=lambda x: x.get("score_persuasao", 0), reverse=True)

        for i, video in enumerate(top_videos, 1):
            ws.cell(row=row, column=1, value=f"{i}º")
            ws.cell(row=row, column=2, value=video["video_id"])
            ws.cell(row=row, column=3, value=f"{video.get('score_persuasao', 0)}/100")
            ws.cell(row=row, column=4, value=len(video.get("ganchos_detectados", {})))
            ws.cell(row=row, column=5, value=len(video.get("gatilhos_mentais_detectados", {})))
            ws.cell(row=row, column=6, value=len(video.get("ctas_detectados", {})))

            # Status baseado no score
            score = video.get("score_persuasao", 0)
            if score >= 70:
                status = "🟢 ÓTIMO"
                status_color = "70AD47"
            elif score >= 50:
                status = "🟡 BOM"
                status_color = "FFC000"
            else:
                status = "🔴 PRECISA OTIMIZAR"
                status_color = "C5504B"

            cell_status = ws.cell(row=row, column=7, value=status)
            cell_status.font = Font(color=status_color, bold=True)

            # Destacar top 3
            if i <= 3:
                for col in range(1, 8):
                    ws.cell(row=row, column=col).fill = PatternFill(start_color="FFF2CC", end_color="FFF2CC", fill_type="solid")

            row += 1

        row += 2

        # Análise de gaps críticos
        ws[f"A{row}"] = "⚠️ GAPS CRÍTICOS IDENTIFICADOS"
        ws[f"A{row}"].font = Font(bold=True, size=12, color="C5504B")
        row += 2

        gaps = []

        # Vídeos sem CTA
        if videos_sem_cta > 0:
            gap_cta_videos = [v["video_id"] for v in videos_copy if not v.get("ctas_detectados")]
            gaps.append(f"🚨 CRÍTICO: {videos_sem_cta} vídeos sem CTA: {', '.join(gap_cta_videos[:3])}")

        # Vídeos com poucos ganchos
        videos_poucos_ganchos = [v for v in videos_copy if len(v.get("ganchos_detectados", {})) < 2]
        if len(videos_poucos_ganchos) > len(videos_copy) * 0.5:
            gaps.append(f"📈 OPORTUNIDADE: {len(videos_poucos_ganchos)} vídeos precisam de mais ganchos")

        # Score baixo
        videos_score_baixo = [v for v in videos_copy if v.get("score_persuasao", 0) < 50]
        if videos_score_baixo:
            gaps.append(f"🎯 OTIMIZAÇÃO: {len(videos_score_baixo)} vídeos com score < 50 precisam de revisão")

        if not gaps:
            gaps.append("✅ Nenhum gap crítico identificado - parabéns!")

        for gap in gaps:
            ws[f"A{row}"] = gap
            if "🚨" in gap:
                ws[f"A{row}"].font = Font(color="FF0000", bold=True)
            elif "📈" in gap or "🎯" in gap:
                ws[f"A{row}"].font = Font(color="FFC000", bold=True)
            else:
                ws[f"A{row}"].font = Font(color="70AD47", bold=True)
            row += 1

    else:
        ws[f"A{row}"] = "⚠️ Nenhum dado de copywriting encontrado"
        ws[f"A{row}"].font = Font(color="C5504B", bold=True)
        row += 1
        ws[f"A{row}"] = "Execute primeiro a Célula 2.4 para gerar análises de copywriting"

    # Ajustar larguras das colunas
    for col, width in [("A", 25), ("B", 15), ("C", 40), ("D", 10), ("E", 10), ("F", 10), ("G", 20), ("H", 15)]:
        ws.column_dimensions[col].width = width

def adicionar_aba_templates_copy(wb, dados):
    """Adiciona aba de templates replicáveis"""
    from openpyxl.styles import Font, PatternFill, Alignment

    ws = wb.create_sheet("Templates Replicáveis")

    # Título
    ws.merge_cells("A1:F1")
    titulo = ws["A1"]
    titulo.value = "TEMPLATES E ESTRUTURAS REPLICÁVEIS DE COPYWRITING"
    titulo.fill = PatternFill(start_color="70AD47", end_color="70AD47", fill_type="solid")
    titulo.font = Font(color="FFFFFF", bold=True, size=14)
    titulo.alignment = Alignment(horizontal="center")

    row = 3

    # Coletar todos os templates
    todos_templates = []
    for video in dados["copywriting"]:
        templates = video.get("templates_identificados", [])
        for template in templates:
            template["video_id"] = video["video_id"]
            todos_templates.append(template)

    if todos_templates:
        # Agrupar templates por tipo
        templates_agrupados = {}
        for template in todos_templates:
            nome = template["nome"]
            if nome not in templates_agrupados:
                templates_agrupados[nome] = {
                    "estrutura": template["estrutura"],
                    "eficacia": template["eficacia"],
                    "uso_recomendado": template["uso_recomendado"],
                    "videos_exemplo": []
                }
            templates_agrupados[nome]["videos_exemplo"].append(template["video_id"])

        # Exibir templates
        for nome_template, dados_template in templates_agrupados.items():
            ws.merge_cells(f"A{row}:F{row}")
            template_header = ws[f"A{row}"]
            template_header.value = f"📋 TEMPLATE: {nome_template.replace('_', ' ')}"
            template_header.fill = PatternFill(start_color="E2EFDA", end_color="E2EFDA", fill_type="solid")
            template_header.font = Font(bold=True, size=11)
            row += 1

            ws[f"A{row}"] = "Estrutura:"
            ws[f"B{row}"] = dados_template["estrutura"]
            ws[f"A{row}"].font = Font(bold=True)
            row += 1

            ws[f"A{row}"] = "Eficácia:"
            ws[f"B{row}"] = dados_template["eficacia"]
            ws[f"A{row}"].font = Font(bold=True)
            if dados_template["eficacia"] == "MUITO ALTA":
                ws[f"B{row}"].font = Font(color="70AD47", bold=True)
            elif dados_template["eficacia"] == "ALTA":
                ws[f"B{row}"].font = Font(color="C5504B", bold=True)
            row += 1

            ws[f"A{row}"] = "Uso Recomendado:"
            ws[f"B{row}"] = dados_template["uso_recomendado"]
            ws[f"A{row}"].font = Font(bold=True)
            row += 1

            ws[f"A{row}"] = "Vídeos Exemplo:"
            ws[f"B{row}"] = ", ".join(dados_template["videos_exemplo"][:3])
            ws[f"A{row}"].font = Font(bold=True)
            row += 1

            # Como aplicar
            ws[f"A{row}"] = "Como Aplicar:"
            ws[f"A{row}"].font = Font(bold=True, color="7030A0")
            row += 1

            instrucoes = gerar_instrucoes_aplicacao_template(nome_template)
            for i, instrucao in enumerate(instrucoes, 1):
                ws[f"B{row}"] = f"{i}. {instrucao}"
                row += 1

            row += 2

    else:
        ws[f"A{row}"] = "📋 Ainda não foram identificados templates específicos"
        row += 1
        ws[f"A{row}"] = "Execute mais análises para identificar padrões replicáveis"

    # Templates recomendados universais
    row += 2
    ws.merge_cells(f"A{row}:F{row}")
    recom_header = ws[f"A{row}"]
    recom_header.value = "🎯 TEMPLATES UNIVERSAIS RECOMENDADOS PARA IMPLEMENTAR"
    recom_header.fill = PatternFill(start_color="FFC000", end_color="FFC000", fill_type="solid")
    recom_header.font = Font(bold=True, size=12)
    row += 1

    templates_universais = [
        ("PERGUNTA + VALOR + CTA", "Pergunta engajante → Entrega valor → Call-to-action direto", "Todos os vídeos educativos"),
        ("PROBLEMA + AGITAÇÃO + SOLUÇÃO", "Identifica dor → Agrava problema → Apresenta solução", "Vídeos de vendas e transformação"),
        ("CURIOSIDADE + HISTÓRIA + ENSINO", "Desperta curiosidade → Conta história → Ensina método", "Content marketing e autoridade"),
        ("PROVA SOCIAL + URGÊNCIA + AÇÃO", "Mostra resultados → Cria urgência → Direciona ação", "Lançamentos e ofertas")
    ]

    headers_univ = ["Template", "Estrutura", "Aplicação Ideal"]
    for col, header in enumerate(headers_univ, 1):
        cell = ws.cell(row=row, column=col)
        cell.value = header
        cell.font = Font(bold=True)
        cell.fill = PatternFill(start_color="F2F2F2", end_color="F2F2F2", fill_type="solid")
    row += 1

    for nome, estrutura, aplicacao in templates_universais:
        ws.cell(row=row, column=1, value=nome)
        ws.cell(row=row, column=2, value=estrutura)
        ws.cell(row=row, column=3, value=aplicacao)
        ws.cell(row=row, column=1).font = Font(bold=True)
        row += 1

    # Ajustar larguras
    for col, width in [("A", 20), ("B", 50), ("C", 25), ("D", 15), ("E", 15), ("F", 15)]:
        ws.column_dimensions[col].width = width

def gerar_instrucoes_aplicacao_template(nome_template):
    """Gera instruções específicas para aplicar um template"""
    instrucoes_map = {
        "PERGUNTA_AUTORIDADE_CTA": [
            "Inicie com pergunta que conecte com a dor/desejo do público",
            "Estabeleça credibilidade (experiência, resultados, formação)",
            "Termine com CTA claro e específico",
            "Mantenha tom conversacional mas assertivo"
        ],
        "PROBLEMA_SOLUCAO_PROVA": [
            "Identifique problema específico e real do público",
            "Apresente solução clara e aplicável",
            "Mostre provas sociais (depoimentos, números, casos)",
            "Use linguagem emocional para conectar"
        ],
        "CURIOSIDADE_URGENCIA_ACAO": [
            "Desperte curiosidade nos primeiros 3 segundos",
            "Crie senso de urgência (limitado, exclusivo)",
            "Direcione para ação imediata específica",
            "Use gatilhos de escassez e FOMO"
        ]
    }

    return instrucoes_map.get(nome_template, [
        "Analise a estrutura identificada no vídeo de exemplo",
        "Adapte os elementos para seu nicho específico",
        "Teste diferentes abordagens mantendo a estrutura",
        "Monitore resultados e otimize baseado na performance"
    ])

def adicionar_aba_timeline_copy(wb, dados):
    """Adiciona aba com timeline de elementos persuasivos"""
    from openpyxl.styles import Font, PatternFill, Alignment

    ws = wb.create_sheet("Timeline Persuasão")

    # Título
    ws.merge_cells("A1:G1")
    titulo = ws["A1"]
    titulo.value = "TIMELINE DE ELEMENTOS PERSUASIVOS - MAPEAMENTO TEMPORAL"
    titulo.fill = PatternFill(start_color="7030A0", end_color="7030A0", fill_type="solid")
    titulo.font = Font(color="FFFFFF", bold=True, size=14)
    titulo.alignment = Alignment(horizontal="center")

    row = 3

    # Análise temporal por vídeo (mostrar apenas top 3 por brevidade)
    videos_copy = sorted(dados["copywriting"], key=lambda x: x.get("score_persuasao", 0), reverse=True)

    for video in videos_copy[:3]:  # Top 3 performers
        ws.merge_cells(f"A{row}:G{row}")
        video_header = ws[f"A{row}"]
        video_header.value = f"🎬 TIMELINE: {video['video_id']} (Score: {video.get('score_persuasao', 0)}/100)"
        video_header.fill = PatternFill(start_color="E2EFDA", end_color="E2EFDA", fill_type="solid")
        video_header.font = Font(bold=True)
        row += 1

        # Headers da timeline
        headers = ["Tempo", "Tipo", "Elemento", "Contexto", "Posição", "Impacto", "Análise"]
        for col, header in enumerate(headers, 1):
            cell = ws.cell(row=row, column=col)
            cell.value = header
            cell.font = Font(bold=True)
            cell.fill = PatternFill(start_color="F2F2F2", end_color="F2F2F2", fill_type="solid")
        row += 1

        # Consolidar timeline
        timeline_elementos = []

        # Adicionar elementos de cada categoria
        for categoria, timeline_key in [("GANCHO", "ganchos_timeline"), ("GATILHO", "gatilhos_timeline"), ("CTA", "ctas_timeline")]:
            timeline_data = video.get("timestamp", {}).get(timeline_key, [])
            for item in timeline_data:
                timeline_elementos.append({
                    "categoria": categoria,
                    "tempo": f"{item['minuto']:02d}:{item['segundo']:02d}",
                    "tipo": item["tipo"].replace("_", " ").title(),
                    "contexto": item.get("contexto", "")[:40] + "..." if len(item.get("contexto", "")) > 40 else item.get("contexto", ""),
                    "minuto": item["minuto"],
                    "segundo": item["segundo"]
                })

        # Ordenar por tempo
        timeline_elementos.sort(key=lambda x: (x["minuto"], x["segundo"]))

        if timeline_elementos:
            for elemento in timeline_elementos:
                ws.cell(row=row, column=1, value=elemento["tempo"])
                ws.cell(row=row, column=2, value=elemento["categoria"])
                ws.cell(row=row, column=3, value=elemento["tipo"])
                ws.cell(row=row, column=4, value=elemento["contexto"])

                # Calcular posição no vídeo
                total_segundos = elemento["minuto"] * 60 + elemento["segundo"]
                if total_segundos <= 10:
                    posicao = "ABERTURA"
                    posicao_color = "70AD47"
                elif total_segundos <= 20:
                    posicao = "MEIO"
                    posicao_color = "FFC000"
                else:
                    posicao = "FINAL"
                    posicao_color = "C5504B"

                cell_pos = ws.cell(row=row, column=5, value=posicao)
                cell_pos.font = Font(color=posicao_color, bold=True)

                # Análise de impacto
                impacto = analisar_impacto_elemento(elemento["categoria"], posicao)
                ws.cell(row=row, column=6, value=impacto["score"])
                ws.cell(row=row, column=7, value=impacto["analise"])

                if impacto["score"] == "ALTO":
                    ws.cell(row=row, column=6).font = Font(color="70AD47", bold=True)
                elif impacto["score"] == "BAIXO":
                    ws.cell(row=row, column=6).font = Font(color="C5504B", bold=True)

                row += 1
        else:
            ws.cell(row=row, column=1, value="Nenhum elemento temporal mapeado")
            row += 1

        row += 2

    # Padrões temporais identificados
    row += 1
    ws.merge_cells(f"A{row}:G{row}")
    padroes_header = ws[f"A{row}"]
    padroes_header.value = "📊 PADRÕES TEMPORAIS IDENTIFICADOS"
    padroes_header.fill = PatternFill(start_color="1F4E79", end_color="1F4E79", fill_type="solid")
    padroes_header.font = Font(color="FFFFFF", bold=True, size=12)
    row += 1

    padroes_temporais = [
        "✅ GANCHOS mais eficazes nos primeiros 10 segundos",
        "✅ GATILHOS MENTAIS ideais entre 10-20 segundos",
        "✅ CTAs mais conversores nos últimos 5 segundos",
        "⚠️ Evitar CTAs nos primeiros 5 segundos",
        "📈 Combinar CURIOSIDADE + AUTORIDADE = alta retenção"
    ]

    for padrao in padroes_temporais:
        ws[f"A{row}"] = padrao
        if "✅" in padrao:
            ws[f"A{row}"].font = Font(color="70AD47", bold=True)
        elif "⚠️" in padrao:
            ws[f"A{row}"].font = Font(color="FFC000", bold=True)
        else:
            ws[f"A{row}"].font = Font(color="1F4E79", bold=True)
        row += 1

    # Ajustar larguras
    for col, width in [("A", 8), ("B", 10), ("C", 15), ("D", 30), ("E", 12), ("F", 8), ("G", 25)]:
        ws.column_dimensions[col].width = width

def analisar_impacto_elemento(categoria, posicao):
    """Analisa o impacto de um elemento baseado na posição"""
    impactos = {
        ("GANCHO", "ABERTURA"): {"score": "ALTO", "analise": "Ideal para capturar atenção"},
        ("GANCHO", "MEIO"): {"score": "MÉDIO", "analise": "Melhor no início"},
        ("GANCHO", "FINAL"): {"score": "BAIXO", "analise": "Reposicionar para abertura"},
        ("GATILHO", "ABERTURA"): {"score": "MÉDIO", "analise": "Bom para credibilidade"},
        ("GATILHO", "MEIO"): {"score": "ALTO", "analise": "Posição ideal para persuasão"},
        ("GATILHO", "FINAL"): {"score": "MÉDIO", "analise": "Reforça decisão"},
        ("CTA", "ABERTURA"): {"score": "BAIXO", "analise": "Muito cedo, construir valor primeiro"},
        ("CTA", "MEIO"): {"score": "MÉDIO", "analise": "Considerar mover para final"},
        ("CTA", "FINAL"): {"score": "ALTO", "analise": "Posicionamento ideal"}
    }

    return impactos.get((categoria, posicao), {"score": "MÉDIO", "analise": "Analisar contexto específico"})

def adicionar_aba_recomendacoes_copy(wb, dados):
    """Adiciona aba de recomendações estratégicas consolidadas"""
    from openpyxl.styles import Font, PatternFill, Alignment

    ws = wb.create_sheet("Recomendações Copy")

    # Título
    ws.merge_cells("A1:F1")
    titulo = ws["A1"]
    titulo.value = "RECOMENDAÇÕES ESTRATÉGICAS DE COPYWRITING - PLANO DE AÇÃO"
    titulo.fill = PatternFill(start_color="C5504B", end_color="C5504B", fill_type="solid")
    titulo.font = Font(color="FFFFFF", bold=True, size=14)
    titulo.alignment = Alignment(horizontal="center")

    row = 3

    # Consolidar recomendações por prioridade
    todas_recomendacoes = []
    for video in dados["copywriting"]:
        recomendacoes_video = video.get("recomendacoes_estrategicas", [])
        for rec in recomendacoes_video:
            rec["video_id"] = video["video_id"]
            todas_recomendacoes.append(rec)

    # Agrupar por prioridade
    recomendacoes_por_prioridade = {
        "CRÍTICA": [],
        "ALTA": [],
        "MÉDIA": []
    }

    for rec in todas_recomendacoes:
        prioridade = rec.get("prioridade", "MÉDIA")
        if prioridade in recomendacoes_por_prioridade:
            recomendacoes_por_prioridade[prioridade].append(rec)

    # Exibir por prioridade
    for prioridade in ["CRÍTICA", "ALTA", "MÉDIA"]:
        if not recomendacoes_por_prioridade[prioridade]:
            continue

        ws[f"A{row}"] = f"🚨 PRIORIDADE {prioridade}"
        if prioridade == "CRÍTICA":
            ws[f"A{row}"].font = Font(color="FF0000", bold=True, size=12)
        elif prioridade == "ALTA":
            ws[f"A{row}"].font = Font(color="C5504B", bold=True, size=12)
        else:
            ws[f"A{row}"].font = Font(color="FFC000", bold=True, size=12)

        row += 2

        # Headers
        headers = ["Categoria", "Recomendação", "Vídeos Afetados", "Ação Sugerida"]
        for col, header in enumerate(headers, 1):
            cell = ws.cell(row=row, column=col)
            cell.value = header
            cell.font = Font(bold=True)
            cell.fill = PatternFill(start_color="F2F2F2", end_color="F2F2F2", fill_type="solid")
        row += 1

        # Agrupar recomendações similares da mesma prioridade
        grupos = {}
        for rec in recomendacoes_por_prioridade[prioridade]:
            categoria = rec["categoria"]
            if categoria not in grupos:
                grupos[categoria] = {
                    "recomendacao": rec["recomendacao"],
                    "videos": [],
                    "acao": gerar_acao_especifica(categoria)
                }
            grupos[categoria]["videos"].append(rec["video_id"])

        for categoria, dados_grupo in grupos.items():
            ws.cell(row=row, column=1, value=categoria)
            ws.cell(row=row, column=2, value=dados_grupo["recomendacao"])
            ws.cell(row=row, column=3, value=f"{len(dados_grupo['videos'])} vídeo(s)")
            ws.cell(row=row, column=4, value=dados_grupo["acao"])
            row += 1

        row += 2

    # Plano de ação 30 dias
    row += 2
    ws.merge_cells(f"A{row}:F{row}")
    plano_header = ws[f"A{row}"]
    plano_header.value = "📅 PLANO DE AÇÃO ESTRATÉGICO - PRÓXIMOS 30 DIAS"
    plano_header.fill = PatternFill(start_color="70AD47", end_color="70AD47", fill_type="solid")
    plano_header.font = Font(color="FFFFFF", bold=True, size=12)
    row += 2

    plano_30_dias = [
        ("SEMANA 1 - CRÍTICO", [
            "Implementar CTAs em TODOS os vídeos sem call-to-action",
            "Corrigir vídeos com score de persuasão abaixo de 30",
            "Aplicar templates identificados nos vídeos top performers"
        ]),
        ("SEMANA 2 - ALTA PRIORIDADE", [
            "Adicionar ganchos de abertura nos vídeos com baixa retenção",
            "Incorporar gatilhos de autoridade e prova social",
            "Otimizar timeline de elementos persuasivos"
        ]),
        ("SEMANA 3 - OTIMIZAÇÃO", [
            "Testar variações de CTAs mais eficazes",
            "Refinar estruturas narrativas baseadas nos templates",
            "A/B testing de elementos específicos"
        ]),
        ("SEMANA 4 - VALIDAÇÃO", [
            "Medir performance pós-implementação",
            "Documentar novos padrões de sucesso identificados",
            "Atualizar biblioteca de templates comprovados"
        ])
    ]

    for semana_titulo, acoes in plano_30_dias:
        ws[f"A{row}"] = semana_titulo
        ws[f"A{row}"].font = Font(bold=True, color="1F4E79", size=11)
        row += 1

        for acao in acoes:
            ws[f"B{row}"] = f"• {acao}"
            row += 1

        row += 1

    # KPIs de acompanhamento
    row += 2
    ws.merge_cells(f"A{row}:F{row}")
    kpis_header = ws[f"A{row}"]
    kpis_header.value = "📊 KPIs DE ACOMPANHAMENTO - MÉTRICAS DE SUCESSO"
    kpis_header.fill = PatternFill(start_color="7030A0", end_color="7030A0", fill_type="solid")
    kpis_header.font = Font(color="FFFFFF", bold=True, size=12)
    row += 2

    kpis = [
        ("Score de Persuasão Médio", "Aumento de 20% em 30 dias", "Mensal"),
        ("Taxa de CTAs Implementados", "100% dos vídeos com pelo menos 1 CTA", "Imediato"),
        ("Variedade de Ganchos", "3+ tipos diferentes por vídeo", "Por vídeo"),
        ("Diversidade de Gatilhos", "4+ gatilhos mentais por vídeo", "Por vídeo"),
        ("Templates Ativos", "5+ estruturas replicáveis em uso", "Mensal"),
        ("Taxa de Otimização", "80% das recomendações críticas aplicadas", "Semanal")
    ]

    headers_kpi = ["KPI", "Meta", "Frequência de Medição"]
    for col, header in enumerate(headers_kpi, 1):
        cell = ws.cell(row=row, column=col)
        cell.value = header
        cell.font = Font(bold=True)
        cell.fill = PatternFill(start_color="E2EFDA", end_color="E2EFDA", fill_type="solid")
    row += 1

    for kpi_nome, meta, frequencia in kpis:
        ws.cell(row=row, column=1, value=kpi_nome)
        ws.cell(row=row, column=2, value=meta)
        ws.cell(row=row, column=3, value=frequencia)
        row += 1

    # Próximos passos imediatos
    row += 3
    ws[f"A{row}"] = "🎯 PRÓXIMOS PASSOS IMEDIATOS (HOJE)"
    ws[f"A{row}"].font = Font(bold=True, color="C5504B", size=12)
    row += 1

    proximos_passos = gerar_proximos_passos_imediatos(dados["copywriting"])

    for i, passo in enumerate(proximos_passos, 1):
        ws[f"A{row}"] = f"{i}. {passo}"
        ws[f"A{row}"].font = Font(bold=True)
        row += 1

    # Ajustar larguras
    for col, width in [("A", 20), ("B", 40), ("C", 15), ("D", 30), ("E", 15), ("F", 15)]:
        ws.column_dimensions[col].width = width

def gerar_acao_especifica(categoria):
    """Gera ação específica baseada na categoria da recomendação"""
    acoes = {
        "GANCHOS": "Revisar primeiros 5 segundos e adicionar pergunta ou curiosidade",
        "GATILHOS": "Incorporar elementos de autoridade, prova social ou reciprocidade",
        "CTA": "Adicionar call-to-action claro nos últimos 3-5 segundos",
        "ESTRUTURA": "Aplicar template identificado mais próximo do nicho",
        "PERSUASÃO": "Combinar múltiplos elementos persuasivos em sequência lógica"
    }
    return acoes.get(categoria, "Revisar e otimizar elementos específicos mencionados")

def gerar_proximos_passos_imediatos(videos_copy):
    """Gera lista de ações imediatas baseadas na análise"""
    passos = []

    # Verificar vídeos sem CTA
    videos_sem_cta = [v for v in videos_copy if not v.get("ctas_detectados")]
    if videos_sem_cta:
        passos.append(f"CRÍTICO: Adicionar CTAs em {len(videos_sem_cta)} vídeo(s): {', '.join([v['video_id'] for v in videos_sem_cta[:3]])}")

    # Verificar scores baixos
    videos_score_baixo = [v for v in videos_copy if v.get("score_persuasao", 0) < 30]
    if videos_score_baixo:
        passos.append(f"Revisar {len(videos_score_baixo)} vídeo(s) com score crítico < 30")

    # Templates a aplicar
    templates_identificados = []
    for video in videos_copy:
        templates_identificados.extend(video.get("templates_identificados", []))

    if templates_identificados:
        template_mais_comum = max(set(t["nome"] for t in templates_identificados),
                                 key=lambda x: sum(1 for t in templates_identificados if t["nome"] == x))
        passos.append(f"Aplicar template '{template_mais_comum.replace('_', ' ')}' em novos vídeos")

    # Ações gerais
    passos.extend([
        "Backup dos vídeos atuais antes das modificações",
        "Priorizar implementações por ordem de impacto (CTAs primeiro)",
        "Documentar mudanças para acompanhar resultados"
    ])

    return passos[:6]  # Limitar a 6 passos

def atualizar_aba_principal_com_copy(wb, dados):
    """Atualiza a aba principal existente com métricas de copywriting"""
    # Tentar encontrar aba principal (pode ter nomes diferentes)
    aba_principal = None
    possiveis_nomes = ["Dashboard Principal", "Executive Summary", "Summary", "Principal"]

    for nome in wb.sheetnames:
        if any(possivel in nome for possivel in possiveis_nomes):
            aba_principal = wb[nome]
            break

    if not aba_principal:
        # Se não encontrou, usar a primeira aba
        aba_principal = wb.worksheets[0]

    # Encontrar próxima linha vazia para adicionar seção de copywriting
    next_row = 1
    for row in range(1, 100):
        if aba_principal[f"A{row}"].value is None:
            next_row = row
            break

    # Adicionar seção de copywriting
    from openpyxl.styles import Font, PatternFill

    # Título da seção
    aba_principal.merge_cells(f"A{next_row}:H{next_row}")
    titulo_copy = aba_principal[f"A{next_row}"]
    titulo_copy.value = "📝 ANÁLISE DE COPYWRITING - RESUMO EXECUTIVO"
    titulo_copy.fill = PatternFill(start_color="7030A0", end_color="7030A0", fill_type="solid")
    titulo_copy.font = Font(color="FFFFFF", bold=True, size=12)
    next_row += 2

    # Métricas resumidas
    videos_copy = dados["copywriting"]

    if videos_copy:
        scores = [v.get("score_persuasao", 0) for v in videos_copy]
        score_medio = sum(scores) / len(scores)
        videos_sem_cta = len([v for v in videos_copy if not v.get("ctas_detectados")])
        templates_total = sum(len(v.get("templates_identificados", [])) for v in videos_copy)

        metricas_resumo = [
            ("Score de Persuasão Médio:", f"{score_medio:.1f}/100"),
            ("Vídeos sem CTA:", f"{videos_sem_cta} (CRÍTICO)" if videos_sem_cta > 0 else "0 ✅"),
            ("Templates Identificados:", str(templates_total)),
            ("Status Geral:", "Otimização necessária" if score_medio < 60 or videos_sem_cta > 0 else "Performance boa")
        ]

        for metrica, valor in metricas_resumo:
            aba_principal[f"A{next_row}"] = metrica
            aba_principal[f"B{next_row}"] = valor
            aba_principal[f"A{next_row}"].font = Font(bold=True)

            if "CRÍTICO" in valor:
                aba_principal[f"B{next_row}"].font = Font(color="FF0000", bold=True)
            elif "✅" in valor:
                aba_principal[f"B{next_row}"].font = Font(color="70AD47", bold=True)

            next_row += 1

    else:
        aba_principal[f"A{next_row}"] = "⚠️ Execute a análise de copywriting (Célula 2.4) para ver métricas"
        aba_principal[f"A{next_row}"].font = Font(color="FFC000", bold=True)

def gerar_relatorios_copywriting_individuais(dados):
    """Gera relatórios individuais de texto para cada vídeo"""
    print("  📄 Gerando relatórios individuais de copywriting...")

    pasta_relatorios = os.path.join(PASTA_TRABALHO, "relatorios_copywriting")
    os.makedirs(pasta_relatorios, exist_ok=True)

    for video_copy in dados["copywriting"]:
        video_id = video_copy["video_id"]

        relatorio_path = os.path.join(pasta_relatorios, f"{video_id}_copywriting_completo.txt")

        with open(relatorio_path, "w", encoding="utf-8") as f:
            f.write("="*60 + "\n")
            f.write("RELATÓRIO COMPLETO DE ANÁLISE DE COPYWRITING\n")
            f.write("="*60 + "\n\n")

            f.write(f"📹 Vídeo ID: {video_id}\n")
            f.write(f"🎯 Score de Persuasão: {video_copy.get('score_persuasao', 0)}/100\n")
            f.write(f"📝 Total de Palavras: {video_copy.get('total_palavras', 0)}\n\n")

            # Texto completo
            f.write("TRANSCRIÇÃO COMPLETA:\n")
            f.write("-" * 30 + "\n")
            f.write(video_copy.get("texto_completo", "Transcrição não disponível") + "\n\n")

            # Ganchos
            f.write("🎣 GANCHOS DETECTADOS:\n")
            f.write("-" * 30 + "\n")
            ganchos = video_copy.get("ganchos_detectados", {})
            if ganchos:
                for tipo, dados in ganchos.items():
                    f.write(f"• {tipo.replace('_', ' ').title()}: {dados['count']} ocorrência(s)\n")
                    for exemplo in dados.get("exemplos", [])[:2]:
                        f.write(f"  - \"{exemplo}\"\n")
                    f.write("\n")
            else:
                f.write("❌ Nenhum gancho detectado - OPORTUNIDADE DE MELHORIA\n\n")

            # Gatilhos
            f.write("🧠 GATILHOS MENTAIS DETECTADOS:\n")
            f.write("-" * 30 + "\n")
            gatilhos = video_copy.get("gatilhos_mentais_detectados", {})
            if gatilhos:
                for tipo, dados in gatilhos.items():
                    f.write(f"• {tipo.replace('_', ' ').title()}: {dados['count']} ocorrência(s)\n")
                    for exemplo in dados.get("exemplos", [])[:2]:
                        f.write(f"  - \"{exemplo}\"\n")
                    f.write("\n")
            else:
                f.write("❌ Nenhum gatilho mental detectado - ADICIONAR URGENTEMENTE\n\n")

            # CTAs
            f.write("📢 CALLS-TO-ACTION DETECTADOS:\n")
            f.write("-" * 30 + "\n")
            ctas = video_copy.get("ctas_detectados", {})
            if ctas:
                for tipo, dados in ctas.items():
                    f.write(f"• {tipo.replace('_', ' ').title()}: {dados['count']} ocorrência(s)\n")
                    for exemplo in dados.get("exemplos", [])[:2]:
                        f.write(f"  - \"{exemplo}\"\n")
                    f.write("\n")
            else:
                f.write("🚨 CRÍTICO: Nenhum CTA detectado - IMPLEMENTAR IMEDIATAMENTE\n\n")

            # Templates
            f.write("📋 TEMPLATES IDENTIFICADOS:\n")
            f.write("-" * 30 + "\n")
            templates = video_copy.get("templates_identificados", [])
            if templates:
                for template in templates:
                    f.write(f"• {template['nome'].replace('_', ' ')}\n")
                    f.write(f"  Estrutura: {template['estrutura']}\n")
                    f.write(f"  Eficácia: {template['eficacia']}\n")
                    f.write(f"  Uso: {template['uso_recomendado']}\n\n")
            else:
                f.write("📝 Nenhum template específico identificado\n\n")

            # Recomendações
            f.write("🎯 RECOMENDAÇÕES ESTRATÉGICAS:\n")
            f.write("-" * 30 + "\n")
            recomendacoes = video_copy.get("recomendacoes_estrategicas", [])
            if recomendacoes:
                for i, rec in enumerate(recomendacoes, 1):
                    f.write(f"{i}. [{rec['prioridade']}] {rec['categoria']}\n")
                    f.write(f"   {rec['recomendacao']}\n\n")
            else:
                f.write("✅ Nenhuma recomendação crítica - vídeo bem otimizado\n\n")

            # Timeline resumida
            f.write("⏰ TIMELINE DE ELEMENTOS (RESUMIDA):\n")
            f.write("-" * 30 + "\n")
            timeline_ganchos = video_copy.get("timestamp", {}).get("ganchos_timeline", [])
            timeline_ctas = video_copy.get("timestamp", {}).get("ctas_timeline", [])

            todos_elementos = []
            for item in timeline_ganchos:
                todos_elementos.append((item["minuto"], item["segundo"], "GANCHO", item["tipo"]))
            for item in timeline_ctas:
                todos_elementos.append((item["minuto"], item["segundo"], "CTA", item["tipo"]))

            todos_elementos.sort()

            if todos_elementos:
                for minuto, segundo, categoria, tipo in todos_elementos:
                    f.write(f"[{minuto:02d}:{segundo:02d}] {categoria}: {tipo.replace('_', ' ').title()}\n")
            else:
                f.write("Nenhum elemento temporal mapeado\n")

            f.write("\n" + "="*60 + "\n")
            f.write("Relatório gerado pelo sistema de engenharia reversa\n")
            f.write("Para implementar as recomendações, consulte o dashboard principal\n")
            f.write("="*60 + "\n")

    print(f"  ✅ {len(dados['copywriting'])} relatórios individuais gerados")

# Função principal de execução
def executar_integracao_copywriting_dashboard():
    """Função principal para executar a integração"""
    print("🚀 EXECUTANDO INTEGRAÇÃO DE COPYWRITING NO DASHBOARD EXISTENTE")
    print("="*70)

    try:
        dashboard_atualizado = integrar_copywriting_dashboard_existente()

        if dashboard_atualizado:
            print("\n" + "="*70)
            print("✅ INTEGRAÇÃO CONCLUÍDA COM SUCESSO!")
            print("="*70)
            print(f"📊 Dashboard atualizado: {os.path.basename(dashboard_atualizado)}")
            print("\n📋 ABAS ADICIONADAS:")
            print("  • Copywriting Estratégico - Análise completa por vídeo")
            print("  • Templates Replicáveis - Estruturas identificadas")
            print("  • Timeline Persuasão - Mapeamento temporal")
            print("  • Recomendações Copy - Plano de ação 30 dias")
            print("  • Dashboard Principal - Atualizada com métricas")

            print(f"\n🎯 PRÓXIMOS PASSOS:")
            print("1. Abra o dashboard e revise a aba 'Copywriting Estratégico'")
            print("2. Identifique vídeos com score < 50 para otimização")
            print("3. Implemente CTAs nos vídeos marcados como CRÍTICO")
            print("4. Aplique templates identificados em novos vídeos")
            print("5. Siga o plano de ação de 30 dias na aba 'Recomendações Copy'")

        else:
            print("\n❌ Falha na integração - verifique os pré-requisitos")

    except Exception as e:
        print(f"\n❌ Erro de Execução: {type(e).__name__}: {e}")
        import traceback
        traceback.print_exc()

# Executar a integração
if __name__ == "__main__":
    executar_integracao_copywriting_dashboard()

In [None]:
# ============================================================================
# LAYER 2.4: GERAÇÃO DE LEGENDAS E ANÁLISE DE COPYWRITING - VERSÃO FINAL
# ============================================================================

import re
from datetime import timedelta, datetime
from collections import Counter
import json
import os

def processar_copywriting_todos_videos_adaptado():
    """Processa análise de copywriting adaptada para o sistema existente"""
    print("🔄 Iniciando processamento de copywriting adaptado...")

    # Verificar pré-requisitos baseado na estrutura existente
    if not "PASTA_TRABALHO" in globals():
        print("❌ Variáveis globais não encontradas. Execute a CÉLULA 1.2 primeiro.")
        return

    pasta_dados = os.path.join(PASTA_TRABALHO, "dados")
    if not os.path.exists(pasta_dados):
        print("❌ Pasta de dados não encontrada. Execute as células anteriores primeiro.")
        return

    # Buscar dados de decomposição (nome correto do arquivo)
    decomposicao_path = os.path.join(pasta_dados, "decomposicao_completa.json")

    if not os.path.exists(decomposicao_path):
        print("❌ Dados de decomposição não encontrados. Execute a CÉLULA 2.3 primeiro.")
        print(f"Procurando arquivo: {decomposicao_path}")
        return

    try:
        with open(decomposicao_path, "r", encoding="utf-8") as f:
            decomposicoes_data = json.load(f)

        print(f"✅ Dados de decomposição carregados: {len(decomposicoes_data)} vídeos encontrados")
    except Exception as e:
        print(f"❌ Erro ao carregar dados de decomposição: {e}")
        return

    # Filtrar apenas vídeos com status "decomposto" e que tenham transcrição
    videos_validos = []
    for decomposicao in decomposicoes_data:
        if (decomposicao.get("status") == "decomposto" and
            decomposicao.get("audio_transcrito") and
            len(decomposicao.get("audio_transcrito", "").strip()) > 10):
            videos_validos.append(decomposicao)

    if not videos_validos:
        print("❌ Nenhum vídeo com transcrição válida encontrado.")
        print("Verifique se a CÉLULA 2.3 foi executada com sucesso e se os vídeos possuem áudio.")
        return

    print(f"📊 Processando {len(videos_validos)} vídeos com transcrição válida...")

    analises_copywriting = []
    legendas_geradas = []

    for i, decomposicao in enumerate(videos_validos, 1):
        video_id = decomposicao["video_id"]
        audio_transcrito = decomposicao["audio_transcrito"]

        print(f"[{i}/{len(videos_validos)}] Processando copywriting para: {video_id}")

        try:
            # Estimar duração do vídeo baseado na análise de áudio
            duracao_segundos = decomposicao.get("audio_analise", {}).get("duracao_audio_segundos", 30)

            # Criar info do vídeo para compatibilidade
            video_info = {
                "id": video_id,
                "duracao_segundos": duracao_segundos
            }

            # Gerar legendas
            legendas_data, srt_path, txt_path = gerar_legendas_com_timestamps(video_info, decomposicao)

            if legendas_data:
                legendas_info = {
                    "video_id": video_id,
                    "srt_path": srt_path,
                    "txt_path": txt_path,
                    "total_segmentos": len(legendas_data),
                    "duracao_total": duracao_segundos,
                    "legendas_data": legendas_data
                }
                legendas_geradas.append(legendas_info)

                # Análise de copywriting
                analise_copy = analisar_copywriting_estrategico(legendas_data, video_id)
                analises_copywriting.append(analise_copy)

                print(f"  ✅ Copywriting analisado: Score {analise_copy['score_persuasao']}/100")
            else:
                print(f"  ❌ Falha na geração de legendas para {video_id}")

        except Exception as e:
            print(f"  ❌ Erro no processamento de copywriting para {video_id}: {e}")

    if not analises_copywriting:
        print("❌ Nenhuma análise de copywriting foi gerada. Verifique os dados de entrada.")
        return

    # Salvar dados de copywriting
    copywriting_path = os.path.join(pasta_dados, "analises_copywriting_completas.json")
    with open(copywriting_path, "w", encoding="utf-8") as f:
        json.dump(analises_copywriting, f, indent=2, ensure_ascii=False)

    print(f"💾 Análises de copywriting salvas em: {copywriting_path}")

    # Salvar dados de legendas
    legendas_path = os.path.join(pasta_dados, "legendas_geradas.json")
    with open(legendas_path, "w", encoding="utf-8") as f:
        json.dump(legendas_geradas, f, indent=2, ensure_ascii=False)

    print(f"💾 Dados de legendas salvos em: {legendas_path}")

    # Atualizar status no config
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
    if os.path.exists(config_path):
        try:
            with open(config_path, "r", encoding="utf-8") as f:
                config = json.load(f)

            config["status_etapas"]["copywriting_analysis"] = True

            with open(config_path, "w", encoding="utf-8") as f:
                json.dump(config, f, indent=2, ensure_ascii=False)
        except:
            print("⚠️ Não foi possível atualizar o arquivo de configuração")

    print(f"\n✅ ANÁLISE DE COPYWRITING CONCLUÍDA!")
    print(f"Total de vídeos com copywriting analisado: {len(analises_copywriting)}")
    print(f"Total de legendas geradas: {len(legendas_geradas)}")
    print(f"\n➡️ PRÓXIMA CÉLULA: 4.3 - INTEGRAÇÃO COM DASHBOARD")

def gerar_legendas_com_timestamps(video_info, decomposicao_data):
    """Gera legendas SRT e TXT com timestamps precisos a partir da transcrição"""
    print("  🔄 Gerando legendas com timestamps...")

    video_id = video_info["id"]
    audio_transcrito = decomposicao_data.get("audio_transcrito", "")

    if not audio_transcrito.strip():
        print("    ❌ Erro: Transcrição de áudio vazia")
        return None, None, None

    # Calcular duração do vídeo
    duracao_segundos = video_info.get("duracao_segundos", 30)  # Default 30s se não informado

    # Dividir texto em segmentos baseados em pontuação e pausas naturais
    segmentos = dividir_texto_em_segmentos(audio_transcrito)

    if not segmentos:
        print("    ❌ Erro: Não foi possível segmentar o texto")
        return None, None, None

    # Calcular timestamps para cada segmento
    legendas_data = []
    duracao_por_segmento = duracao_segundos / len(segmentos) if segmentos else 1

    for i, segmento in enumerate(segmentos):
        inicio_segundos = i * duracao_por_segmento
        fim_segundos = (i + 1) * duracao_por_segmento

        legenda_item = {
            "id": i + 1,
            "inicio": segundos_para_timestamp(inicio_segundos),
            "fim": segundos_para_timestamp(fim_segundos),
            "texto": segmento.strip(),
            "inicio_segundos": inicio_segundos,
            "fim_segundos": fim_segundos
        }
        legendas_data.append(legenda_item)

    # Gerar arquivos SRT e TXT
    pasta_legendas = os.path.join(PASTA_TRABALHO, "legendas")
    os.makedirs(pasta_legendas, exist_ok=True)

    # Arquivo SRT
    srt_path = os.path.join(pasta_legendas, f"{video_id}_legendas.srt")
    gerar_arquivo_srt(legendas_data, srt_path)

    # Arquivo TXT com timestamps
    txt_path = os.path.join(pasta_legendas, f"{video_id}_legendas_timestamped.txt")
    gerar_arquivo_txt_timestamped(legendas_data, txt_path)

    print(f"    ✅ Legendas SRT geradas: {srt_path}")
    print(f"    ✅ Legendas TXT com timestamps geradas: {txt_path}")

    return legendas_data, srt_path, txt_path

def dividir_texto_em_segmentos(texto, max_chars=50):
    """Divide o texto em segmentos lógicos para legendas"""
    # Dividir por frases primeiro
    frases = re.split(r'[.!?]+', texto)
    segmentos = []

    for frase in frases:
        if not frase.strip():
            continue

        # Se a frase é muito longa, dividir por vírgulas ou conjunções
        if len(frase) > max_chars:
            sub_segmentos = re.split(r'[,;]|(?:\s+(?:e|mas|então|porque|que)\s+)', frase)
            for sub in sub_segmentos:
                if sub.strip() and len(sub.strip()) > 3:
                    segmentos.append(sub.strip())
        else:
            if frase.strip() and len(frase.strip()) > 3:
                segmentos.append(frase.strip())

    # Se ainda houver segmentos muito longos, dividir por palavras
    segmentos_finais = []
    for seg in segmentos:
        if len(seg) > max_chars:
            palavras = seg.split()
            temp_seg = ""
            for palavra in palavras:
                if len(temp_seg + " " + palavra) <= max_chars:
                    temp_seg += " " + palavra if temp_seg else palavra
                else:
                    if temp_seg:
                        segmentos_finais.append(temp_seg.strip())
                    temp_seg = palavra
            if temp_seg:
                segmentos_finais.append(temp_seg.strip())
        else:
            segmentos_finais.append(seg)

    return segmentos_finais

def segundos_para_timestamp(segundos):
    """Converte segundos para formato timestamp SRT (HH:MM:SS,mmm)"""
    horas = int(segundos // 3600)
    minutos = int((segundos % 3600) // 60)
    segundos_restantes = segundos % 60
    milissegundos = int((segundos_restantes - int(segundos_restantes)) * 1000)

    return f"{horas:02d}:{minutos:02d}:{int(segundos_restantes):02d},{milissegundos:03d}"

def gerar_arquivo_srt(legendas_data, srt_path):
    """Gera arquivo SRT"""
    with open(srt_path, 'w', encoding='utf-8') as f:
        for legenda in legendas_data:
            f.write(f"{legenda['id']}\n")
            f.write(f"{legenda['inicio']} --> {legenda['fim']}\n")
            f.write(f"{legenda['texto']}\n\n")

def gerar_arquivo_txt_timestamped(legendas_data, txt_path):
    """Gera arquivo TXT com timestamps"""
    with open(txt_path, 'w', encoding='utf-8') as f:
        f.write("TRANSCRIÇÃO COM TIMESTAMPS\n")
        f.write("="*50 + "\n\n")

        for legenda in legendas_data:
            minutos_inicio = int(legenda['inicio_segundos'] // 60)
            segundos_inicio = int(legenda['inicio_segundos'] % 60)
            minutos_fim = int(legenda['fim_segundos'] // 60)
            segundos_fim = int(legenda['fim_segundos'] % 60)

            f.write(f"[{minutos_inicio:02d}:{segundos_inicio:02d}-{minutos_fim:02d}:{segundos_fim:02d}] {legenda['texto']}\n")

def analisar_copywriting_estrategico(legendas_data, video_id):
    """Análise estratégica de copywriting com base nas legendas"""
    print("    🔄 Analisando copywriting...")

    # Combinar todo o texto para análise completa
    texto_completo = " ".join([legenda["texto"] for legenda in legendas_data])

    # Dicionários de padrões de copywriting
    ganchos_patterns = {
        "pergunta_retorica": [r"\b(?:você|tu)\s+(?:já|nunca|sempre|realmente|acha|imagina|sabe|quer|precisa)",
                            r"(?:como|por que|quando|onde|o que).*\?"],
        "urgencia": [r"\b(?:agora|hoje|urgente|rápido|imediato|última chance|só hoje|apenas|restam)",
                     r"\b(?:não perca|aproveite|garante já|corre|últimas vagas)"],
        "escassez": [r"\b(?:limitado|exclusivo|poucos|restam|última|única|especial|VIP)",
                     r"\b(?:só para|apenas para|somente|limitado a)"],
        "autoridade": [r"\b(?:especialista|expert|profissional|anos de experiência|comprovado|testado)",
                       r"\b(?:pesquisas mostram|estudos comprovam|cientificamente)"],
        "prova_social": [r"\b(?:milhares|centenas|todos|muitas pessoas|clientes|depoimentos)",
                         r"\b(?:já conseguiram|transformaram|mudaram|aprovaram)"],
        "curiosidade": [r"\b(?:segredo|descoberta|revelação|método|técnica|estratégia|fórmula)",
                        r"\b(?:ninguém te conta|poucos sabem|descobri que)"],
        "problema_dor": [r"\b(?:problema|dificuldade|frustração|sofre|dor|preocupa|bloqueia)",
                         r"\b(?:cansado de|chega de|pare de|não aguenta mais)"],
        "solucao_resultado": [r"\b(?:solução|resolve|elimina|transforma|muda|resultado|sucesso)",
                              r"\b(?:conseguir|alcançar|realizar|conquistar|atingir)"]
    }

    gatilhos_patterns = {
        "reciprocidade": [r"\b(?:grátis|de graça|presente|bônus|oferta|sem custo)",
                          r"\b(?:vou te dar|vou ensinar|vou mostrar|compartilhar com você)"],
        "comprometimento": [r"\b(?:compromisso|prometo|garanto|palavra|juro)",
                            r"\b(?:pode confiar|tenho certeza|assumo|responsabilizo)"],
        "aprovacao_social": [r"\b(?:aprovado por|recomendado|indicado|usado por|preferido)",
                             r"\b(?:famosos|influencers|especialistas|médicos|profissionais)"],
        "aversao_perda": [r"\b(?:perder|perdendo|vai ficar de fora|não vai conseguir)",
                          r"\b(?:sair perdendo|ficar para trás|oportunidade perdida)"],
        "autoridade_especialista": [r"\b(?:Dr|Dra|Professor|Mestre|PhD|especialista em)",
                                    r"\b(?:formado em|pós-graduado|anos estudando)"],
        "emocional_medo": [r"\b(?:medo|receio|preocupação|insegurança|ansiedade)",
                           r"\b(?:não conseguir|fracassar|dar errado|prejudicar)"],
        "emocional_esperanca": [r"\b(?:sonho|esperança|desejo|objetivo|meta|futuro melhor)",
                                r"\b(?:realizar|conquistar|alcançar|transformar|mudar vida)"]
    }

    ctas_patterns = {
        "acao_imediata": [r"\b(?:clica|clique|acesse|baixe|faça|compre|adquira|garanta)",
                          r"\b(?:não perca|aproveite|corre|vai|vem|participe)"],
        "link_bio": [r"\b(?:link na bio|bio|biografia|perfil|stories|direct)",
                     r"\b(?:DM|chama no WhatsApp|manda mensagem)"],
        "engajamento": [r"\b(?:comenta|compartilha|marca|salva|curte|like|segue)",
                        r"\b(?:conta nos comentários|deixa um|comenta aqui)"],
        "inscricao": [r"\b(?:inscreve|se inscreva|ativa|ativar|sino|notificação)",
                      r"\b(?:cadastra|cadastre-se|registra|assine)"],
        "contato_vendas": [r"\b(?:WhatsApp|telefone|ligue|chama|fala comigo|contato)",
                           r"\b(?:agende|marque|consulta|reunião|conversa)"]
    }

    # Análise dos padrões
    ganchos_encontrados = {}
    gatilhos_encontrados = {}
    ctas_encontrados = {}

    # Analisar ganchos
    for tipo, patterns in ganchos_patterns.items():
        matches = []
        for pattern in patterns:
            matches.extend(re.finditer(pattern, texto_completo, re.IGNORECASE))
        if matches:
            ganchos_encontrados[tipo] = {
                "count": len(matches),
                "exemplos": [m.group() for m in matches[:3]],  # Top 3 exemplos
                "timestamps": encontrar_timestamps_matches(matches, legendas_data, texto_completo)
            }

    # Analisar gatilhos
    for tipo, patterns in gatilhos_patterns.items():
        matches = []
        for pattern in patterns:
            matches.extend(re.finditer(pattern, texto_completo, re.IGNORECASE))
        if matches:
            gatilhos_encontrados[tipo] = {
                "count": len(matches),
                "exemplos": [m.group() for m in matches[:3]],
                "timestamps": encontrar_timestamps_matches(matches, legendas_data, texto_completo)
            }

    # Analisar CTAs
    for tipo, patterns in ctas_patterns.items():
        matches = []
        for pattern in patterns:
            matches.extend(re.finditer(pattern, texto_completo, re.IGNORECASE))
        if matches:
            ctas_encontrados[tipo] = {
                "count": len(matches),
                "exemplos": [m.group() for m in matches[:3]],
                "timestamps": encontrar_timestamps_matches(matches, legendas_data, texto_completo)
            }

    # Análise de estrutura narrativa
    estrutura_narrativa = analisar_estrutura_narrativa(legendas_data)

    # Análise de poder de persuasão
    score_persuasao = calcular_score_persuasao(ganchos_encontrados, gatilhos_encontrados, ctas_encontrados)

    analise_copywriting = {
        "video_id": video_id,
        "texto_completo": texto_completo,
        "total_palavras": len(texto_completo.split()),
        "ganchos_detectados": ganchos_encontrados,
        "gatilhos_mentais_detectados": gatilhos_encontrados,
        "ctas_detectados": ctas_encontrados,
        "estrutura_narrativa": estrutura_narrativa,
        "score_persuasao": score_persuasao,
        "recomendacoes_estrategicas": gerar_recomendacoes_copywriting(ganchos_encontrados, gatilhos_encontrados, ctas_encontrados),
        "templates_identificados": identificar_templates_replicaveis(ganchos_encontrados, gatilhos_encontrados, ctas_encontrados),
        "timestamp": {
            "ganchos_timeline": mapear_timeline_elementos(ganchos_encontrados, legendas_data),
            "gatilhos_timeline": mapear_timeline_elementos(gatilhos_encontrados, legendas_data),
            "ctas_timeline": mapear_timeline_elementos(ctas_encontrados, legendas_data)
        },
        "data_analise": datetime.now().isoformat()
    }

    return analise_copywriting

def encontrar_timestamps_matches(matches, legendas_data, texto_completo):
    """Encontra os timestamps correspondentes aos matches encontrados"""
    timestamps = []

    for match in matches[:3]:  # Limitar a 3 exemplos
        posicao = match.start()
        char_count = 0

        for legenda in legendas_data:
            texto_legenda = legenda["texto"]
            if char_count <= posicao < char_count + len(texto_legenda):
                timestamps.append({
                    "minuto": int(legenda["inicio_segundos"] // 60),
                    "segundo": int(legenda["inicio_segundos"] % 60),
                    "texto_contexto": texto_legenda
                })
                break
            char_count += len(texto_legenda) + 1  # +1 para o espaço entre legendas

    return timestamps

def analisar_estrutura_narrativa(legendas_data):
    """Analisa a estrutura narrativa do vídeo"""
    total_segmentos = len(legendas_data)

    if total_segmentos < 3:
        return {
            "abertura": {"segmentos": total_segmentos, "elementos": []},
            "desenvolvimento": {"segmentos": 0, "elementos": []},
            "fechamento": {"segmentos": 0, "elementos": []}
        }

    # Dividir em terços para análise
    primeiro_terco = legendas_data[:total_segmentos//3]
    segundo_terco = legendas_data[total_segmentos//3:2*total_segmentos//3]
    ultimo_terco = legendas_data[2*total_segmentos//3:]

    estrutura = {
        "abertura": {
            "segmentos": len(primeiro_terco),
            "elementos": analisar_elementos_abertura(primeiro_terco)
        },
        "desenvolvimento": {
            "segmentos": len(segundo_terco),
            "elementos": analisar_elementos_desenvolvimento(segundo_terco)
        },
        "fechamento": {
            "segmentos": len(ultimo_terco),
            "elementos": analisar_elementos_fechamento(ultimo_terco)
        }
    }

    return estrutura

def analisar_elementos_abertura(segmentos):
    """Analisa elementos da abertura"""
    texto = " ".join([s["texto"] for s in segmentos])
    elementos = []

    if re.search(r'\b(?:você|tu)\s+(?:já|nunca|sempre)', texto, re.IGNORECASE):
        elementos.append("pergunta_engajamento")
    if re.search(r'\b(?:vou te|vou mostrar|vou ensinar)', texto, re.IGNORECASE):
        elementos.append("promessa_valor")
    if re.search(r'\b(?:segredo|descoberta|método)', texto, re.IGNORECASE):
        elementos.append("curiosidade")

    return elementos

def analisar_elementos_desenvolvimento(segmentos):
    """Analisa elementos do desenvolvimento"""
    texto = " ".join([s["texto"] for s in segmentos])
    elementos = []

    if re.search(r'\b(?:porque|pois|isso acontece)', texto, re.IGNORECASE):
        elementos.append("explicacao")
    if re.search(r'\b(?:exemplo|caso|situação)', texto, re.IGNORECASE):
        elementos.append("exemplificacao")
    if re.search(r'\b(?:resultado|consegui|transformou)', texto, re.IGNORECASE):
        elementos.append("prova_resultado")

    return elementos

def analisar_elementos_fechamento(segmentos):
    """Analisa elementos do fechamento"""
    texto = " ".join([s["texto"] for s in segmentos])
    elementos = []

    if re.search(r'\b(?:clica|clique|acesse|faça)', texto, re.IGNORECASE):
        elementos.append("call_to_action")
    if re.search(r'\b(?:link|bio|WhatsApp)', texto, re.IGNORECASE):
        elementos.append("direcionamento")
    if re.search(r'\b(?:comenta|compartilha|segue)', texto, re.IGNORECASE):
        elementos.append("engajamento")

    return elementos

def calcular_score_persuasao(ganchos, gatilhos, ctas):
    """Calcula score de persuasão baseado nos elementos encontrados"""
    score = 0

    # Pontuação por variedade de ganchos
    score += len(ganchos) * 10

    # Pontuação por variedade de gatilhos
    score += len(gatilhos) * 15

    # Pontuação por presença de CTAs
    score += len(ctas) * 20

    # Bônus por combinações poderosas
    if "urgencia" in ganchos and "aversao_perda" in gatilhos:
        score += 25

    if "autoridade" in ganchos and "autoridade_especialista" in gatilhos:
        score += 20

    if "curiosidade" in ganchos and any(cta in ctas for cta in ["acao_imediata", "link_bio"]):
        score += 30

    return min(score, 100)  # Limitar a 100

def gerar_recomendacoes_copywriting(ganchos, gatilhos, ctas):
    """Gera recomendações estratégicas baseadas na análise"""
    recomendacoes = []

    # Recomendações para ganchos
    if len(ganchos) < 2:
        recomendacoes.append({
            "categoria": "GANCHOS",
            "prioridade": "ALTA",
            "recomendacao": "Adicione mais ganchos na abertura. Use perguntas retóricas ou desperte curiosidade nos primeiros 3 segundos."
        })

    if "pergunta_retorica" not in ganchos:
        recomendacoes.append({
            "categoria": "GANCHOS",
            "prioridade": "MÉDIA",
            "recomendacao": "Inicie com uma pergunta que faça o viewer refletir sobre sua situação atual."
        })

    # Recomendações para gatilhos
    if len(gatilhos) < 3:
        recomendacoes.append({
            "categoria": "GATILHOS",
            "prioridade": "ALTA",
            "recomendacao": "Incorpore mais gatilhos mentais. Combine autoridade + prova social para maior credibilidade."
        })

    if "reciprocidade" not in gatilhos:
        recomendacoes.append({
            "categoria": "GATILHOS",
            "prioridade": "MÉDIA",
            "recomendacao": "Ofereça valor gratuito para ativar o gatilho da reciprocidade."
        })

    # Recomendações para CTAs
    if len(ctas) == 0:
        recomendacoes.append({
            "categoria": "CTA",
            "prioridade": "CRÍTICA",
            "recomendacao": "URGENTE: Adicione pelo menos um Call-to-Action claro. Sem CTA, não há conversão."
        })

    if "acao_imediata" not in ctas and "link_bio" not in ctas:
        recomendacoes.append({
            "categoria": "CTA",
            "prioridade": "ALTA",
            "recomendacao": "Termine com um CTA direto: 'Clica no link da bio' ou 'Chama no WhatsApp'."
        })

    return recomendacoes

def identificar_templates_replicaveis(ganchos, gatilhos, ctas):
    """Identifica templates e estruturas replicáveis"""
    templates = []

    # Template: Pergunta + Autoridade + CTA
    if "pergunta_retorica" in ganchos and "autoridade" in ganchos and len(ctas) > 0:
        templates.append({
            "nome": "PERGUNTA_AUTORIDADE_CTA",
            "estrutura": "Pergunta Retórica → Estabelecer Autoridade → Call-to-Action",
            "eficacia": "ALTA",
            "uso_recomendado": "Vídeos educativos e de expertise"
        })

    # Template: Problema + Solução + Prova Social
    if "problema_dor" in ganchos and "solucao_resultado" in ganchos and "aprovacao_social" in gatilhos:
        templates.append({
            "nome": "PROBLEMA_SOLUCAO_PROVA",
            "estrutura": "Identificar Problema → Apresentar Solução → Mostrar Prova Social",
            "eficacia": "MUITO ALTA",
            "uso_recomendado": "Vídeos de vendas e transformação"
        })

    # Template: Curiosidade + Urgência + CTA
    if "curiosidade" in ganchos and "urgencia" in ganchos and "acao_imediata" in ctas:
        templates.append({
            "nome": "CURIOSIDADE_URGENCIA_ACAO",
            "estrutura": "Despertar Curiosidade → Criar Urgência → Ação Imediata",
            "eficacia": "ALTA",
            "uso_recomendado": "Vídeos de lançamento e ofertas limitadas"
        })

    return templates

def mapear_timeline_elementos(elementos_detectados, legendas_data):
    """Mapeia os elementos detectados na timeline do vídeo"""
    timeline = []

    for tipo, dados in elementos_detectados.items():
        for timestamp in dados.get("timestamps", []):
            timeline.append({
                "tipo": tipo,
                "minuto": timestamp["minuto"],
                "segundo": timestamp["segundo"],
                "contexto": timestamp["texto_contexto"]
            })

    # Ordenar por tempo
    timeline.sort(key=lambda x: (x["minuto"], x["segundo"]))

    return timeline

# Executar o processamento
try:
    processar_copywriting_todos_videos_adaptado()
except Exception as e:
    print(f"❌ ERRO de Execução: {type(e).__name__}: {e}")
    import traceback
    traceback.print_exc()

In [None]:
# ============================================================================
# CÉLULA 2.4: GERAÇÃO DE LEGENDAS E ANÁLISE DE COPYWRITING
# ============================================================================

# Definir a variável global PASTA_TRABALHO se ainda não estiver definida
# Certifique-se de que esta variável esteja definida corretamente em uma célula anterior (ex: Célula 1.2)
# Exemplo: PASTA_TRABALHO = "/content/drive/MyDrive/Videos Dona Done/_engenharia_reversa"

# Executar a função principal da Layer 2.4
if 'PASTA_TRABALHO' in globals():
    print("Iniciando a Layer 2.4: Geração de Legendas e Análise de Copywriting...")
    processar_copywriting_todos_videos_adaptado()
else:
    print("ERRO: A variável PASTA_TRABALHO não está definida. Certifique-se de executar a Célula 1.2 ou equivalente.")

In [None]:
# ============================================================================
# CÉLULA 4.3: DASHBOARD MASTER EXECUTIVO INTELIGENTE APRIMORADO
# ============================================================================
import pandas as pd
import json
import os
import numpy as np
from datetime import datetime
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows
from openpyxl.styles import Font, Alignment, PatternFill
from collections import Counter
import warnings
warnings.filterwarnings('ignore')

def log_progress(message):
    """Log de progresso em tempo real"""
    timestamp = datetime.now().strftime("%H:%M:%S")
    print(f"[{timestamp}] {message}")

def calculate_viral_score(row):
    """Calcula score de viralidade baseado em múltiplos fatores"""
    try:
        score = 0

        # Fator 1: Ritmo (cortes por segundo) - peso 25%
        if pd.notna(row['duracao_segundos']) and row['duracao_segundos'] > 0:
            cortes_por_seg = row['cortes_detectados_count'] / row['duracao_segundos']
            if cortes_por_seg > 20: score += 25
            elif cortes_por_seg > 10: score += 20
            elif cortes_por_seg > 5: score += 15
            else: score += 10

        # Fator 2: Complexidade Visual - peso 20%
        if pd.notna(row['complexidade_visual_media']):
            if row['complexidade_visual_media'] > 600: score += 20
            elif row['complexidade_visual_media'] > 400: score += 15
            else: score += 10

        # Fator 3: Presença de Texto (OCR) - peso 15%
        if pd.notna(row['ocr_textos_count']):
            if row['ocr_textos_count'] > 10: score += 15
            elif row['ocr_textos_count'] > 5: score += 12
            elif row['ocr_textos_count'] > 0: score += 8

        # Fator 4: Duração Ideal - peso 20%
        if pd.notna(row['duracao_segundos']):
            if 15 <= row['duracao_segundos'] <= 30: score += 20
            elif 10 <= row['duracao_segundos'] <= 45: score += 15
            else: score += 10

        # Fator 5: Gatilhos Psicológicos - peso 20%
        gatilhos = str(row['gatilhos_psicologicos']).lower()
        if 'urgência' in gatilhos or 'escassez' in gatilhos: score += 8
        if 'estímulo' in gatilhos: score += 7
        if 'atenção' in gatilhos: score += 5

        return min(score, 100)
    except:
        return 50

def calculate_technical_score(row):
    """Score técnico baseado em qualidade de produção"""
    try:
        score = 0

        if pd.notna(row['brilho_medio']):
            if 120 <= row['brilho_medio'] <= 180: score += 25
            elif 100 <= row['brilho_medio'] <= 200: score += 20
            else: score += 10

        formato = str(row['formato_detectado'])
        if 'vertical_9_16' in formato: score += 25
        elif 'horizontal_16_9' in formato: score += 20
        else: score += 15

        if row['tem_audio']: score += 25
        else: score += 5

        if pd.notna(row['total_frames']) and row['total_frames'] > 0:
            if row['total_frames'] > 300: score += 25
            elif row['total_frames'] > 150: score += 20
            else: score += 15

        return min(score, 100)
    except:
        return 50

def calculate_content_score(row):
    """Score de conteúdo baseado em riqueza informacional"""
    try:
        score = 0

        ocr_count = row['ocr_textos_count'] if pd.notna(row['ocr_textos_count']) else 0
        audio_len = row['audio_transcrito_len'] if pd.notna(row['audio_transcrito_len']) else 0

        if ocr_count > 5 or audio_len > 100: score += 30
        elif ocr_count > 2 or audio_len > 50: score += 20
        elif ocr_count > 0 or audio_len > 0: score += 15
        else: score += 5

        if pd.notna(row['bpm_audio']):
            if 120 <= row['bpm_audio'] <= 140: score += 35
            elif 100 <= row['bpm_audio'] <= 160: score += 25
            else: score += 15

        if pd.notna(row['duracao_segundos']) and row['duracao_segundos'] > 0:
            densidade = (ocr_count + audio_len/10) / row['duracao_segundos']
            if densidade > 2: score += 35
            elif densidade > 1: score += 25
            else: score += 15

        return min(score, 100)
    except:
        return 50

def generate_insights_from_data(df):
    """Gera insights inteligentes baseados nos dados"""
    insights = []

    try:
        best_performing = df.nlargest(3, 'viral_score')
        avg_duration = best_performing['duracao_segundos'].mean()
        insights.append(f"DURAÇÃO VENCEDORA: Seus top 3 vídeos têm duração média de {avg_duration:.1f}s. Este é seu sweet spot comprovado.")

        avg_cuts_per_sec = (best_performing['cortes_detectados_count'] / best_performing['duracao_segundos']).mean()
        insights.append(f"RITMO IDEAL: {avg_cuts_per_sec:.1f} cortes por segundo é sua fórmula de edição mais eficaz.")

        formato_winner = df['formato_detectado'].mode()[0] if not df['formato_detectado'].empty else 'N/A'
        formato_count = df['formato_detectado'].value_counts().iloc[0] if not df['formato_detectado'].empty else 0
        insights.append(f"FORMATO DOMINANTE: {formato_count} vídeos em {formato_winner}. Este é seu formato de maior alcance.")

        high_viral = df[df['viral_score'] > 70]
        if not high_viral.empty:
            avg_complexity = high_viral['complexidade_visual_media'].mean()
            insights.append(f"COMPLEXIDADE VISUAL ÓTIMA: Vídeos com score viral alto têm complexidade média de {avg_complexity:.0f}. Use como referência.")

        text_heavy = df[df['ocr_textos_count'] > 5]
        if not text_heavy.empty:
            insights.append(f"ESTRATÉGIA DE TEXTO: {len(text_heavy)} vídeos com muito texto têm score médio de {text_heavy['viral_score'].mean():.0f}. Texto na tela impacta performance.")

        # CORRIGIDO: bpm_audio em vez de bmp_audio
        if df['bpm_audio'].notna().any():
            successful_bpm = df[df['viral_score'] > 60]['bpm_audio'].mean()
            insights.append(f"BPM DE SUCESSO: {successful_bpm:.0f} BPM é o ritmo de áudio dos seus vídeos mais virais.")

    except Exception as e:
        log_progress(f"Erro ao gerar insights: {e}")
        insights.append("Insights parciais disponíveis devido a limitações nos dados.")

    return insights

def add_data_to_sheet(ws, data, start_row=1, start_col=1, headers=None):
    """Adiciona dados a uma planilha de forma segura"""
    current_row = start_row

    # Adicionar cabeçalhos se fornecidos
    if headers:
        for col_idx, header in enumerate(headers):
            cell = ws.cell(row=current_row, column=start_col + col_idx)
            cell.value = header
            cell.font = Font(bold=True)
        current_row += 1

    # Adicionar dados
    for row_data in data:
        for col_idx, value in enumerate(row_data):
            cell = ws.cell(row=current_row, column=start_col + col_idx)
            cell.value = value
        current_row += 1

    return current_row

def create_enhanced_dashboard_master(csv_path, json_path, output_path):
    """Cria dashboard master executivo aprimorado"""

    log_progress("INICIANDO CRIAÇÃO DO DASHBOARD MASTER EXECUTIVO INTELIGENTE")

    try:
        # Carregar dados
        log_progress("Carregando dados consolidados...")
        df_consolidado = pd.read_csv(csv_path, encoding='utf-8')

        with open(json_path, 'r', encoding='utf-8') as f:
            dados_detalhados = json.load(f)

        log_progress(f"Dados carregados: {len(df_consolidado)} vídeos encontrados")

        # Pré-processamento inteligente
        log_progress("Processando inteligência artificial dos dados...")

        # Limpar e converter dados
        try:
            df_consolidado['emocoes_predominantes'] = df_consolidado['emocoes_predominantes'].apply(
                lambda x: json.loads(x.replace("'", '"')) if pd.notna(x) and x != '{}' else {}
            )
        except:
            df_consolidado['emocoes_predominantes'] = [{}] * len(df_consolidado)

        # Calcular scores inteligentes
        log_progress("Calculando scores de performance...")
        df_consolidado['viral_score'] = df_consolidado.apply(calculate_viral_score, axis=1)
        df_consolidado['technical_score'] = df_consolidado.apply(calculate_technical_score, axis=1)
        df_consolidado['content_score'] = df_consolidado.apply(calculate_content_score, axis=1)
        df_consolidado['overall_score'] = (df_consolidado['viral_score'] + df_consolidado['technical_score'] + df_consolidado['content_score']) / 3

        # Calcular métricas avançadas
        df_consolidado['cortes_por_segundo'] = df_consolidado['cortes_detectados_count'] / df_consolidado['duracao_segundos'].replace(0, 1)
        df_consolidado['densidade_texto'] = df_consolidado['ocr_textos_count'] / df_consolidado['duracao_segundos'].replace(0, 1)
        df_consolidado['eficiencia_audio'] = df_consolidado['audio_transcrito_len'] / df_consolidado['duracao_segundos'].replace(0, 1)

        log_progress("Gerando insights estratégicos...")
        insights = generate_insights_from_data(df_consolidado)

        # Criar workbook
        log_progress("Criando estrutura do dashboard...")
        wb = Workbook()

        # === ABA 1: EXECUTIVE SUMMARY ===
        log_progress("Criando Executive Summary...")
        ws_summary = wb.active
        ws_summary.title = 'Executive Summary'

        # Header principal
        header_cell = ws_summary.cell(row=1, column=1)
        header_cell.value = 'DASHBOARD MASTER EXECUTIVO - ENGENHARIA REVERSA DE VÍDEOS'
        header_cell.font = Font(bold=True, size=18, color='FFFFFF')
        header_cell.fill = PatternFill(start_color='1F4E79', end_color='1F4E79', fill_type='solid')
        header_cell.alignment = Alignment(horizontal='center', vertical='center')

        # Expandir header manualmente
        for col in range(2, 9):
            cell = ws_summary.cell(row=1, column=col)
            cell.fill = PatternFill(start_color='1F4E79', end_color='1F4E79', fill_type='solid')

        # KPIs Principais
        kpi_cell = ws_summary.cell(row=3, column=1)
        kpi_cell.value = 'INDICADORES DE PERFORMANCE PRINCIPAIS'
        kpi_cell.font = Font(bold=True, size=14)
        kpi_cell.fill = PatternFill(start_color='E7E6E6', end_color='E7E6E6', fill_type='solid')

        kpis_data = [
            ['Total de Vídeos Analisados', len(df_consolidado)],
            ['Score Viral Médio', f"{df_consolidado['viral_score'].mean():.1f}/100"],
            ['Score Técnico Médio', f"{df_consolidado['technical_score'].mean():.1f}/100"],
            ['Score de Conteúdo Médio', f"{df_consolidado['content_score'].mean():.1f}/100"],
            ['Duração Média Otimizada', f"{df_consolidado['duracao_segundos'].mean():.1f}s"],
            ['Ritmo Médio de Cortes', f"{df_consolidado['cortes_por_segundo'].mean():.1f}/seg"],
        ]

        add_data_to_sheet(ws_summary, kpis_data, start_row=4, start_col=1)

        # Top 3 Vídeos
        top3_cell = ws_summary.cell(row=3, column=4)
        top3_cell.value = 'TOP 3 VÍDEOS POR PERFORMANCE'
        top3_cell.font = Font(bold=True, size=14)
        top3_cell.fill = PatternFill(start_color='E7E6E6', end_color='E7E6E6', fill_type='solid')

        top3 = df_consolidado.nlargest(3, 'overall_score')[['nome_arquivo', 'overall_score', 'viral_score', 'technical_score', 'content_score']]

        top3_data = []
        for _, video in top3.iterrows():
            nome_curto = video['nome_arquivo'][:30] + "..." if len(video['nome_arquivo']) > 30 else video['nome_arquivo']
            top3_data.append([
                nome_curto,
                f"{video['overall_score']:.1f}",
                f"{video['viral_score']:.1f}",
                f"{video['technical_score']:.1f}",
                f"{video['content_score']:.1f}"
            ])

        top3_headers = ['Vídeo', 'Score Geral', 'Viral', 'Técnico', 'Conteúdo']
        add_data_to_sheet(ws_summary, top3_data, start_row=4, start_col=4, headers=top3_headers)

        # Insights Estratégicos
        insights_cell = ws_summary.cell(row=12, column=1)
        insights_cell.value = 'INSIGHTS ESTRATÉGICOS BASEADOS EM IA'
        insights_cell.font = Font(bold=True, size=14, color='FFFFFF')
        insights_cell.fill = PatternFill(start_color='C5504B', end_color='C5504B', fill_type='solid')
        insights_cell.alignment = Alignment(horizontal='center')

        # Adicionar insights
        for i, insight in enumerate(insights, 13):
            insight_cell = ws_summary.cell(row=i, column=1)
            insight_cell.value = f"• {insight}"
            insight_cell.alignment = Alignment(wrap_text=True)

        # === ABA 2: ANÁLISE DE PERFORMANCE ===
        log_progress("Criando Análise de Performance...")
        ws_performance = wb.create_sheet('Análise de Performance')

        perf_header = ws_performance.cell(row=1, column=1)
        perf_header.value = 'ANÁLISE DETALHADA DE PERFORMANCE'
        perf_header.font = Font(bold=True, size=16)
        perf_header.alignment = Alignment(horizontal='center')

        # Ranking completo
        ranking_data = df_consolidado[['nome_arquivo', 'overall_score', 'viral_score', 'technical_score', 'content_score',
                                     'duracao_segundos', 'cortes_por_segundo', 'formato_detectado']].sort_values('overall_score', ascending=False)

        ranking_list = []
        for _, video in ranking_data.iterrows():
            nome_curto = video['nome_arquivo'][:40] + "..." if len(video['nome_arquivo']) > 40 else video['nome_arquivo']
            ranking_list.append([
                nome_curto,
                f"{video['overall_score']:.1f}",
                f"{video['viral_score']:.1f}",
                f"{video['technical_score']:.1f}",
                f"{video['content_score']:.1f}",
                f"{video['duracao_segundos']:.1f}s",
                f"{video['cortes_por_segundo']:.1f}",
                video['formato_detectado']
            ])

        ranking_headers = ['Vídeo', 'Score Geral', 'Viral', 'Técnico', 'Conteúdo', 'Duração', 'Cortes/s', 'Formato']
        add_data_to_sheet(ws_performance, ranking_list, start_row=3, start_col=1, headers=ranking_headers)

        # === ABA 3: INTELIGÊNCIA TÉCNICA ===
        log_progress("Criando Inteligência Técnica...")
        ws_tecnica = wb.create_sheet('Inteligência Técnica')

        tec_header = ws_tecnica.cell(row=1, column=1)
        tec_header.value = 'ANÁLISE TÉCNICA AVANÇADA'
        tec_header.font = Font(bold=True, size=16)
        tec_header.alignment = Alignment(horizontal='center')

        # Análise de correlações
        corr_header = ws_tecnica.cell(row=3, column=1)
        corr_header.value = 'CORRELAÇÕES DESCOBERTAS'
        corr_header.font = Font(bold=True, size=12)

        correlations_data = [
            ['Duração vs Score Viral', f"{df_consolidado['duracao_segundos'].corr(df_consolidado['viral_score']):.3f}", 'CORRELAÇÃO MODERADA'],
            ['Cortes/s vs Score Viral', f"{df_consolidado['cortes_por_segundo'].corr(df_consolidado['viral_score']):.3f}", 'CORRELAÇÃO MODERADA'],
            ['Complexidade Visual vs Performance', f"{df_consolidado['complexidade_visual_media'].corr(df_consolidado['overall_score']):.3f}", 'CORRELAÇÃO FRACA'],
            ['BPM vs Engajamento', f"{df_consolidado['bpm_audio'].corr(df_consolidado['viral_score']) if df_consolidado['bpm_audio'].notna().any() else 0:.3f}", 'CORRELAÇÃO FRACA'],
        ]

        corr_headers = ['Métrica', 'Correlação', 'Classificação']
        add_data_to_sheet(ws_tecnica, correlations_data, start_row=4, start_col=1, headers=corr_headers)

        # === ABA 4: BLUEPRINT DE PRODUÇÃO ===
        log_progress("Criando Blueprint de Produção...")
        ws_blueprint = wb.create_sheet('Blueprint de Produção')

        bp_header = ws_blueprint.cell(row=1, column=1)
        bp_header.value = 'BLUEPRINT ESTRATÉGICO DE PRODUÇÃO'
        bp_header.font = Font(bold=True, size=16, color='FFFFFF')
        bp_header.fill = PatternFill(start_color='1F4E79', end_color='1F4E79', fill_type='solid')
        bp_header.alignment = Alignment(horizontal='center')

        # Receita de sucesso baseada nos top performers
        top_performers = df_consolidado[df_consolidado['overall_score'] > df_consolidado['overall_score'].quantile(0.7)]

        blueprint_data = [
            ['DURAÇÃO IDEAL', f"{top_performers['duracao_segundos'].mean():.1f} segundos (±{top_performers['duracao_segundos'].std():.1f}s)"],
            ['RITMO DE EDIÇÃO', f"{top_performers['cortes_por_segundo'].mean():.1f} cortes por segundo"],
            ['FORMATO VENCEDOR', top_performers['formato_detectado'].mode()[0] if not top_performers.empty else 'N/A'],
            ['COMPLEXIDADE VISUAL', f"Nível {top_performers['complexidade_visual_media'].mean():.0f} (escala de estímulo)"],
            ['BPM RECOMENDADO', f"{top_performers['bpm_audio'].mean():.0f} BPM" if top_performers['bpm_audio'].notna().any() else 'N/A'],
            ['DENSIDADE DE TEXTO', f"{top_performers['densidade_texto'].mean():.1f} textos por segundo"],
        ]

        bp_sub_header = ws_blueprint.cell(row=3, column=1)
        bp_sub_header.value = 'FÓRMULA DE SUCESSO BASEADA EM DADOS'
        bp_sub_header.font = Font(bold=True, size=12)

        add_data_to_sheet(ws_blueprint, blueprint_data, start_row=4, start_col=1)

        # === ABA 5: RECOMENDAÇÕES ESTRATÉGICAS ===
        log_progress("Criando Recomendações Estratégicas...")
        ws_recomendacoes = wb.create_sheet('Recomendações Estratégicas')

        rec_header = ws_recomendacoes.cell(row=1, column=1)
        rec_header.value = 'RECOMENDAÇÕES ESTRATÉGICAS BASEADAS EM IA'
        rec_header.font = Font(bold=True, size=16, color='FFFFFF')
        rec_header.fill = PatternFill(start_color='C5504B', end_color='C5504B', fill_type='solid')
        rec_header.alignment = Alignment(horizontal='center')

        # Recomendações inteligentes baseadas nos dados
        recommendations = []

        # Análise de duração
        if df_consolidado['duracao_segundos'].mean() > 60:
            recommendations.append(['DURAÇÃO', 'REDUZA DURAÇÃO', 'Seus vídeos estão longos demais. Vídeos de 15-30s têm melhor performance.', 'ALTA'])
        elif df_consolidado['duracao_segundos'].mean() < 15:
            recommendations.append(['DURAÇÃO', 'AUMENTE DURAÇÃO', 'Vídeos muito curtos podem não transmitir valor suficiente.', 'MÉDIA'])

        # Análise de ritmo
        avg_cuts_per_sec = df_consolidado['cortes_por_segundo'].mean()
        if avg_cuts_per_sec < 5:
            recommendations.append(['EDIÇÃO', 'ACELERE O RITMO', 'Aumente o número de cortes para manter atenção. Meta: 8-12 cortes/segundo.', 'ALTA'])
        elif avg_cuts_per_sec > 20:
            recommendations.append(['EDIÇÃO', 'DIMINUA CORTES', 'Muitos cortes podem causar fadiga visual. Encontre o equilíbrio.', 'MÉDIA'])

        # Análise de formato
        formato_dominante = df_consolidado['formato_detectado'].mode()[0] if not df_consolidado['formato_detectado'].empty else 'N/A'
        if 'horizontal' in formato_dominante.lower():
            recommendations.append(['FORMATO', 'FOQUE EM VERTICAL', 'Formato vertical (9:16) tem melhor performance em redes sociais.', 'ALTA'])

        # Análise de texto
        if df_consolidado['densidade_texto'].mean() < 1:
            recommendations.append(['CONTEÚDO', 'ADICIONE MAIS TEXTO', 'Textos na tela aumentam retenção e acessibilidade.', 'MÉDIA'])

        rec_headers = ['Categoria', 'Ação', 'Justificativa', 'Prioridade']
        add_data_to_sheet(ws_recomendacoes, recommendations, start_row=3, start_col=1, headers=rec_headers)

        # Salvar arquivo
        log_progress("Salvando dashboard...")
        wb.save(output_path)

        log_progress("DASHBOARD MASTER EXECUTIVO CRIADO COM SUCESSO!")
        log_progress(f"Arquivo salvo em: {output_path}")
        log_progress(f"{len(df_consolidado)} vídeos analisados")
        log_progress(f"{len(insights)} insights estratégicos gerados")
        log_progress(f"{len(recommendations)} recomendações criadas")

        return True

    except Exception as e:
        log_progress(f"ERRO CRÍTICO: {e}")
        log_progress("Verifique os arquivos de entrada e tente novamente")
        return False

def main():
    """Função principal de execução"""
    log_progress("INICIANDO SISTEMA DE DASHBOARD INTELIGENTE")

    # Configurar caminhos
    BASE_PATH = "/content/drive/MyDrive/Videos Dona Done/_engenharia_reversa"
    CSV_PATH = os.path.join(BASE_PATH, "dashboard", "dados_consolidados.csv")
    JSON_PATH = os.path.join(BASE_PATH, "dashboard", "dados_detalhados.json")
    OUTPUT_PATH = os.path.join(BASE_PATH, "dashboard", "DASHBOARD_MASTER_EXECUTIVO_INTELIGENTE.xlsx")

    # Verificar se arquivos existem
    if not os.path.exists(CSV_PATH):
        log_progress(f"ERRO: Arquivo CSV não encontrado: {CSV_PATH}")
        return False

    if not os.path.exists(JSON_PATH):
        log_progress(f"ERRO: Arquivo JSON não encontrado: {JSON_PATH}")
        return False

    # Executar criação do dashboard
    success = create_enhanced_dashboard_master(CSV_PATH, JSON_PATH, OUTPUT_PATH)

    if success:
        log_progress("PROCESSO CONCLUÍDO COM SUCESSO!")
        log_progress("Dashboard inteligente pronto para uso estratégico")
    else:
        log_progress("PROCESSO FALHOU - Verifique os logs acima")

    return success

if __name__ == "__main__":
    main()

In [None]:
# ============================================================================
# LAYER 4.3: INTEGRAÇÃO DE COPYWRITING NO DASHBOARD EXISTENTE
# ============================================================================

import os
import json
import pandas as pd
from openpyxl import load_workbook
from openpyxl.styles import Font, PatternFill, Alignment

def integrar_copywriting_dashboard_existente():
    """Integra análise de copywriting no dashboard master existente"""
    print("🔄 Iniciando integração de copywriting no dashboard existente...")

    # Verificar pré-requisitos
    prerequisito_ok, config = verificar_prerequisito_etapa('copywriting_analysis')
    if not prerequisito_ok:
        return

    # Localizar dashboard existente
    pasta_dashboard = os.path.join(PASTA_TRABALHO, "dashboard")
    dashboard_existente = None

    # Procurar arquivo de dashboard existente
    if os.path.exists(pasta_dashboard):
        arquivos = os.listdir(pasta_dashboard)
        for arquivo in arquivos:
            if "DASHBOARD_MASTER_EXECUTIVO_INTELIGENTE" in arquivo and arquivo.endswith(".xlsx"):
                dashboard_existente = os.path.join(pasta_dashboard, arquivo)
                break

    if not dashboard_existente:
        print("❌ Dashboard master existente não encontrado!")
        print("Execute primeiro a célula 4.2 (Blueprint Final) para criar o dashboard base.")
        return

    print(f"  📊 Dashboard encontrado: {os.path.basename(dashboard_existente)}")

    # Carregar dados de copywriting
    dados_copywriting = carregar_dados_copywriting()
    if not dados_copywriting:
        return

    # Abrir workbook existente
    try:
        wb = load_workbook(dashboard_existente)
        print(f"  ✅ Dashboard carregado com {len(wb.sheetnames)} abas existentes")

        # Adicionar novas abas de copywriting
        adicionar_aba_copywriting_estrategico(wb, dados_copywriting)
        adicionar_aba_templates_copy(wb, dados_copywriting)
        adicionar_aba_timeline_copy(wb, dados_copywriting)
        adicionar_aba_recomendacoes_copy(wb, dados_copywriting)

        # Atualizar aba principal com métricas de copywriting
        atualizar_aba_principal_com_copy(wb, dados_copywriting)

        # Salvar dashboard atualizado
        wb.save(dashboard_existente)

        print(f"✅ Dashboard atualizado com análise de copywriting!")
        print(f"📊 Arquivo: {dashboard_existente}")
        print(f"📋 Novas abas adicionadas:")
        print("  • Copywriting Estratégico")
        print("  • Templates Replicáveis")
        print("  • Timeline Persuasão")
        print("  • Recomendações Copy")
        print("  • Dashboard Principal (atualizada)")

        # Gerar relatórios complementares
        gerar_relatorios_copywriting_individuais(dados_copywriting)

        # Atualizar config
        config["status_etapas"]["dashboard_copywriting_integrado"] = True
        config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")
        with open(config_path, "w", encoding="utf-8") as f:
            json.dump(config, f, indent=2, ensure_ascii=False)

        return dashboard_existente

    except Exception as e:
        print(f"❌ Erro ao atualizar dashboard: {e}")
        import traceback
        traceback.print_exc()
        return None

def verificar_prerequisito_etapa(etapa):
    """Verifica se uma etapa foi executada"""
    config_path = os.path.join(PASTA_TRABALHO, "config", "config.json")

    if not os.path.exists(config_path):
        print(f"❌ Arquivo de configuração não encontrado: {config_path}")
        return False, None

    try:
        with open(config_path, "r", encoding="utf-8") as f:
            config = json.load(f)

        if not config.get("status_etapas", {}).get(etapa, False):
            print(f"❌ Pré-requisito não atendido: {etapa}")
            print("Execute primeiro a célula correspondente.")
            return False, None

        return True, config

    except Exception as e:
        print(f"❌ Erro ao verificar pré-requisitos: {e}")
        return False, None

def carregar_dados_copywriting():
    """Carrega dados de copywriting e outros dados necessários"""
    print("  📊 Carregando dados de copywriting...")

    try:
        # Dados de copywriting
        copywriting_path = os.path.join(PASTA_TRABALHO, "dados", "analises_copywriting_completas.json")
        with open(copywriting_path, "r", encoding="utf-8") as f:
            copywriting_data = json.load(f)

        # Dados de legendas
        legendas_path = os.path.join(PASTA_TRABALHO, "dados", "legendas_geradas.json")
        with open(legendas_path, "r", encoding="utf-8") as f:
            legendas_data = json.load(f)

        # Tentar carregar outros dados (podem não existir ainda)
        outros_dados = {}

        try:
            padroes_path = os.path.join(PASTA_TRABALHO, "dados", "analises_padroes_completas.json")
            with open(padroes_path, "r", encoding="utf-8") as f:
                outros_dados["padroes"] = json.load(f)
        except:
            outros_dados["padroes"] = []

        try:
            videos_path = os.path.join(PASTA_TRABALHO, "dados", "metadados_completos.json")
            with open(videos_path, "r", encoding="utf-8") as f:
                outros_dados["videos"] = json.load(f)
        except:
            outros_dados["videos"] = []

        print(f"  ✅ Dados carregados: {len(copywriting_data)} análises de copywriting")

        return {
            "copywriting": copywriting_data,
            "legendas": legendas_data,
            **outros_dados
        }

    except Exception as e:
        print(f"  ❌ Erro ao carregar dados de copywriting: {e}")
        return None

def adicionar_aba_copywriting_estrategico(wb, dados):
    """Adiciona aba principal de análise de copywriting"""
    # Criar nova aba
    ws = wb.create_sheet("Copywriting Estratégico")

    # Título principal
    ws.merge_cells("A1:H1")
    titulo = ws["A1"]
    titulo.value = "ANÁLISE ESTRATÉGICA DE COPYWRITING - ENGENHARIA REVERSA"
    titulo.fill = PatternFill(start_color="1F4E79", end_color="1F4E79", fill_type="solid")
    titulo.font = Font(color="FFFFFF", bold=True, size=14)
    titulo.alignment = Alignment(horizontal="center")

    row = 3

    # Métricas executivas
    ws[f"A{row}"] = "MÉTRICAS EXECUTIVAS DE COPYWRITING"
    ws[f"A{row}"].font = Font(bold=True, size=12, color="C5504B")
    row += 2

    # Calcular métricas
    videos_copy = dados["copywriting"]

    if videos_copy:
        # Score médio
        scores = [v.get("score_persuasao", 0) for v in videos_copy]
        score_medio = sum(scores) / len(scores) if scores else 0

        # Contadores
        total_ganchos = sum(len(v.get("ganchos_detectados", {})) for v in videos_copy)
        total_gatilhos = sum(len(v.get("gatilhos_mentais_detectados", {})) for v in videos_copy)
        total_ctas = sum(len(v.get("ctas_detectados", {})) for v in videos_copy)
        videos_sem_cta = len([v for v in videos_copy if not v.get("ctas_detectados")])
        total_templates = sum(len(v.get("templates_identificados", [])) for v in videos_copy)

        # Exibir métricas
        metricas = [
            ("Score Persuasão Médio:", f"{score_medio:.1f}/100", "Meta: 70+ para alta conversão"),
            ("Vídeos Analisados:", len(videos_copy), "Base completa da análise"),
            ("Total de Ganchos:", total_ganchos, f"Média: {total_ganchos/len(videos_copy):.1f} por vídeo"),
            ("Total de Gatilhos:", total_gatilhos, f"Média: {total_gatilhos/len(videos_copy):.1f} por vídeo"),
            ("Total de CTAs:", total_ctas, f"Média: {total_ctas/len(videos_copy):.1f} por vídeo"),
            ("🚨 Vídeos sem CTA:", videos_sem_cta, "CRÍTICO: Implementar imediatamente" if videos_sem_cta > 0 else "✅ Todos têm CTA"),
            ("Templates Identificados:", total_templates, "Estruturas replicáveis encontradas")
        ]

        for metrica, valor, descricao in metricas:
            ws[f"A{row}"] = metrica
            ws[f"B{row}"] = valor
            ws[f"C{row}"] = descricao

            ws[f"A{row}"].font = Font(bold=True)
            if "🚨" in metrica and videos_sem_cta > 0:
                ws[f"B{row}"].font = Font(bold=True, color="FF0000")
            elif isinstance(valor, (int, float)) and valor > 0:
                ws[f"B{row}"].font = Font(bold=True, color="70AD47")

            row += 1

        row += 2

        # Ranking de performance
        ws[f"A{row}"] = "🏆 RANKING DE PERFORMANCE POR SCORE DE PERSUASÃO"
        ws[f"A{row}"].font = Font(bold=True, size=12, color="1F4E79")
        row += 2

        # Headers
        headers = ["Posição", "Vídeo ID", "Score", "Ganchos", "Gatilhos", "CTAs", "Status"]
        for col, header in enumerate(headers, 1):
            cell = ws.cell(row=row, column=col)
            cell.value = header
            cell.font = Font(bold=True)
            cell.fill = PatternFill(start_color="D9E2F3", end_color="D9E2F3", fill_type="solid")
        row += 1

        # Top performers
        top_videos = sorted(videos_copy, key=lambda x: x.get("score_persuasao", 0), reverse=True)

        for i, video in enumerate(top_videos, 1):
            ws.cell(row=row, column=1, value=f"{i}º")
            ws.cell(row=row, column=2, value=video["video_id"])
            ws.cell(row=row, column=3, value=f"{video.get('score_persuasao', 0)}/100")
            ws.cell(row=row, column=4, value=len(video.get("ganchos_detectados", {})))
            ws.cell(row=row, column=5, value=len(video.get("gatilhos_mentais_detectados", {})))
            ws.cell(row=row, column=6, value=len(video.get("ctas_detectados", {})))

            # Status baseado no score
            score = video.get("score_persuasao", 0)
            if score >= 70:
                status = "🟢 ÓTIMO"
                status_color = "70AD47"
            elif score >= 50:
                status = "🟡 BOM"
                status_color = "FFC000"
            else:
                status = "🔴 PRECISA OTIMIZAR"
                status_color = "C5504B"

            cell_status = ws.cell(row=row, column=7, value=status)
            cell_status.font = Font(color=status_color, bold=True)

            # Destacar top 3
            if i <= 3:
                for col in range(1, 8):
                    ws.cell(row=row, column=col).fill = PatternFill(start_color="FFF2CC", end_color="FFF2CC", fill_type="solid")

            row += 1

    # Ajustar larguras das colunas
    for col, width in [("A", 25), ("B", 15), ("C", 40), ("D", 10), ("E", 10), ("F", 10), ("G", 20), ("H", 15)]:
        ws.column_dimensions[col].width = width

def adicionar_aba_templates_copy(wb, dados):
    """Adiciona aba de templates replicáveis"""
    ws = wb.create_sheet("Templates Replicáveis")

    # Título
    ws.merge_cells("A1:F1")
    titulo = ws["A1"]
    titulo.value = "TEMPLATES E ESTRUTURAS REPLICÁVEIS DE COPYWRITING"
    titulo.fill = PatternFill(start_color="70AD47", end_color="70AD47", fill_type="solid")
    titulo.font = Font(color="FFFFFF", bold=True, size=14)
    titulo.alignment = Alignment(horizontal="center")

    row = 3

    # Coletar todos os templates
    todos_templates = []
    for video in dados["copywriting"]:
        templates = video.get("templates_identificados", [])
        for template in templates:
            template["video_id"] = video["video_id"]
            todos_templates.append(template)

    if todos_templates:
        # Agrupar templates por tipo
        templates_agrupados = {}
        for template in todos_templates:
            nome = template["nome"]
            if nome not in templates_agrupados:
                templates_agrupados[nome] = {
                    "estrutura": template["estrutura"],
                    "eficacia": template["eficacia"],
                    "uso_recomendado": template["uso_recomendado"],
                    "videos_exemplo": []
                }
            templates_agrupados[nome]["videos_exemplo"].append(template["video_id"])

        # Exibir templates
        for nome_template, dados_template in templates_agrupados.items():
            ws.merge_cells(f"A{row}:F{row}")
            template_header = ws[f"A{row}"]
            template_header.value = f"📋 TEMPLATE: {nome_template.replace('_', ' ')}"
            template_header.fill = PatternFill(start_color="E2EFDA", end_color="E2EFDA", fill_type="solid")
            template_header.font = Font(bold=True, size=11)
            row += 1

            ws[f"A{row}"] = "Estrutura:"
            ws[f"B{row}"] = dados_template["estrutura"]
            ws[f"A{row}"].font = Font(bold=True)
            row += 1

            ws[f"A{row}"] = "Eficácia:"
            ws[f"B{row}"] = dados_template["eficacia"]
            ws[f"A{row}"].font = Font(bold=True)
            if dados_template["eficacia"] == "MUITO ALTA":
                ws[f"B{row}"].font = Font(color="70AD47", bold=True)
            elif dados_template["eficacia"] == "ALTA":
                ws[f"B{row}"].font = Font(color="C5504B", bold=True)
            row += 1

            ws[f"A{row}"] = "Uso Recomendado:"
            ws[f"B{row}"] = dados_template["uso_recomendado"]
            ws[f"A{row}"].font = Font(bold=True)
            row += 1

            ws[f"A{row}"] = "Vídeos Exemplo:"
            ws[f"B{row}"] = ", ".join(dados_template["videos_exemplo"][:3])
            ws[f"A{row}"].font = Font(bold=True)
            row += 2

    # Ajustar larguras
    for col, width in [("A", 20), ("B", 50), ("C", 15), ("D", 15), ("E", 15), ("F", 15)]:
        ws.column_dimensions[col].width = width

def adicionar_aba_timeline_copy(wb, dados):
    """Adiciona aba de timeline de elementos persuasivos"""
    ws = wb.create_sheet("Timeline Persuasão")

    # Título
    ws.merge_cells("A1:G1")
    titulo = ws["A1"]
    titulo.value = "TIMELINE DE ELEMENTOS PERSUASIVOS - ANÁLISE TEMPORAL"
    titulo.fill = PatternFill(start_color="FFC000", end_color="FFC000", fill_type="solid")
    titulo.font = Font(color="FFFFFF", bold=True, size=14)
    titulo.alignment = Alignment(horizontal="center")

    row = 3

    # Para cada vídeo, mostrar timeline
    for video in dados["copywriting"]:
        video_id = video["video_id"]

        ws[f"A{row}"] = f"📹 VÍDEO: {video_id}"
        ws[f"A{row}"].font = Font(bold=True, size=11, color="1F4E79")
        row += 2

        # Headers da timeline
        headers = ["Tempo", "Minuto", "Segundo", "Elemento", "Posição", "Impacto", "Análise"]
        for col, header in enumerate(headers, 1):
            cell = ws.cell(row=row, column=col)
            cell.value = header
            cell.font = Font(bold=True)
            cell.fill = PatternFill(start_color="F2F2F2", end_color="F2F2F2", fill_type="solid")
        row += 1

        # Coletar todos os elementos temporais
        elementos_temporais = []

        # Ganchos
        for tipo, dados in video.get("ganchos_detectados", {}).items():
            for timestamp in dados.get("timestamps", []):
                elementos_temporais.append({
                    "categoria": "GANCHO",
                    "tipo": tipo,
                    "minuto": timestamp["minuto"],
                    "segundo": timestamp["segundo"],
                    "contexto": timestamp["texto_contexto"]
                })

        # Gatilhos
        for tipo, dados in video.get("gatilhos_mentais_detectados", {}).items():
            for timestamp in dados.get("timestamps", []):
                elementos_temporais.append({
                    "categoria": "GATILHO",
                    "tipo": tipo,
                    "minuto": timestamp["minuto"],
                    "segundo": timestamp["segundo"],
                    "contexto": timestamp["texto_contexto"]
                })

        # CTAs
        for tipo, dados in video.get("ctas_detectados", {}).items():
            for timestamp in dados.get("timestamps", []):
                elementos_temporais.append({
                    "categoria": "CTA",
                    "tipo": tipo,
                    "minuto": timestamp["minuto"],
                    "segundo": timestamp["segundo"],
                    "contexto": timestamp["texto_contexto"]
                })

        # Ordenar por tempo
        elementos_temporais.sort(key=lambda x: (x["minuto"], x["segundo"]))

        # Exibir elementos
        if elementos_temporais:
            for elemento in elementos_temporais:
                ws.cell(row=row, column=1, value=f"{elemento['minuto']:02d}:{elemento['segundo']:02d}")
                ws.cell(row=row, column=2, value=elemento["minuto"])
                ws.cell(row=row, column=3, value=elemento["segundo"])
                ws.cell(row=row, column=4, value=f"{elemento['categoria']}: {elemento['tipo']}")

                # Análise de posição
                total_segundos = elemento["minuto"] * 60 + elemento["segundo"]
                if total_segundos <= 10:
                    posicao = "ABERTURA"
                    posicao_color = "70AD47"
                elif total_segundos <= 20:
                    posicao = "MEIO"
                    posicao_color = "FFC000"
                else:
                    posicao = "FINAL"
                    posicao_color = "C5504B"

                cell_pos = ws.cell(row=row, column=5, value=posicao)
                cell_pos.font = Font(color=posicao_color, bold=True)

                # Análise de impacto
                impacto = analisar_impacto_elemento(elemento["categoria"], posicao)
                ws.cell(row=row, column=6, value=impacto["score"])
                ws.cell(row=row, column=7, value=impacto["analise"])

                if impacto["score"] == "ALTO":
                    ws.cell(row=row, column=6).font = Font(color="70AD47", bold=True)
                elif impacto["score"] == "BAIXO":
                    ws.cell(row=row, column=6).font = Font(color="C5504B", bold=True)

                row += 1
        else:
            ws.cell(row=row, column=1, value="Nenhum elemento temporal mapeado")
            row += 1

        row += 2

    # Ajustar larguras
    for col, width in [("A", 8), ("B", 10), ("C", 15), ("D", 30), ("E", 12), ("F", 8), ("G", 25)]:
        ws.column_dimensions[col].width = width

def analisar_impacto_elemento(categoria, posicao):
    """Analisa o impacto de um elemento baseado na posição"""
    impactos = {
        ("GANCHO", "ABERTURA"): {"score": "ALTO", "analise": "Ideal para capturar atenção"},
        ("GANCHO", "MEIO"): {"score": "MÉDIO", "analise": "Melhor no início"},
        ("GANCHO", "FINAL"): {"score": "BAIXO", "analise": "Reposicionar para abertura"},
        ("GATILHO", "ABERTURA"): {"score": "MÉDIO", "analise": "Bom para credibilidade"},
        ("GATILHO", "MEIO"): {"score": "ALTO", "analise": "Posição ideal para persuasão"},
        ("GATILHO", "FINAL"): {"score": "MÉDIO", "analise": "Reforça decisão"},
        ("CTA", "ABERTURA"): {"score": "BAIXO", "analise": "Muito cedo, construir valor primeiro"},
        ("CTA", "MEIO"): {"score": "MÉDIO", "analise": "Considerar mover para final"},
        ("CTA", "FINAL"): {"score": "ALTO", "analise": "Posicionamento ideal"}
    }

    return impactos.get((categoria, posicao), {"score": "MÉDIO", "analise": "Analisar contexto específico"})

def adicionar_aba_recomendacoes_copy(wb, dados):
    """Adiciona aba de recomendações estratégicas consolidadas"""
    ws = wb.create_sheet("Recomendações Copy")

    # Título
    ws.merge_cells("A1:F1")
    titulo = ws["A1"]
    titulo.value = "RECOMENDAÇÕES ESTRATÉGICAS DE COPYWRITING - PLANO DE AÇÃO"
    titulo.fill = PatternFill(start_color="C5504B", end_color="C5504B", fill_type="solid")
    titulo.font = Font(color="FFFFFF", bold=True, size=14)
    titulo.alignment = Alignment(horizontal="center")

    row = 3

    # Consolidar recomendações por prioridade
    todas_recomendacoes = []
    for video in dados["copywriting"]:
        recomendacoes_video = video.get("recomendacoes_estrategicas", [])
        for rec in recomendacoes_video:
            rec["video_id"] = video["video_id"]
            todas_recomendacoes.append(rec)

    # Agrupar por prioridade
    recomendacoes_por_prioridade = {
        "CRÍTICA": [],
        "ALTA": [],
        "MÉDIA": []
    }

    for rec in todas_recomendacoes:
        prioridade = rec.get("prioridade", "MÉDIA")
        if prioridade in recomendacoes_por_prioridade:
            recomendacoes_por_prioridade[prioridade].append(rec)

    # Exibir por prioridade
    for prioridade in ["CRÍTICA", "ALTA", "MÉDIA"]:
        if not recomendacoes_por_prioridade[prioridade]:
            continue

        ws[f"A{row}"] = f"🚨 PRIORIDADE {prioridade}"
        if prioridade == "CRÍTICA":
            ws[f"A{row}"].font = Font(color="FF0000", bold=True, size=12)
        elif prioridade == "ALTA":
            ws[f"A{row}"].font = Font(color="C5504B", bold=True, size=12)
        else:
            ws[f"A{row}"].font = Font(color="FFC000", bold=True, size=12)

        row += 2

        # Headers
        headers = ["Categoria", "Recomendação", "Vídeos Afetados", "Ação Sugerida"]
        for col, header in enumerate(headers, 1):
            cell = ws.cell(row=row, column=col)
            cell.value = header
            cell.font = Font(bold=True)
            cell.fill = PatternFill(start_color="F2F2F2", end_color="F2F2F2", fill_type="solid")
        row += 1

        # Agrupar recomendações similares da mesma prioridade
        grupos = {}
        for rec in recomendacoes_por_prioridade[prioridade]:
            categoria = rec["categoria"]
            if categoria not in grupos:
                grupos[categoria] = {
                    "recomendacao": rec["recomendacao"],
                    "videos": [],
                    "acao": gerar_acao_especifica(categoria)
                }
            grupos[categoria]["videos"].append(rec["video_id"])

        for categoria, dados_grupo in grupos.items():
            ws.cell(row=row, column=1, value=categoria)
            ws.cell(row=row, column=2, value=dados_grupo["recomendacao"])
            ws.cell(row=row, column=3, value=f"{len(dados_grupo['videos'])} vídeo(s)")
            ws.cell(row=row, column=4, value=dados_grupo["acao"])
            row += 1

        row += 2

    # Ajustar larguras
    for col, width in [("A", 20), ("B", 40), ("C", 15), ("D", 30), ("E", 15), ("F", 15)]:
        ws.column_dimensions[col].width = width

def gerar_acao_especifica(categoria):
    """Gera ação específica baseada na categoria da recomendação"""
    acoes = {
        "GANCHOS": "Revisar primeiros 5 segundos e adicionar pergunta ou curiosidade",
        "GATILHOS": "Incorporar elementos de autoridade, prova social ou reciprocidade",
        "CTA": "Adicionar call-to-action claro nos últimos 3-5 segundos",
        "ESTRUTURA": "Aplicar template identificado mais próximo do nicho",
        "PERSUASÃO": "Combinar múltiplos elementos persuasivos em sequência lógica"
    }
    return acoes.get(categoria, "Revisar e otimizar elementos específicos mencionados")

def atualizar_aba_principal_com_copy(wb, dados):
    """Atualiza a aba principal existente com métricas de copywriting"""
    # Tentar encontrar aba principal (pode ter nomes diferentes)
    aba_principal = None
    possiveis_nomes = ["Dashboard Principal", "Executive Summary", "Summary", "Principal"]

    for nome in wb.sheetnames:
        if any(possivel in nome for possivel in possiveis_nomes):
            aba_principal = wb[nome]
            break

    if not aba_principal:
        # Se não encontrou, usar a primeira aba
        aba_principal = wb.worksheets[0]

    # Encontrar próxima linha vazia para adicionar seção de copywriting
    next_row = 1
    for row in range(1, 100):
        if aba_principal[f"A{row}"].value is None:
            next_row = row
            break

    # Adicionar seção de copywriting
    # Título da seção
    aba_principal.merge_cells(f"A{next_row}:H{next_row}")
    titulo_copy = aba_principal[f"A{next_row}"]
    titulo_copy.value = "📝 ANÁLISE DE COPYWRITING - RESUMO EXECUTIVO"
    titulo_copy.fill = PatternFill(start_color="7030A0", end_color="7030A0", fill_type="solid")
    titulo_copy.font = Font(color="FFFFFF", bold=True, size=12)
    next_row += 2

    # Métricas resumidas
    videos_copy = dados["copywriting"]

    if videos_copy:
        scores = [v.get("score_persuasao", 0) for v in videos_copy]
        score_medio = sum(scores) / len(scores)
        videos_sem_cta = len([v for v in videos_copy if not v.get("ctas_detectados")])
        templates_total = sum(len(v.get("templates_identificados", [])) for v in videos_copy)

        metricas_resumo = [
            ("Score de Persuasão Médio:", f"{score_medio:.1f}/100"),
            ("Vídeos sem CTA:", f"{videos_sem_cta} (CRÍTICO)" if videos_sem_cta > 0 else "0 ✅"),
            ("Templates Identificados:", str(templates_total)),
            ("Status Geral:", "Otimização necessária" if score_medio < 60 or videos_sem_cta > 0 else "Performance boa")
        ]

        for metrica, valor in metricas_resumo:
            aba_principal[f"A{next_row}"] = metrica
            aba_principal[f"B{next_row}"] = valor
            aba_principal[f"A{next_row}"].font = Font(bold=True)

            if "CRÍTICO" in valor:
                aba_principal[f"B{next_row}"].font = Font(color="FF0000", bold=True)
            elif "✅" in valor:
                aba_principal[f"B{next_row}"].font = Font(color="70AD47", bold=True)

            next_row += 1

    else:
        aba_principal[f"A{next_row}"] = "⚠️ Execute a análise de copywriting (Célula 2.4) para ver métricas"
        aba_principal[f"A{next_row}"].font = Font(color="FFC000", bold=True)

def gerar_relatorios_copywriting_individuais(dados):
    """Gera relatórios individuais de texto para cada vídeo"""
    print("  📄 Gerando relatórios individuais de copywriting...")

    pasta_relatorios = os.path.join(PASTA_TRABALHO, "relatorios_copywriting")
    os.makedirs(pasta_relatorios, exist_ok=True)

    for video_copy in dados["copywriting"]:
        video_id = video_copy["video_id"]

        relatorio_path = os.path.join(pasta_relatorios, f"{video_id}_copywriting_completo.txt")

        with open(relatorio_path, "w", encoding="utf-8") as f:
            f.write("="*60 + "\n")
            f.write("RELATÓRIO COMPLETO DE ANÁLISE DE COPYWRITING\n")
            f.write("="*60 + "\n\n")

            f.write(f"📹 Vídeo ID: {video_id}\n")
            f.write(f"🎯 Score de Persuasão: {video_copy.get('score_persuasao', 0)}/100\n")
            f.write(f"📝 Total de Palavras: {video_copy.get('total_palavras', 0)}\n\n")

            # Texto completo
            f.write("TRANSCRIÇÃO COMPLETA:\n")
            f.write("-" * 30 + "\n")
            f.write(video_copy.get("texto_completo", "Transcrição não disponível") + "\n\n")

            # Ganchos
            f.write("🎣 GANCHOS DETECTADOS:\n")
            f.write("-" * 30 + "\n")
            ganchos = video_copy.get("ganchos_detectados", {})
            if ganchos:
                for tipo, dados in ganchos.items():
                    f.write(f"• {tipo.upper()}: {dados['count']} ocorrências\n")
                    f.write(f"  Exemplos: {', '.join(dados['exemplos'])}\n")
            else:
                f.write("Nenhum gancho detectado.\n")
            f.write("\n")

            # Gatilhos
            f.write("🧠 GATILHOS MENTAIS DETECTADOS:\n")
            f.write("-" * 30 + "\n")
            gatilhos = video_copy.get("gatilhos_mentais_detectados", {})
            if gatilhos:
                for tipo, dados in gatilhos.items():
                    f.write(f"• {tipo.upper()}: {dados['count']} ocorrências\n")
                    f.write(f"  Exemplos: {', '.join(dados['exemplos'])}\n")
            else:
                f.write("Nenhum gatilho mental detectado.\n")
            f.write("\n")

            # CTAs
            f.write("📢 CALLS-TO-ACTION DETECTADOS:\n")
            f.write("-" * 30 + "\n")
            ctas = video_copy.get("ctas_detectados", {})
            if ctas:
                for tipo, dados in ctas.items():
                    f.write(f"• {tipo.upper()}: {dados['count']} ocorrências\n")
                    f.write(f"  Exemplos: {', '.join(dados['exemplos'])}\n")
            else:
                f.write("Nenhum CTA detectado.\n")
            f.write("\n")

            # Recomendações
            f.write("💡 RECOMENDAÇÕES ESTRATÉGICAS:\n")
            f.write("-" * 30 + "\n")
            recomendacoes = video_copy.get("recomendacoes_estrategicas", [])
            if recomendacoes:
                for rec in recomendacoes:
                    f.write(f"• [{rec['prioridade']}] {rec['categoria']}: {rec['recomendacao']}\n")
            else:
                f.write("Nenhuma recomendação específica.\n")
            f.write("\n")

            # Templates
            f.write("📋 TEMPLATES IDENTIFICADOS:\n")
            f.write("-" * 30 + "\n")
            templates = video_copy.get("templates_identificados", [])
            if templates:
                for template in templates:
                    f.write(f"• {template['nome']}: {template['estrutura']}\n")
                    f.write(f"  Eficácia: {template['eficacia']}\n")
                    f.write(f"  Uso: {template['uso_recomendado']}\n\n")
            else:
                f.write("Nenhum template específico identificado.\n")

    print(f"  ✅ Relatórios individuais gerados em: {pasta_relatorios}")

# Executar integração
try:
    integrar_copywriting_dashboard_existente()
except Exception as e:
    print(f"❌ ERRO de Execução: {type(e).__name__}: {e}")
    import traceback
    traceback.print_exc()


In [None]:
# ============================================================================
# CÉLULA 4.3: INTEGRAÇÃO DE COPYWRITING NO DASHBOARD EXISTENTE
# ============================================================================

# Definir a variável global PASTA_TRABALHO se ainda não estiver definida
# Certifique-se de que esta variável esteja definida corretamente em uma célula anterior (ex: Célula 1.2)
# Exemplo: PASTA_TRABALHO = "/content/drive/MyDrive/Videos Dona Done/_engenharia_reversa"

# Executar a função principal da Layer 4.3
if 'PASTA_TRABALHO' in globals():
    print("Iniciando a Layer 4.3: Integração de Copywriting no Dashboard...")
    integrar_copywriting_dashboard_existente()
else:
    print("ERRO: A variável PASTA_TRABALHO não está definida. Certifique-se de executar a Célula 1.2 ou equivalente.")

In [None]:
# ============================================================
# LAYER 5/6 — IA LOCAL + DASHBOARD HUMANIZADA (Fusão, sem consultas externas)
# ============================================================

# Instalar dependências (todas offline-friendly; Whisper usa pesos locais)
!pip -q install faster-whisper==1.0.3 mediapipe==0.10.14 scikit-learn==1.5.1 openpyxl==3.1.2 xlsxwriter==3.2.0

import os, re, json, cv2, numpy as np, pandas as pd
from PIL import Image
import pytesseract
from collections import Counter
from sklearn.cluster import KMeans
import mediapipe as mp
from faster_whisper import WhisperModel
from openpyxl import load_workbook, Workbook
from openpyxl.utils import get_column_letter
from openpyxl.styles import Font, Alignment, PatternFill

# --------- Conexão com SEU notebook (usa as variáveis já definidas) ----------
assert 'PASTA_TRABALHO' in globals(), "PASTA_TRABALHO não está definido. Execute as células de configuração antes."

# Fallback para OUTPUT_PATH se ainda não foi definido pelo seu fluxo
if 'OUTPUT_PATH' not in globals():
    OUTPUT_PATH = os.path.join(PASTA_TRABALHO, "dashboard", "DASHBOARD_MASTER_EXECUTIVO_INTELIGENTE.xlsx")
    print(f"⚠️ OUTPUT_PATH não estava definido, criei automático: {OUTPUT_PATH}")

AI_ASSETS_DIR = os.path.join(PASTA_TRABALHO, "ai_insights")
os.makedirs(AI_ASSETS_DIR, exist_ok=True)

# Pesos locais do Whisper (CTranslate2). Estrutura esperada:
# PASTA_TRABALHO/modelos/whisper/tiny/ (coloque os arquivos do modelo aqui)
WHISPER_LOCAL_DIR = os.path.join(PASTA_TRABALHO, "modelos", "whisper", "tiny")
WHISPER_DEVICE = "cuda" if cv2.cuda.getCudaEnabledDeviceCount() > 0 else "cpu"
WHISPER_COMPUTE = "float16" if WHISPER_DEVICE == "cuda" else "int8"

# ============================================================
# Utilitários de IA (OFFLINE)
# ============================================================

def ai_transcrever_offline(video_path, out_dir):
    """Transcreve com Whisper local se os pesos existirem; senão, pula com aviso."""
    try:
        if not os.path.isdir(WHISPER_LOCAL_DIR):
            print(f"⚠️ Whisper OFFLINE não encontrado em {WHISPER_LOCAL_DIR}. Pulando transcrição.")
            return ""
        model = WhisperModel(WHISPER_LOCAL_DIR, device=WHISPER_DEVICE, compute_type=WHISPER_COMPUTE)
        # extrai wav 16k mono (sem internet)
        audio_path = os.path.join(out_dir, "audio_16k.wav")
        os.system(f'ffmpeg -y -i "{video_path}" -ac 1 -ar 16000 -vn "{audio_path}" -loglevel error')
        segments, _ = model.transcribe(audio_path, language="pt", vad_filter=True, vad_parameters={"min_silence_duration_ms": 500})
        lines, srt_lines = [], []
        for i, seg in enumerate(segments):
            lines.append(seg.text.strip())
            def ts(x):
                h=int(x//3600); m=int((x%3600)//60); s=x%60
                return f"{h:02}:{m:02}:{s:06.3f}".replace('.',',')
            srt_lines.append(f"{i+1}\n{ts(seg.start)} --> {ts(seg.end)}\n{seg.text.strip()}\n")
        with open(os.path.join(out_dir,"transcript.txt"),"w",encoding="utf-8") as f:
            f.write(" ".join(lines))
        with open(os.path.join(out_dir,"subtitles.srt"),"w",encoding="utf-8") as f:
            f.write("".join(srt_lines))
        return " ".join(lines)
    except Exception as e:
        print(f"⚠️ Erro no Whisper local: {e}. Pulando transcrição.")
        return ""

def ai_keyframes_por_tempo(video_path, out_dir, intervalo_seg=2):
    """Extrai frames a cada N segundos para OCR, paleta e thumbs."""
    cap = cv2.VideoCapture(video_path)
    fps = cap.get(cv2.CAP_PROP_FPS) or 30
    frame_interval = int(max(1, fps*intervalo_seg))
    idx=0; frames=[]
    while True:
        ret, frame = cap.read()
        if not ret: break
        fno = int(cap.get(cv2.CAP_PROP_POS_FRAMES))
        if fno % frame_interval == 0:
            fp = os.path.join(out_dir, f"frame_{idx:04d}.jpg")
            cv2.imwrite(fp, frame); frames.append(fp); idx+=1
    cap.release()
    return frames

def ai_ocr(frames):
    """OCR local em frames (Tesseract)."""
    textos=[]
    for fp in frames:
        try:
            txt = pytesseract.image_to_string(Image.open(fp), lang="por+eng").strip()
            if txt: textos.append(txt)
        except:
            pass
    return textos

def ai_paleta(frames, n=5):
    """Paleta dominante via KMeans sobre o primeiro frame (rápido e consistente)."""
    if not frames: return []
    img = Image.open(frames[0]).convert("RGB").resize((256,256))
    X = np.array(img).reshape(-1,3).astype(np.float32)
    km = KMeans(n_clusters=n, n_init=3, random_state=42).fit(X)
    return ["#%02x%02x%02x"%tuple(map(int,c)) for c in km.cluster_centers_]

def ai_emocoes(video_path, sample_rate=15):
    """
    Heurística leve com Mediapipe FaceMesh:
    Marca 'surpresa' se boca muito aberta; senão 'neutro/sorriso'.
    """
    cap = cv2.VideoCapture(video_path)
    fm = mp.solutions.face_mesh.FaceMesh(refine_landmarks=True)
    emos=[]; frame_idx=0
    while cap.isOpened():
        ret, frame = cap.read()
        if not ret: break
        if frame_idx % sample_rate == 0:
            rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            res = fm.process(rgb)
            if res.multi_face_landmarks:
                for lm in res.multi_face_landmarks:
                    mouth = lm.landmark[13].y - lm.landmark[14].y
                    emos.append("surpresa" if mouth>0.03 else "neutro/sorriso")
        frame_idx+=1
    cap.release()
    return dict(Counter(emos)) if emos else {}

def ai_hook_score(texto_transcrito, ocr_primeiros_frames):
    """Pontua o gancho nos ~3–5s iniciais via padrões simples (sem internet)."""
    early = (texto_transcrito[:220] + " " + " ".join(ocr_primeiros_frames[:2])).lower()
    score=0
    for pat in [r"\?", r"\bcomo\b", r"\bnunca\b", r"\bsempre\b", r"\bem\s+\d+\s+passos\b", r"\b\d+\b"]:
        if re.search(pat, early):
            score += 16
    return min(score, 100)

def ai_templates_recomendacoes(hook, ocr_count, emoc):
    """Gera recomendações humanizadas + templates estratégicos."""
    recs=[]
    if hook<50:
        recs.append("Melhore o HOOK nos 3s: use pergunta direta ou número específico.")
    if ocr_count==0:
        recs.append("Inclua texto na tela logo no início (quem assiste no mudo entende a promessa).")
    if "surpresa" in emoc:
        recs.append("Use um frame de 'surpresa' como thumbnail para maior CTR.")
    if not recs:
        recs.append("Boa base! Teste variações de abertura e CTA para escalar.")

    templates=[
        ("Hook — Pergunta", "Você sabia que [X]? Em [3 passos], você faz [Y]!"),
        ("Hook — Número", "Em apenas [5 minutos], aprenda a [benefício prático]."),
        ("Hook — Proibição", "Nunca faça [erro comum] se quiser [resultado]."),
        ("CTA — Final", "Se curtiu, compartilhe e me siga pra ver a parte 2 🚀"),
    ]
    return recs, templates

# ============================================================
# Núcleo: processa todos os vídeos já catalogados pelo seu notebook
# (usa .../dados/metadados_completos.json)
# ============================================================

def processar_ai_insights():
    metapath = os.path.join(PASTA_TRABALHO, "dados", "metadados_completos.json")
    if not os.path.exists(metapath):
        print(f"❌ Não encontrei {metapath}. Rode suas etapas até gerar metadados antes.")
        return []
    with open(metapath, "r", encoding="utf-8") as f:
        metadados = json.load(f)

    relatorios = []
    for i, meta in enumerate(metadados, 1):
        video_id = meta.get("id")
        video_path = meta.get("caminho_completo")
        if not (video_id and video_path and os.path.exists(video_path)):
            print(f"[{i}/{len(metadados)}] Pulando {video_id} (path inválido).")
            continue

        out_dir = os.path.join(AI_ASSETS_DIR, video_id)
        os.makedirs(out_dir, exist_ok=True)
        print(f"[{i}/{len(metadados)}] IA → {video_id}")

        # 1) Transcrição (opcional/offline)
        transcript = ai_transcrever_offline(video_path, out_dir)

        # 2) Keyframes + OCR + Paleta
        frames = ai_keyframes_por_tempo(video_path, out_dir, intervalo_seg=2)
        ocr_texts = ai_ocr(frames)
        palette = ai_paleta(frames, n=5)
        # salvar thumbs básicos
        for j, fp in enumerate(frames[:3]):
            try:
                Image.open(fp).save(os.path.join(out_dir, f"thumb_{j}.jpg"), quality=95)
            except:
                pass

        # 3) Emoções faciais (heurística leve)
        emotions = ai_emocoes(video_path, sample_rate=15)

        # 4) Hook Score
        hook = ai_hook_score(transcript, ocr_texts)

        # 5) Recomendações + Templates
        recs, templates = ai_templates_recomendacoes(hook, len(ocr_texts), emotions)

        # Agrega relatório por vídeo
        rep = {
            "video_id": video_id,
            "nome_arquivo": meta.get("nome_arquivo"),
            "hook_score": hook,
            "emocoes_predominantes": emotions,
            "ocr_textos_count": len(ocr_texts),
            "paleta_cores": palette,
            "transcript_excerpt": (transcript[:300] if transcript else "")
        }
        # Persistência por vídeo
        with open(os.path.join(out_dir, "ai_report.json"), "w", encoding="utf-8") as f:
            json.dump(rep, f, ensure_ascii=False, indent=2)

        # Para dashboard humanizada
        rep["_recomendacoes"] = recs
        rep["_templates"] = templates
        relatorios.append(rep)

    # Consolida JSON master
    master_path = os.path.join(PASTA_TRABALHO, "dados", "ai_insights_completos.json")
    with open(master_path, "w", encoding="utf-8") as f:
        json.dump(relatorios, f, ensure_ascii=False, indent=2)
    print(f"\n💾 AI insights consolidados: {master_path}")
    return relatorios

# ============================================================
# Dashboard em Excel (humanizada) — usa SEU OUTPUT_PATH
# ============================================================

def escrever_linha(ws, row, values, bold=False, wrap=False):
    for col, val in enumerate(values, 1):
        cell = ws.cell(row=row, column=col, value=val)
        if bold: cell.font = Font(bold=True)
        if wrap: cell.alignment = Alignment(wrap_text=True)

def ajustar_larguras(ws, larguras):
    for col_idx, width in enumerate(larguras, 1):
        ws.column_dimensions[get_column_letter(col_idx)].width = width

def atualizar_dashboard_humanizado(relatorios):
    # Garante pasta do dashboard
    os.makedirs(os.path.dirname(OUTPUT_PATH), exist_ok=True)
    # Carrega workbook existente (do seu fluxo) ou cria novo
    if os.path.exists(OUTPUT_PATH):
        wb = load_workbook(OUTPUT_PATH)
    else:
        wb = Workbook()

    # --- ABA 1: AI Insights (Resumo) ---
    if "AI Insights (Resumo)" in wb.sheetnames:
        del wb["AI Insights (Resumo)"]
    ws_resumo = wb.create_sheet("AI Insights (Resumo)")

    escrever_linha(ws_resumo, 1, ["Vídeo", "Hook (0-100)", "Emoções", "OCR textos", "Paleta", "Trecho do Transcript"], bold=True)
    for i, r in enumerate(relatorios, start=2):
        emo_k = ", ".join([f"{k}:{v}" for k,v in r["emocoes_predominantes"].items()]) if r["emocoes_predominantes"] else "-"
        pal = " ".join(r["paleta_cores"]) if r["paleta_cores"] else "-"
        escrever_linha(ws_resumo, i, [
            r.get("nome_arquivo", r["video_id"]),
            r["hook_score"],
            emo_k,
            r["ocr_textos_count"],
            pal,
            r["transcript_excerpt"]
        ], wrap=True)
    ajustar_larguras(ws_resumo, [36, 14, 28, 12, 28, 80])

    # --- ABA 2: Recomendações (Humanizadas) ---
    if "Recomendações (Humanizadas)" in wb.sheetnames:
        del wb["Recomendações (Humanizadas)"]
    ws_recs = wb.create_sheet("Recomendações (Humanizadas)")
    escrever_linha(ws_recs, 1, ["Vídeo", "Recomendações práticas"], bold=True)
    row = 2
    for r in relatorios:
        if r["_recomendacoes"]:
            escrever_linha(ws_recs, row, [r.get("nome_arquivo", r["video_id"]), " • " + "\n • ".join(r["_recomendacoes"])], wrap=True)
            row += 1
    ajustar_larguras(ws_recs, [36, 100])

    # --- ABA 3: Templates Estratégicos ---
    if "Templates (Estratégia)" in wb.sheetnames:
        del wb["Templates (Estratégia)"]
    ws_tpl = wb.create_sheet("Templates (Estratégia)")
    escrever_linha(ws_tpl, 1, ["Tipo", "Template"], bold=True)
    # Deduplica templates
    vistos=set(); row=2
    for r in relatorios:
        for tipo, tpl in r["_templates"]:
            key=(tipo, tpl)
            if key in vistos:
                continue
            vistos.add(key)
            escrever_linha(ws_tpl, row, [tipo, tpl], wrap=True); row+=1
    ajustar_larguras(ws_tpl, [28, 100])

    # Estiliza cabeçalho das abas
    for nome in ["AI Insights (Resumo)", "Recomendações (Humanizadas)", "Templates (Estratégia)"]:
        ws = wb[nome]
        cell = ws.cell(row=1, column=1)
        cell.font = Font(bold=True, size=14, color="FFFFFF")
        cell.fill = PatternFill(start_color="3F6AB3", end_color="3F6AB3", fill_type="solid")

    wb.save(OUTPUT_PATH)
    print(f"✅ Dashboard humanizada atualizada em: {OUTPUT_PATH}")

# ============================================================
# EXECUÇÃO (chame após a Layer 4 do seu notebook)
# ============================================================

def rodar_layer_5_6_ai():
    rel = processar_ai_insights()
    if rel:
        atualizar_dashboard_humanizado(rel)
    else:
        print("Sem relatórios para escrever no Excel. Verifique se metadados_completos.json existe.")

# Exemplo de chamada:
# rodar_layer_5_6_ai()


In [None]:
rodar_layer_5_6_ai()

In [None]:
# ============================================================
# LAYER 7 — IA ONLINE (FREE) • Análise semântica avançada
# - Sem likes / comentários / views.
# - Usa Hugging Face Inference API (grátis com token).
# - Respeita PASTA_TRABALHO e OUTPUT_PATH do seu projeto.
# ============================================================

!pip -q install openpyxl==3.1.2 requests==2.32.3

import os, re, json, time, math
import requests
from pathlib import Path
from dataclasses import dataclass
from typing import List, Dict, Any
from openpyxl import load_workbook, Workbook
from openpyxl.utils import get_column_letter
from openpyxl.styles import Font, Alignment, PatternFill

# ---------- Conexão com seu notebook ----------
assert 'PASTA_TRABALHO' in globals(), "PASTA_TRABALHO não está definido. Rode as células de configuração."
if 'OUTPUT_PATH' not in globals():
    OUTPUT_PATH = os.path.join(PASTA_TRABALHO, "dashboard", "DASHBOARD_MASTER_EXECUTIVO_INTELIGENTE.xlsx")
    print(f"⚠️ OUTPUT_PATH não estava definido; criando automático: {OUTPUT_PATH}")

DADOS_DIR = os.path.join(PASTA_TRABALHO, "dados")
AI_ONLINE_DIR = os.path.join(PASTA_TRABALHO, "ai_online")
os.makedirs(DADOS_DIR, exist_ok=True)
os.makedirs(AI_ONLINE_DIR, exist_ok=True)

META_PATH = os.path.join(DADOS_DIR, "metadados_completos.json")

os.environ["HF_TOKEN"] = "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"   # coloque seu token
# ---------- Config da IA Online (FREE) ----------
# Cadastre-se grátis na Hugging Face e crie um Access Token (Settings > Access Tokens).
HF_TOKEN = os.environ.get("HF_TOKEN", "").strip()
if not HF_TOKEN:
    print("⚠️ Defina seu token gratuito da Hugging Face em os.environ['HF_TOKEN'] para ativar a IA online.")

# Modelo público e gratuito (ajuste se quiser)
# Recomendo um instruído e leve para PT/ES/EN; Mistral 7B Instruct costuma funcionar bem:
HF_MODEL = os.environ.get("HF_MODEL_ID", "mistralai/Mistral-7B-Instruct-v0.3")
HF_URL = f"https://api-inference.huggingface.co/models/{HF_MODEL}"

def hf_generate(prompt: str, max_new_tokens=650, temperature=0.3, top_p=0.9, retries=2) -> str:
    """
    Chama o endpoint de geração da Hugging Face (gratuito com token).
    Retorna string gerada (sem garantias de JSON formatado — faremos parsing).
    """
    if not HF_TOKEN:
        raise RuntimeError("HF_TOKEN não definido. Configure os.environ['HF_TOKEN'] com seu token gratuito.")
    headers = {"Authorization": f"Bearer {HF_TOKEN}"}
    payload = {
        "inputs": prompt,
        "parameters": {
            "max_new_tokens": max_new_tokens,
            "temperature": temperature,
            "top_p": top_p,
            "return_full_text": False
        }
    }
    for _ in range(retries):
        r = requests.post(HF_URL, headers=headers, json=payload, timeout=90)
        if r.status_code == 200:
            try:
                out = r.json()
                if isinstance(out, list) and out and "generated_text" in out[0]:
                    return out[0]["generated_text"]
                if isinstance(out, dict) and "generated_text" in out:
                    return out["generated_text"]
                # alguns servidores retornam str direta
                if isinstance(out, str):
                    return out
            except Exception:
                return r.text
        time.sleep(2)
    # retorna texto cru (pode conter erro do modelo)
    return r.text

def try_json_extract(text: str) -> Any:
    """
    Extrai o primeiro JSON válido de uma string. Robustifica contra respostas com texto extra.
    """
    start = text.find("{")
    end   = text.rfind("}")
    if start == -1 or end == -1 or end <= start:
        return None
    snippet = text[start:end+1]
    try:
        return json.loads(snippet)
    except Exception:
        # tentativa: aspas simples -> duplas
        snippet2 = snippet.replace("'", '"')
        try:
            return json.loads(snippet2)
        except:
            return None

# ---------- Utilitários de I/O ----------
def ler_metadados() -> List[Dict[str,Any]]:
    if not os.path.exists(META_PATH):
        print(f"❌ Não encontrei {META_PATH}. Rode as camadas anteriores.")
        return []
    with open(META_PATH, "r", encoding="utf-8") as f:
        return json.load(f)

def encontrar_transcricao(video_id: str) -> Dict[str, str]:
    """
    Procura transcript/srt da sua Layer 5:
      - PASTA_TRABALHO/ai_insights/<video_id>/transcript.txt
      - PASTA_TRABALHO/ai_insights/<video_id>/subtitles.srt
    Retorna dict com 'plain' e 'srt' (quando houver).
    """
    base = os.path.join(PASTA_TRABALHO, "ai_insights", video_id)
    out = {"plain": "", "srt": ""}
    if os.path.isdir(base):
        pt = os.path.join(base, "transcript.txt")
        ps = os.path.join(base, "subtitles.srt")
        if os.path.exists(pt):
            out["plain"] = Path(pt).read_text(encoding="utf-8", errors="ignore")
        if os.path.exists(ps):
            out["srt"] = Path(ps).read_text(encoding="utf-8", errors="ignore")
    return out

def srt_para_blocos(srt_text: str, janela_seg=20, max_blocos=6) -> List[Dict[str,Any]]:
    """
    Junta legendas em blocos de ~janela_seg segundos (até max_blocos) para análise por cena.
    """
    if not srt_text.strip():
        return []
    # parse simples
    entries = []
    for chunk in re.split(r"\n\s*\n", srt_text.strip()):
        lines = [l.strip() for l in chunk.splitlines() if l.strip()]
        if len(lines) >= 2:
            ts = lines[1]
            m = re.match(r"(\d{2}):(\d{2}):(\d{2}),\d+\s*-->\s*(\d{2}):(\d{2}):(\d{2}),\d+", ts)
            if not m:
                continue
            h1,m1,s1, h2,m2,s2 = map(int, m.groups())
            start = h1*3600+m1*60+s1
            end   = h2*3600+m2*60+s2
            text  = " ".join(lines[2:])
            entries.append((start, end, text))
    # agrega em janelas
    if not entries:
        return []
    t0 = entries[0][0]
    blocos = []
    cur_t0 = t0
    cur_txt = []
    for st, en, txt in entries:
        if (en - cur_t0) <= janela_seg:
            cur_txt.append(txt)
        else:
            blocos.append({"inicio_seg": cur_t0, "fim_seg": en, "texto": " ".join(cur_txt)})
            cur_t0 = en
            cur_txt = [txt]
    if cur_txt:
        blocos.append({"inicio_seg": cur_t0, "fim_seg": entries[-1][1], "texto": " ".join(cur_txt)})
    return blocos[:max_blocos]

# ---------- Prompts ----------
PROMPT_MACRO = """Você é um analista sênior de roteiro e comunicação em pt-BR.
Analise a TRANSCRIÇÃO a seguir e produza apenas um JSON com os campos:

{
  "tema_central": "",
  "tese": "",
  "promessa": "",
  "publico_alvo": "",
  "dor_principal": "",
  "ganho_principal": "",
  "mecanismo_unico": "",
  "provas_apoio": ["", ""],
  "tom_de_voz": ["", ""],
  "frameworks_copy": ["AIDA","PAS","FAB","Story","Lista","How-To"],
  "estrutura_geral": [
    {"bloco": 1, "objetivo": "", "ideias_chave": ["","",""], "frases_de_efeito": ["",""]}
  ],
  "objeções_previstas": ["","",""],
  "oportunidades_melhoria": ["","",""],
  "analogias_recomendadas": ["","",""],
  "cta_detectadas": ["","",""]
}

TRANSCRIÇÃO:
"""

PROMPT_SUGESTOES = """Você é um roteirista sênior para vídeos curtos em pt-BR.
Usando a TRANSCRIÇÃO (e os insights macro abaixo), gere apenas um JSON:

INSIGHTS_MACRO:
{macro}

TRANSCRIÇÃO:
{transc}

JSON com:
{
  "hooks_reativos": ["5 variações objetivas, curtas, com números ou pergunta"],
  "texto_na_tela_3s": ["3 frases de 5–7 palavras para aparecer em 3s"],
  "roteiro_15s": ["linha-a-linha do que dizer/fazer", "..."],
  "roteiro_30s": ["linha-a-linha do que dizer/fazer", "..."],
  "analogias": ["3 ideias de analogias concretas"],
  "oportunidades": ["3 oportunidades específicas de melhoria do roteiro"]
}
Responda só com JSON.
"""

PROMPT_CENA = """Você é um editor-chefe. Para o trecho abaixo, devolva JSON:

TRECHO:
{trecho}

JSON:
{
  "objetivo_do_trecho": "",
  "ponto_principal": "",
  "melhorias_de_copy": ["","",""],
  "texto_na_tela_sugerido": ["",""],
  "cta_sugerida": ""
}
Responda só JSON.
"""

# ---------- Execução por vídeo ----------
def analisar_video_online(video_id: str, nome_arquivo: str) -> Dict[str,Any]:
    out_dir = os.path.join(AI_ONLINE_DIR, video_id)
    os.makedirs(out_dir, exist_ok=True)

    # Carrega transcrição
    tr = encontrar_transcricao(video_id)
    texto = tr["plain"] or ""
    srt  = tr["srt"] or ""
    if not (texto or srt):
        print(f"⚠️ {video_id}: sem transcript/srt. Pulei IA online.")
        return {}

    # 1) Macro
    macro_prompt = PROMPT_MACRO + (texto[:6000] if texto else srt[:6000])
    macro_raw = hf_generate(macro_prompt, max_new_tokens=700, temperature=0.25) if HF_TOKEN else "{}"
    macro = try_json_extract(macro_raw) or {}

    # 2) Sugestões (usa texto e macro)
    sug_prompt = PROMPT_SUGESTOES.format(macro=json.dumps(macro, ensure_ascii=False), transc=(texto[:4000] if texto else srt[:4000]))
    sug_raw = hf_generate(sug_prompt, max_new_tokens=700, temperature=0.4) if HF_TOKEN else "{}"
    sugestoes = try_json_extract(sug_raw) or {}

    # 3) Cenas (usa SRT em blocos)
    cenas = []
    blocos = srt_para_blocos(srt, janela_seg=20, max_blocos=6)
    for b in blocos:
        p = PROMPT_CENA.format(trecho=b["texto"][:1200])
        raw = hf_generate(p, max_new_tokens=350, temperature=0.35) if HF_TOKEN else "{}"
        j = try_json_extract(raw) or {}
        cenas.append({
            "inicio_seg": b["inicio_seg"], "fim_seg": b["fim_seg"], **j
        })

    # Salva JSON e MD por vídeo
    pack = {
        "video_id": video_id,
        "nome_arquivo": nome_arquivo,
        "macro": macro,
        "sugestoes": sugestoes,
        "cenas": cenas
    }
    Path(os.path.join(out_dir, "online_llm_report.json")).write_text(json.dumps(pack, ensure_ascii=False, indent=2), encoding="utf-8")

    md = [
        f"# IA Online — {video_id}",
        "## Macro",
        json.dumps(macro, ensure_ascii=False, indent=2),
        "## Sugestões",
        json.dumps(sugestoes, ensure_ascii=False, indent=2),
        "## Cenas",
        json.dumps(cenas, ensure_ascii=False, indent=2),
    ]
    Path(os.path.join(out_dir, "online_llm_report.md")).write_text("\n\n".join(md), encoding="utf-8")

    return pack

# ---------- Atualiza Excel ----------
def _xl_set_width(ws, widths):
    for i,w in enumerate(widths,1):
        ws.column_dimensions[get_column_letter(i)].width = w

def atualizar_excel_online(pacotes: List[Dict[str,Any]]):
    os.makedirs(os.path.dirname(OUTPUT_PATH), exist_ok=True)
    wb = load_workbook(OUTPUT_PATH) if os.path.exists(OUTPUT_PATH) else Workbook()

    # --- Aba 1: IA Online — Macro ---
    if "IA Online — Macro" in wb.sheetnames: del wb["IA Online — Macro"]
    ws1 = wb.create_sheet("IA Online — Macro")
    header1 = ["Vídeo","Tema","Tese","Promessa","Público","Dor","Ganho","Mecanismo único","Provas","Tom","Frameworks","Objeções","Oportunidades","Analogias","CTAs","Estrutura (blocos)"]
    for c,h in enumerate(header1,1):
        cell = ws1.cell(row=1, column=c, value=h); cell.font=Font(bold=True)
    row=2
    for p in pacotes:
        m = p.get("macro", {})
        ws1.cell(row=row, column=1, value=p.get("nome_arquivo", p.get("video_id")))
        ws1.cell(row=row, column=2, value=m.get("tema_central"))
        ws1.cell(row=row, column=3, value=m.get("tese"))
        ws1.cell(row=row, column=4, value=m.get("promessa"))
        ws1.cell(row=row, column=5, value=m.get("publico_alvo"))
        ws1.cell(row=row, column=6, value=m.get("dor_principal"))
        ws1.cell(row=row, column=7, value=m.get("ganho_principal"))
        ws1.cell(row=row, column=8, value=m.get("mecanismo_unico"))
        ws1.cell(row=row, column=9, value=", ".join(m.get("provas_apoio",[]) or []))
        ws1.cell(row=row, column=10, value=", ".join(m.get("tom_de_voz",[]) or []))
        ws1.cell(row=row, column=11, value=", ".join(m.get("frameworks_copy",[]) or []))
        ws1.cell(row=row, column=12, value=", ".join(m.get("objeções_previstas",[]) or []))
        ws1.cell(row=row, column=13, value=", ".join(m.get("oportunidades_melhoria",[]) or []))
        ws1.cell(row=row, column=14, value=", ".join(m.get("analogias_recomendadas",[]) or []))
        ws1.cell(row=row, column=15, value=", ".join(m.get("cta_detectadas",[]) or []))
        # estrutura compactada
        estrutura = m.get("estrutura_geral", [])
        ws1.cell(row=row, column=16, value=json.dumps(estrutura, ensure_ascii=False))
        row += 1
    _xl_set_width(ws1, [30,18,18,20,18,18,18,20,24,16,16,18,22,18,18,48])

    # --- Aba 2: IA Online — Sugestões ---
    if "IA Online — Sugestões" in wb.sheetnames: del wb["IA Online — Sugestões"]
    ws2 = wb.create_sheet("IA Online — Sugestões")
    header2 = ["Vídeo","Hooks (5)","Texto na tela 3s (3)","Roteiro 15s","Roteiro 30s","Analogias","Oportunidades"]
    for c,h in enumerate(header2,1):
        ws2.cell(row=1, column=c, value=h).font=Font(bold=True)
    row=2
    for p in pacotes:
        s = p.get("sugestoes", {})
        ws2.cell(row=row, column=1, value=p.get("nome_arquivo", p.get("video_id")))
        ws2.cell(row=row, column=2, value=" • " + "\n • ".join(s.get("hooks_reativos",[]) or []))
        ws2.cell(row=row, column=3, value=" • " + "\n • ".join(s.get("texto_na_tela_3s",[]) or []))
        ws2.cell(row=row, column=4, value=" • " + "\n • ".join(s.get("roteiro_15s",[]) or []))
        ws2.cell(row=row, column=5, value=" • " + "\n • ".join(s.get("roteiro_30s",[]) or []))
        ws2.cell(row=row, column=6, value=" • " + "\n • ".join(s.get("analogias",[]) or []))
        ws2.cell(row=row, column=7, value=" • " + "\n • ".join(s.get("oportunidades",[]) or []))
        row+=1
    _xl_set_width(ws2, [30,54,40,60,60,40,40])

    # --- Aba 3: IA Online — Cenas ---
    if "IA Online — Cenas" in wb.sheetnames: del wb["IA Online — Cenas"]
    ws3 = wb.create_sheet("IA Online — Cenas")
    header3 = ["Vídeo","Início (s)","Fim (s)","Objetivo do trecho","Ponto principal","Melhorias de copy","Texto na tela sugerido","CTA sugerida"]
    for c,h in enumerate(header3,1):
        ws3.cell(row=1, column=c, value=h).font=Font(bold=True)
    row=2
    for p in pacotes:
        for c in (p.get("cenas") or []):
            ws3.cell(row=row, column=1, value=p.get("nome_arquivo", p.get("video_id")))
            ws3.cell(row=row, column=2, value=c.get("inicio_seg"))
            ws3.cell(row=row, column=3, value=c.get("fim_seg"))
            ws3.cell(row=row, column=4, value=c.get("objetivo_do_trecho"))
            ws3.cell(row=row, column=5, value=c.get("ponto_principal"))
            ws3.cell(row=row, column=6, value="; ".join(c.get("melhorias_de_copy",[]) or []))
            ws3.cell(row=row, column=7, value="; ".join(c.get("texto_na_tela_sugerido",[]) or []))
            ws3.cell(row=row, column=8, value=c.get("cta_sugerida"))
            row+=1
    _xl_set_width(ws3, [30,10,10,40,40,50,40,24])

    wb.save(OUTPUT_PATH)
    print(f"✅ Excel atualizado com abas: IA Online — Macro / Sugestões / Cenas → {OUTPUT_PATH}")

# ---------- Orquestração ----------
def rodar_layer_7_online_free():
    metas = ler_metadados()
    if not metas:
        return
    pacotes = []
    for i, m in enumerate(metas, 1):
        vid = m.get("id"); nome = m.get("nome_arquivo", vid)
        if not vid:
            continue
        print(f"[{i}/{len(metas)}] IA Online (FREE) → {vid}")
        try:
            p = analisar_video_online(vid, nome)
            if p: pacotes.append(p)
        except Exception as e:
            print(f"⚠️ Falha em {vid}: {e}")
    if pacotes:
        Path(os.path.join(DADOS_DIR, "ai_online_insights.json")).write_text(json.dumps(pacotes, ensure_ascii=False, indent=2), encoding="utf-8")
        atualizar_excel_online(pacotes)
    else:
        print("Nada processado (sem transcrições ou sem token HF).")


In [None]:
rodar_layer_7_online_free()