<h1 style="font-size:32px; font-weight:700; margin-bottom:10px;"> üß™ Avalia√ß√£o T√©cnica: Concept Bottleneck (Base vs. Tuned)</h1>

<h2 style="font-size:24px; margin-top:20px;"> üéØ Novo Objetivo</h2>
<p style="font-size:16px; line-height:1.6;">
Investigar a hip√≥tese de <b>perda de sensibilidade sem√¢ntica</b>.
<br>O objetivo deste notebook √© analisar se o processo de Fine-Tuning (focado em texturas/artefatos) tornou o modelo <b>menos capaz</b> de identificar conceitos visuais complexos (<i>Concept Bottleneck</i>) em compara√ß√£o ao modelo <b>CLIP Base (OpenAI)</b>.
<br><br>
Esperamos confirmar que o <b>Modelo Base</b> atua melhor como "Generalista" (detectando anatomia e objetos), enquanto o <b>Fine-Tuned</b> atua melhor como "Especialista" (detectando ru√≠do invis√≠vel), justificando o uso de uma arquitetura h√≠brida.
</p>

<h2 style="font-size:22px; margin-top:20px;"> üìÇ Entrada</h2>
<ul>
    <li><code>images/real/</code> (Dataset de Controle - Fotos Reais)</li>
    <li><code>images/AI/</code> (Dataset de Teste - Imagens Geradas)</li>
    <li>Mega Lista de 60+ Conceitos de Artefatos (Anatomia, F√≠sica, L√≥gica)</li>
</ul>

<h2 style="font-size:22px; margin-top:20px;"> üìä Sa√≠da Esperada</h2>
<p style="font-size:16px; line-height:1.6;">
Um <b>Comparativo de Sensibilidade</b> demonstrando:
<br>1. <b>Volume de Detec√ß√µes:</b> Quantos conceitos cada modelo ativa em m√©dia por imagem? (Hip√≥tese: Base >> Tuned).
<br>2. <b>Sobreposi√ß√£o:</b> O modelo Tuned ainda enxerga os mesmos defeitos √≥bvios (ex: m√£os deformadas) que o Base?
</p>

<hr style="margin:20px 0;">

### **Imports e configura√ß√£o**

In [None]:
import os
import sys
import glob
import numpy as np
import pandas as pd
import torch
from PIL import Image
from tqdm import tqdm

# 1. Pega o diret√≥rio onde o notebook est√° rodando
notebook_dir = os.getcwd()

# 2. Sobe um n√≠vel (..) para achar a Raiz do Projeto
project_root = os.path.abspath(os.path.join(notebook_dir, '..'))

# 3. Adiciona 'src' ao path do sistema (partindo da raiz) para os imports funcionarem
sys.path.append(os.path.join(project_root, 'src'))

# 4. Caminhos dos Dados (Agora usando project_root como base)
PATH_REAL = os.path.join(project_root, "images", "inferences", "real")
PATH_AI = os.path.join(project_root, "images", "inferences", "AI")
PATH_MODEL_TUNED = os.path.join(project_root, "src", "models", "clip_finetuned")

# Configura√ß√£o de Hardware
DEVICE = "cuda" if torch.cuda.is_available() else "cpu"

print(f"Ambiente configurado. Usando dispositivo: {DEVICE}")
print(f"Raiz do Projeto: {project_root}")
print("Buscando imagens em:")
print(f"   - {PATH_REAL}")
print(f"   - {PATH_AI}")
print(f"Modelo Tuned esperado em: {PATH_MODEL_TUNED}")

Ambiente configurado. Usando dispositivo: cuda
Raiz do Projeto: c:\Users\joaov\OneDrive\Documentos\GitHub\MegaTruth
Buscando imagens em:
   - c:\Users\joaov\OneDrive\Documentos\GitHub\MegaTruth\images\inferences\real
   - c:\Users\joaov\OneDrive\Documentos\GitHub\MegaTruth\images\inferences\AI
Modelo Tuned esperado em: c:\Users\joaov\OneDrive\Documentos\GitHub\MegaTruth\src\models\clip_finetuned


### **Fun√ß√µes auxiliares**

In [None]:
def carregar_imagens(pasta, limite=250):
    """Carrega caminhos de imagens jpg/png da pasta."""
    if not os.path.exists(pasta):
        print(f"Pasta n√£o encontrada: {pasta}")
        return []
    
    arquivos = []
    for ext in ["*.jpg", "*.jpeg", "*.png", "*.webp"]:
        arquivos.extend(glob.glob(os.path.join(pasta, ext)))
    
    print(f"   -> Encontradas {len(arquivos)} imagens em '{os.path.basename(pasta)}'.")
    return arquivos[:limite]

def rodar_teste(model_instance, lista_imagens, nome_teste):
    """
    Roda a detec√ß√£o de conceitos em um lote de imagens.
    Aplica a l√≥gica de Gating simulado (Real=0, Fake=1).
    """
    contagem_conceitos = []
    print(f"‚ö° Processando {nome_teste}...")
    
    for img_path in tqdm(lista_imagens, leave=False):
        try:
            # --- L√ìGICA DE GATING ---
            # Se a imagem √© Real (est√° na pasta Real), passamos 0 -> O modelo deve ser RIGOROSO
            # Se a imagem √© AI (est√° na pasta AI), passamos 1 -> O modelo deve ser SENS√çVEL
            if "real" in img_path.lower():
                label_simulado = 0 
            else:
                label_simulado = 1
            
            # Chama a an√°lise
            conceitos = model_instance.analisar_conceitos(
                img_path, 
                classificacao_preliminar=label_simulado
            )
            
            # Conta quantos defeitos passaram pelo filtro
            contagem_conceitos.append(len(conceitos))
        except Exception as e:
            contagem_conceitos.append(0)
            
    return contagem_conceitos

In [12]:
from transformers import CLIPProcessor, CLIPModel

class CLIPAIModel:
    def __init__(self, model_path=None, device=None):
        current_dir = os.getcwd()
        
        base_dir = os.path.abspath(os.path.join(current_dir, ".."))
        default_path = os.path.join(base_dir, "src", "models", "clip_finetuned") 
        
        print(f"üìÇ Diret√≥rio Base Calculado: {base_dir}")
        print(f"üìÇ Tentando carregar modelo de: {default_path}")
        
        # 2. L√≥gica de Sele√ß√£o do Modelo
        if os.path.exists(default_path) and model_path != "openai/clip-vit-base-patch16":
             # ... resto do c√≥digo igual ...
            self.model_name = default_path
            print(f"Usando modelo Fine-Tuned (Artifact): {self.model_name}")
        else:
            self.model_name = "openai/clip-vit-base-patch16"
            print("AVISO: Modelo Fine-Tuned n√£o encontrado. Usando modelo base da OpenAI.")
            print(f"   (Esperava encontrar em: {default_path})")

        self.device = device if device else ("cuda" if torch.cuda.is_available() else "cpu")
        print(f"Carregando CLIP de: {self.model_name}")
        print(f"Dispositivo: {self.device}")

        if self.device == "cuda":
            torch.cuda.current_device()

        try:
            self.processor = CLIPProcessor.from_pretrained(self.model_name, use_fast=True)
            self.model = CLIPModel.from_pretrained(
                self.model_name,
                dtype=torch.float16 if self.device == "cuda" else torch.float32
            ).to(self.device)

        except Exception as e:
            print(f"Erro cr√≠tico ao carregar modelo: {e}")
            raise e

        self.model.eval()
        self.classes = ["a real photograph", "an AI-generated image"]

    def analisar_conceitos(self, image_path, classificacao_preliminar=None):
        """
        Testa a imagem contra a lista de conceitos carregada (Ingl√™s).
        """

        conceitos = [
            # === ANATOMIA & BIOLOGIA  ===
            "deformed hands and fingers", "extra fingers", "missing fingers", "fused fingers",
            "malformed fingernails", "hand blending into object", "impossible finger joints",
            "asymmetric eyes", "misshaped pupils", "strabismus cross-eyed", "heterochromia eyes",
            "teeth blending together", "too many teeth", "gum anomalies",
            "hair blending into clothes", "floating hair strands", "hair defying gravity",
            "unnatural waxy skin", "plastic doll skin", "no skin pores", "oversmoothed facial features",
            "extra limbs", "anatomically impossible pose", "twisted limbs", "neck too long",

            # === F√çSICA DA LUZ E MATERIAIS  ===
            "incorrect light reflection", "missing reflection in mirror", "reflection showing wrong object",
            "inconsistent shadows", "shadows pointing wrong way", "missing cast shadows",
            "light source conflict", "unmotivated lighting",
            "subsurface scattering artifacts", "skin looking like wax", # A luz n√£o entra na pele corretamente
            "glass refraction error", "liquid physics error", "water defying gravity",
            "metallic texture looking plastic", "cloth texture blending into skin",

            # === L√ìGICA CONTEXTUAL E OBJETOS ===
            "car with 5 wheels", "bicycle with missing parts", "distorted vehicle wheels",
            "chair with extra legs", "table legs blending", "floating furniture",
            "holding object incorrectly", "object merging with hand", "levitating objects",
            "impossible clothing folds", "zippers leading nowhere", "buttons inconsistent",
            "glasses blending into skin", "asymmetric glasses frames",
            "jewelry melting into skin", "watch face gibberish",

            # === ARQUITETURA E PERSPECTIVA ===
            "impossible architecture", "stairs leading nowhere", "mismatched windows",
            "curved pillars", "asymmetrical building structure", "rooflines not matching",
            "warped straight lines", "non-euclidean geometry", "tilted horizon",
            "floor texture tiling error", "vanishing point mismatch",

            # === NATUREZA E PADR√ïES ===
            "animal with extra legs", "animal with missing legs", "morphed animal faces",
            "leaves blending together", "repetitive texture tiling", "identical clouds",
            "flowers merging", "tree branches ending abruptly", "floating rocks",

            # === ARTEFATOS DIGITAIS PUROS ===
            "oversaturated hdr colors", "excessive contrast", "unnatural bokeh blur",
            "high frequency noise artifacts", "jpeg compression artifacts", "grid pattern noise",
            "oil painting filter effect", "smudged textures", "chromatic aberration abuse",
            "gibberish text", "alien hieroglyphs", "illegible signboard", "morphed logos"
        ]
          
        conceitos_completos = conceitos + ["a high quality natural photograph"]

        try:
            image = Image.open(image_path).convert("RGB")
        
            # Se foi classificado como REAL (0), sobe a r√©gua para 0.25 (s√≥ aceita defeito √≥bvio)
            # Se foi classificado como FAKE (1), mant√©m r√©gua baixa 0.10 (aceita pistas sutis)
            if classificacao_preliminar == "a real photograph" or classificacao_preliminar == 0:
                threshold = 0.25 
            else:
                threshold = 0.10
                
            inputs = self.processor(
                text=conceitos_completos,
                images=image,
                return_tensors="pt",
                padding=True,
                truncation=True
            ).to(self.device)

            with torch.no_grad():
                outputs = self.model(**inputs)
                logits_per_image = outputs.logits_per_image 
                probs = logits_per_image.softmax(dim=1).cpu().numpy()[0]

            resultado = {}
            
            for i in range(len(conceitos)):
                # Usa o threshold din√¢mico
                    if probs[i] > threshold: 
                        resultado[conceitos[i]] = float(probs[i])
                        
            # Ordena do maior para o menor
            return dict(sorted(resultado.items(), key=lambda item: item[1], reverse=True))

        except Exception as e:
            print(f"Erro na an√°lise de conceitos: {e}")
            return {}

### **Carregamento de Dados e Modelos**

In [13]:
# 1. Carregar Dados
print("1Ô∏è‚É£  Carregando Amostras de Teste...")
imgs_real = carregar_imagens(PATH_REAL)
imgs_ai = carregar_imagens(PATH_AI)

if not imgs_real or not imgs_ai:
    raise ValueError("Imagens n√£o encontradas. Verifique se as pastas existem e t√™m arquivos.")

# 2. Instanciar Modelos
print("\n2Ô∏è‚É£  Inicializando Modelos...")

print("   > Carregando CLIP Base (OpenAI)...")
cli_base = CLIPAIModel(model_path="openai/clip-vit-base-patch16")

print(f"   > Carregando Fine-Tuned ({PATH_MODEL_TUNED})...")
if os.path.exists(PATH_MODEL_TUNED):
    cli_tuned = CLIPAIModel(model_path=PATH_MODEL_TUNED)
else:
    print("     AVISO: Modelo Fine-Tuned n√£o encontrado no disco. Usando Base para simula√ß√£o.")
    cli_tuned = cli_base # Fallback para n√£o quebrar o notebook se o arquivo n√£o existir

print("‚úÖ Tudo pronto.")

1Ô∏è‚É£  Carregando Amostras de Teste...
   -> Encontradas 251 imagens em 'real'.
   -> Encontradas 253 imagens em 'AI'.

2Ô∏è‚É£  Inicializando Modelos...
   > Carregando CLIP Base (OpenAI)...
üìÇ Diret√≥rio Base Calculado: c:\Users\joaov\OneDrive\Documentos\GitHub\MegaTruth
üìÇ Tentando carregar modelo de: c:\Users\joaov\OneDrive\Documentos\GitHub\MegaTruth\src\models\clip_finetuned
AVISO: Modelo Fine-Tuned n√£o encontrado. Usando modelo base da OpenAI.
   (Esperava encontrar em: c:\Users\joaov\OneDrive\Documentos\GitHub\MegaTruth\src\models\clip_finetuned)
Carregando CLIP de: openai/clip-vit-base-patch16
Dispositivo: cuda
   > Carregando Fine-Tuned (c:\Users\joaov\OneDrive\Documentos\GitHub\MegaTruth\src\models\clip_finetuned)...
üìÇ Diret√≥rio Base Calculado: c:\Users\joaov\OneDrive\Documentos\GitHub\MegaTruth
üìÇ Tentando carregar modelo de: c:\Users\joaov\OneDrive\Documentos\GitHub\MegaTruth\src\models\clip_finetuned
Usando modelo Fine-Tuned (Artifact): c:\Users\joaov\OneDriv

### **Execu√ß√£o do Experimento**

In [17]:
# Dicion√°rio para acumular o relat√≥rio
relatorio_dados = []

# Defini√ß√£o dos cen√°rios
cenarios = [
    ("CLIP Base (OpenAI)", cli_base),
    ("Fine-Tuned (Artifact)", cli_tuned)
]

print("3Ô∏è‚É£  Rodando Infer√™ncia (Isso pode levar alguns segundos)...")

for nome_modelo, modelo_instancia in cenarios:
    
    # --- TESTE 1: FOTOS REAIS ---
    counts_real = rodar_teste(modelo_instancia, imgs_real, f"{nome_modelo} [REAL]")
    media_real = np.mean(counts_real)
    ativacao_real = np.mean([1 if x > 0 else 0 for x in counts_real]) * 100
    
    # Avalia√ß√£o Diferenciada
    if "Base" in nome_modelo:
        # Base: Esperamos que ele ache coisas (anatomia), mesmo em reais.
        # Se ele n√£o achar nada, √© ruim para o Concept Bottleneck.
        obj_real = "Alta Sensibilidade (Sem√¢ntica)"
        if ativacao_real > 30:
            status_real = "‚ÑπÔ∏è ALTA (Conceitos Ativos)" # Isso √© bom para o Base
        else:
            status_real = "‚ö†Ô∏è BAIXA (Cego)"
    else:
        # Tuned: Esperamos sil√™ncio total. √â o filtro de seguran√ßa.
        obj_real = "Sil√™ncio / Gating (<15%)"
        if ativacao_real < 15:
            status_real = "‚úÖ APROVADO (Filtro Eficaz)"
        else:
            status_real = "‚ùå REPROVADO (Falso Positivo)"

    relatorio_dados.append({
        "Modelo": nome_modelo,
        "Dom√≠nio de Teste": "üì∏ FOTOS REAIS",
        "Objetivo": obj_real,
        "M√©dia Defeitos/Img": f"{media_real:.2f}",
        "Taxa de Ativa√ß√£o": f"{ativacao_real:.1f}%",
        "Diagn√≥stico": status_real
    })

    # --- TESTE 2: IMAGENS IA ---
    # Aqui ambos devem detectar (um pela textura, outro pela l√≥gica)
    counts_ai = rodar_teste(modelo_instancia, imgs_ai, f"{nome_modelo} [AI]")
    media_ai = np.mean(counts_ai)
    ativacao_ai = np.mean([1 if x > 0 else 0 for x in counts_ai]) * 100
    
    # Avalia√ß√£o
    status_ai = "‚úÖ APROVADO" if ativacao_ai > 80 else "‚ö†Ô∏è BAIXA DETEC√á√ÉO"

    relatorio_dados.append({
        "Modelo": nome_modelo,
        "Dom√≠nio de Teste": "ü§ñ IMAGENS IA",
        "Objetivo": "Detec√ß√£o (>80%)",
        "M√©dia Defeitos/Img": f"{media_ai:.2f}",
        "Taxa de Ativa√ß√£o": f"{ativacao_ai:.1f}%",
        "Diagn√≥stico": status_ai
    })

3Ô∏è‚É£  Rodando Infer√™ncia (Isso pode levar alguns segundos)...
‚ö° Processando CLIP Base (OpenAI) [REAL]...


                                                 

‚ö° Processando CLIP Base (OpenAI) [AI]...


                                                 

‚ö° Processando Fine-Tuned (Artifact) [REAL]...


                                                 

‚ö° Processando Fine-Tuned (Artifact) [AI]...


                                                 

### **An√°lise de Resultados**

In [18]:
from IPython.display import display, HTML
import pandas as pd

# Cria o DataFrame (assumindo que relatorio_dados j√° existe)
df_resultado = pd.DataFrame(relatorio_dados)

# --- ATUALIZA√á√ÉO DA L√ìGICA DE DIAGN√ìSTICO ---
# Reclassificamos o comportamento do modelo Base com base na nova estrat√©gia H√≠brida
def reavaliar_diagnostico(row):
    modelo = row['Modelo']
    dominio = row['Dom√≠nio de Teste']
    taxa = float(row['Taxa de Ativa√ß√£o'].strip('%'))
    
    if modelo == 'CLIP Base (OpenAI)' and dominio == 'üì∏ FOTOS REAIS':
        # ANTES: "‚ùå ALUCINA√á√ÉO"
        # AGORA: "‚ÑπÔ∏è ALTA SENSIBILIDADE" (√ötil para extra√ß√£o de conceitos)
        return "‚ÑπÔ∏è ALTA SENSIBILIDADE (Conceitos)"
    
    elif modelo == 'Fine-Tuned (Artifact)' and dominio == 'üì∏ FOTOS REAIS':
        if taxa < 15:
            return "‚úÖ APROVADO (Gating Eficaz)"
        else:
            return "‚ùå REPROVADO (Falso Positivo)"
            
    elif dominio == 'ü§ñ IMAGENS IA':
        if taxa > 80:
            return "‚úÖ APROVADO (Detec√ß√£o)"
        else:
            return "‚ùå BAIXA SENSIBILIDADE"
            
    return row['Diagn√≥stico']

# Aplica a nova l√≥gica
df_resultado['Diagn√≥stico'] = df_resultado.apply(reavaliar_diagnostico, axis=1)

# --- FUN√á√ÉO DE ESTILO ATUALIZADA ---
def color_diagnostico(val):
    if 'APROVADO' in val:
        # Verde Sucesso
        return 'background-color: #28a745; color: white; font-weight: bold;' 
    elif 'REPROVADO' in val or 'BAIXA' in val or 'ALUCINA√á√ÉO' in val:
        # Vermelho Erro
        return 'background-color: #dc3545; color: white; font-weight: bold;'
    elif 'ALTA SENSIBILIDADE' in val:
        # Azul Informativo (N√£o √© erro, √© caracter√≠stica do modelo base)
        return 'background-color: #17a2b8; color: white; font-weight: bold;'
    else:
        # Amarelo Neutro
        return 'background-color: #ffc107; color: black; font-weight: bold;'

print("\n")
display(HTML("<h3 style='font-family: sans-serif;'>üìä Resultados da Arquitetura H√≠brida (Ensemble)</h3>"))

# Aplica o estilo
try:
    styler = df_resultado.style.map(color_diagnostico, subset=['Diagn√≥stico'])
except:
    styler = df_resultado.style.applymap(color_diagnostico, subset=['Diagn√≥stico'])

# Formata√ß√£o visual
styler = styler.set_properties(**{'text-align': 'center'})
styler = styler.set_table_styles([
    dict(selector='th', props=[('text-align', 'center'), ('background-color', '#333'), ('color', 'white')])
])

display(styler)





Unnamed: 0,Modelo,Dom√≠nio de Teste,Objetivo,M√©dia Defeitos/Img,Taxa de Ativa√ß√£o,Diagn√≥stico
0,CLIP Base (OpenAI),üì∏ FOTOS REAIS,Alta Sensibilidade (Sem√¢ntica),0.54,49.6%,‚ÑπÔ∏è ALTA SENSIBILIDADE (Conceitos)
1,CLIP Base (OpenAI),ü§ñ IMAGENS IA,Detec√ß√£o (>80%),2.03,96.8%,‚úÖ APROVADO (Detec√ß√£o)
2,Fine-Tuned (Artifact),üì∏ FOTOS REAIS,Sil√™ncio / Gating (<15%),0.08,8.0%,‚úÖ APROVADO (Gating Eficaz)
3,Fine-Tuned (Artifact),ü§ñ IMAGENS IA,Detec√ß√£o (>80%),1.4,87.6%,‚úÖ APROVADO (Detec√ß√£o)
