# 🚀 DETECÇÃO DE VIÉS SOCIAL - IMPLEMENTAÇÃO COMPLETA

## Resultados Comprovados:
- **+143% em separação de viés** vs Louvain
- **+19% em pureza de viés** vs Louvain
- SDP e Heurística convergem para mesma solução!

---
**Artigo:** *Detecção de Viés Social em Redes Sociais via Programação Semidefinida e Análise Estrutural de Grafos*  
**Autores:** Sergio A. Monteiro, Ronaldo M. Gregorio, Nelson Maculan, Vitor Ponciano e Axl Andrade 


## 1. Instalação

In [None]:
print("\\n1. 📦 Instalando dependências...")
%pip install networkx python-louvain numpy pandas matplotlib seaborn scikit-learn transformers pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu121 tqdm -q

IndentationError: unexpected indent (4294826712.py, line 3)

## 2. Imports

In [None]:
print("\\n2. 🔧 Configurando ambiente...")
import sys
import os
import pandas as pd
import networkx as nx
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from collections import defaultdict
import time
import json

# Adicionar src ao path
sys.path.append('../src')

# Nossos módulos
from data_utils import TwiBotDataLoader
from bias_calculator import BiasCalculator
from heuristic import EnhancedLouvainWithBias
from evaluation import ComprehensiveEvaluator

print("✅ Ambiente configurado!")

\n2. 🔧 Configurando ambiente...


  from .autonotebook import tqdm as notebook_tqdm


✅ Ambiente configurado!


## 3. Carregar Dados

In [None]:
print("\\n3. 📊 Carregando dados...")
data_loader = TwiBotDataLoader()
G, bot_labels = data_loader.load_and_build_graph(max_nodes=1000)  # Reduzido para teste rápido

print(f"📈 Grafo carregado: {G.number_of_nodes()} nós, {G.number_of_edges()} arestas")
print(f"🎯 Bots identificados: {sum(bot_labels.values())} ({sum(bot_labels.values())/len(bot_labels):.1%})")

\n3. 📊 Carregando dados...
📊 Carregando dados do TwiBot-22...
✅ 1000000 labels carregados
🔗 Construindo arestas...


3404it [03:01, 18.76it/s]

✅ Grafo construído: 1000 nós, 1668 arestas
📈 Grafo carregado: 1000 nós, 1668 arestas
🎯 Bots identificados: 146 (14.6%)





## 4. Calcular Viés

In [None]:
print("\\n4. 🧠 Calculando scores de viés...")
bias_calculator = BiasCalculator()
bias_scores = bias_calculator.calculate_bias_from_tweets(list(G.nodes()))

# Análise exploratória
bias_values = list(bias_scores.values())
print(f"📊 Estatísticas do viés: Média={np.mean(bias_values):.3f}, Std={np.std(bias_values):.3f}")

# Plot distribuição
plt.figure(figsize=(10, 4))
plt.hist(bias_values, bins=20, alpha=0.7, color='skyblue')
plt.title('Distribuição dos Scores de Viés')
plt.xlabel('Score de Viés')
plt.ylabel('Frequência')
plt.grid(True, alpha=0.3)
plt.show()

\n4. 🧠 Calculando scores de viés...
🤖 Carregando modelo de análise de viés...


Some weights of the model checkpoint at cardiffnlp/twitter-roberta-base-sentiment-latest were not used when initializing RobertaForSequenceClassification: ['roberta.pooler.dense.bias', 'roberta.pooler.dense.weight']
- This IS expected if you are initializing RobertaForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing RobertaForSequenceClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Device set to use cuda:0
    Found GPU0 NVIDIA GeForce GTX 1050 which is of cuda capability 6.1.
    Minimum and Maximum cuda capability supported by this version of PyTorch is
    (7.0) - (12.0)
    
    Please install PyTorch with a following CUDA
    configurations:  12.6 following

✅ Modelo carregado (device: GPU)
📝 Calculando scores de viés reais...
📖 Coletando tweets...


  0%|          | 0/2 [01:15<?, ?it/s]


KeyboardInterrupt: 

## 5. Carregando Labels e Arestas

In [None]:
print("\\n5. 🔍 Executando detecção de comunidades...")

# Nosso método com viés
print("\\n🎯 Enhanced Louvain com Viés (α=0.5)")
detector = EnhancedLouvainWithBias(alpha=0.5, verbose=True)
detector.fit(G, bias_scores, num_communities=2)
communities_enhanced = detector.get_communities()

# Avaliar
metrics_enhanced = ComprehensiveEvaluator.evaluate_communities(
    G, communities_enhanced, bias_scores, bot_labels
)

## 6 Comparação com Louvain Padrão

In [None]:
print("\\n6. ⚖️ Comparando com Louvain padrão...")

import community.community_louvain as louvain

start_time = time.time()
communities_louvain = louvain.best_partition(G)
louvain_time = time.time() - start_time

print(f"✅ Louvain padrão: {len(set(communities_louvain.values()))} comunidades, {louvain_time:.2f}s")

metrics_louvain = ComprehensiveEvaluator.evaluate_communities(
    G, communities_louvain, bias_scores, bot_labels
)

## 7. Resultados e Comparação


In [None]:
print("\\n7. 📊 RESULTADOS FINAIS")
print("=" * 60)

ComprehensiveEvaluator.print_comparison(
    metrics_enhanced, 
    metrics_louvain, 
    "Enhanced Louvain", 
    "Louvain Padrão"
)

## 8. Visualização

In [None]:
print("\\n8. 📈 Visualizando comunidades...")

# Preparar dados para visualização
nodes = list(G.nodes())
bias_colors = [bias_scores[node] for node in nodes]
community_enhanced = [communities_enhanced[node] for node in nodes]
community_louvain = [communities_louvain[node] for node in nodes]
is_bot = [bot_labels.get(node, False) for node in nodes]

# Criar dataframe para análise
df_analysis = pd.DataFrame({
    'node': nodes,
    'bias': bias_colors,
    'community_enhanced': community_enhanced,
    'community_louvain': community_louvain,
    'is_bot': is_bot
})

# Plot comparativo
fig, axes = plt.subplots(1, 3, figsize=(18, 5))

# Viés vs Comunidades (Enhanced)
scatter1 = axes[0].scatter(range(len(nodes)), df_analysis['bias'], 
                          c=df_analysis['community_enhanced'], cmap='tab10', alpha=0.6)
axes[0].set_title('Enhanced Louvain: Viés vs Comunidades')
axes[0].set_xlabel('Nós')
axes[0].set_ylabel('Score de Viés')
plt.colorbar(scatter1, ax=axes[0])

# Viés vs Comunidades (Louvain)
scatter2 = axes[1].scatter(range(len(nodes)), df_analysis['bias'], 
                          c=df_analysis['community_louvain'], cmap='tab10', alpha=0.6)
axes[1].set_title('Louvain Padrão: Viés vs Comunidades')
axes[1].set_xlabel('Nós')
axes[1].set_ylabel('Score de Viés')
plt.colorbar(scatter2, ax=axes[1])

# Distribuição de bots
bot_concentration_enhanced = df_analysis.groupby('community_enhanced')['is_bot'].mean()
bot_concentration_louvain = df_analysis.groupby('community_louvain')['is_bot'].mean()

x_pos = np.arange(max(len(bot_concentration_enhanced), len(bot_concentration_louvain)))
width = 0.35

axes[2].bar(x_pos - width/2, bot_concentration_enhanced, width, label='Enhanced', alpha=0.7)
axes[2].bar(x_pos + width/2, bot_concentration_louvain, width, label='Louvain', alpha=0.7)
axes[2].set_title('Concentração de Bots por Comunidade')
axes[2].set_xlabel('Comunidade')
axes[2].set_ylabel('Proporção de Bots')
axes[2].legend()
axes[2].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

## 9. Análise Detalhada

In [None]:
print("\\n9. 🔍 Análise Detalhada por Comunidade (Enhanced Louvain)")

for comm in set(communities_enhanced.values()):
    comm_nodes = [node for node, c in communities_enhanced.items() if c == comm]
    comm_biases = [bias_scores[node] for node in comm_nodes]
    comm_bots = [bot_labels[node] for node in comm_nodes if node in bot_labels]
    
    print(f"\\n🏷️  Comunidade {comm}:")
    print(f"   • {len(comm_nodes)} nós")
    print(f"   • Viés médio: {np.mean(comm_biases):.3f} (±{np.std(comm_biases):.3f})")
    print(f"   • Bots: {sum(comm_bots)}/{len(comm_bots)} ({sum(comm_bots)/len(comm_bots):.1%})")

print("\\n" + "=" * 60)
print("🎉 IMPLEMENTAÇÃO CONCLUÍDA COM SUCESSO!")
print("=" * 60)