In [None]:
from src.build_graph import build_graph_from_txt

G = build_graph_from_txt("data/twitter_combined.txt")
print("Nós:", G.number_of_nodes())
print("Arestas:", G.number_of_edges())

# Constroí o grafo e exibe o número de nós e arestas dele
# Usando como base os dados do twitter

In [None]:
# 2️⃣ TRANSFORMAÇÃO EM SUBGRAFO (opcional)
from src.analysis import calcular_pagerank
import random
                                 # ← Defina qual tipo de subgrafo quer usar
usar_subgrafo_top = True         # ← Mude aqui se quiser um subgrafo dos mais influentes
usar_subgrafo_aleatorio = False  # ← Mude aqui se quiser um aleatório
n = 500                          # ← Tamanho do subgrafo

if usar_subgrafo_top:
    pagerank = calcular_pagerank(G)
    top_nos = sorted(pagerank, key=pagerank.get, reverse=True)[:n]
    G = G.subgraph(top_nos).copy()
    print(f"Subgrafo com os {n} nós mais influentes criado.")

elif usar_subgrafo_aleatorio:
    amostra = random.sample(list(G.nodes), min(n, G.number_of_nodes()))
    G = G.subgraph(amostra).copy()
    print(f"Subgrafo aleatório com {n} nós criado.")

# Verifica o novo tamanho do grafo
print("Novo número de nós:", G.number_of_nodes())
print("Novo número de arestas:", G.number_of_edges())

In [None]:
from src.analysis import calcular_pagerank

# Calcular PageRank
pagerank = calcular_pagerank(G)
print("Top 10 nós por PageRank:")
n = 1
for node, score in sorted(pagerank.items(), key=lambda x: x[1], reverse=True)[:10]:
    print(f"{n} - {node}: {score:.4f}")
    n += 1
    
# Avalia a importância dos nós com base em quantos outros nós importantes apontam para ele
# No contexto do Twitter, mede a "influência de usuários com base nas iterações recebidas"
# Estranhamente extremamente rápido 

# O score se trata de um valor númerico entre 0 e 1, normalmente com 4 ou 5 casas decimais, que representa
# a probabilidade de estar nesse nó em uma caminha aleatória
# (A soma de todos os scores do grafo dá 1)

In [None]:
from src.analysis import calcular_centralidades

# Calcular as três centralidades
centralidades = calcular_centralidades(G)

# Top 1 por grau
top_grau = max(centralidades["grau"], key=centralidades["grau"].get)
print("Top 1 em centralidade de grau:", top_grau)

# Top 1 por intermediação
top_intermediacao = max(centralidades["intermediacao"], key=centralidades["intermediacao"].get)
print("Top 1 em centralidade de intermediação:", top_intermediacao)

# Top 1 por proximidade
top_proximidade = max(centralidades["proximidade"], key=centralidades["proximidade"].get)
print("Top 1 em centralidade de proximidade:", top_proximidade)

# - Grau: Usuários que mais interagem ou são mencionados
# - Intermediação: Conectam diferentes comunidades (pontes)
# - Proximidade: Espalham informações rapidamente 

In [None]:
from src.analysis import detectar_comunidades_louvain

# Comunidades Louvain
particoes = detectar_comunidades_louvain(G)
print("Número de comunidades detectadas:", len(set(particoes.values())))

#Algoritmo que encontra grupos de usuários com alta conexão interna.
#Ajuda a identificar "bolhas de desinformação ou câmaras de eco"

In [None]:
from src.analysis import detectar_comunidades_girvan_newman

# G precisa ser um grafo pequeno (ex: já transformado em subgrafo com 200 nós)
comunidades = detectar_comunidades_girvan_newman(G, num_comunidades=5)

print(f"{len(comunidades)} comunidades detectadas via Girvan-Newman")
for i, grupo in enumerate(comunidades):
    print(f"Comunidade {i+1} - {len(grupo)} nós")

In [None]:
from src.visualize import plot_grafo_basico

plot_grafo_basico(G)  # Mostra primeiros 200 nós (Detalhe que aqui só conseguimos mudar dentro do código, já que é menos experimental)

In [None]:
# Visualizar um grafo com os nós dimensionados pelo valor do PageRank
# Precisa do grafo e do Pagerank pra ser executado
# Consegue ser executado mesmo com o grafo completo, mas recomendado que o num_nodes seja <= 300

from src.visualize import plot_pagerank

plot_pagerank(G, pagerank, num_nodes = 500)

In [None]:
# Visualizar o grafo colorido, as comunidades estão separadas por cores
# Os nós mais influentes estão circulados para melhor visualização

from src.visualize import plot_comunidades_com_pagerank

plot_comunidades_com_pagerank(G, particoes, pagerank, num_top=10)

In [None]:
from src.visualize import exportar_para_gephi

# Exportar o grafo para o formato .gext, pronto para abrir no Gephi
# G: grafo
# Versão mais simples
exportar_para_gephi(G)

In [None]:
from src.visualize import exportar_para_gephi_com_atributos
# G: grafo (de preferência já um subgrafo com no máximo ~500 nós)
# pagerank: dicionário com a pontuação de influência de cada nó
# particoes: dicionário com a comunidade de cada nó (ex: detectada por Louvain)

# Exporta o grafo para o formato .gexf, pronto para abrir no Gephi
exportar_para_gephi_com_atributos(G, pagerank, particoes)

# Para executar, primeiro executar o grafo, depois o pagerank, depois a detecção de comunidades louvain