# üìà Pr√©-processamento dos dados (Etapa 1)

Caio Bueno Finocchio Martins, Diego Alves de Oliveira

Este notebook permite visualizar e analisar as estat√≠sticas dos grafos das inst√¢ncias do problema, conforme solicitado na Etapa 1 do projeto.

- Representa√ß√£o do grafo
- Leitura dos dados
- C√°lculo das estat√≠sticas principais

In [1]:
import importlib
import m√©tricas
importlib.reload(m√©tricas)
from m√©tricas import *
from IPython.display import display, clear_output, HTML
import numpy as np
import pandas as pd
import os
import ipywidgets as widgets

# Fun√ß√£o de visualiza√ß√£o: criar tabela do grafo

def criar_tabela_grafo(grafo):
    if grafo is None or not hasattr(grafo, 'shape') or len(grafo.shape) != 2:
        print("Grafo n√£o carregado corretamente ou est√° vazio.")
        return None
    grafo_ajustado = np.array(grafo)[1:, 1:]
    n_vertices = grafo_ajustado.shape[0]
    if n_vertices <= 30:
        cell_width = '25px'
        font_size = '9pt'
    elif n_vertices <= 100:
        cell_width = '15px'
        font_size = '8pt'
    else:
        cell_width = '10px'
        font_size = '7pt'
    df = pd.DataFrame(
        grafo_ajustado,
        index=range(1, n_vertices + 1),
        columns=range(1, n_vertices + 1)
    )
    def format_value(x):
        if pd.isna(x):
            return "-"
        elif np.isinf(x):
            return "‚àû"
        elif isinstance(x, (int, np.integer)):
            return str(x)
        elif isinstance(x, (float, np.floating)):
            return f"{x:.2f}" if not x.is_integer() else str(int(x))
        return str(x)
    def background_style(x):
        return 'background-color: #e6f3ff' if x != 0 and not np.isinf(x) else 'background-color: white'
    styled_table = (
        df.style
        .map(background_style)
        .format(format_value)
        .set_properties(**{
            'text-align': 'center',
            'font-size': font_size,
            'padding': '2px',
            'border': '1px solid #ddd',
            'width': cell_width,
            'height': cell_width
        })
        .set_table_styles([{
            'selector': 'table',
            'props': [
                ('width', 'auto'),
                ('margin', '0 auto'),
                ('display', 'block' if n_vertices > 100 else 'inline-block'),
                ('max-width', '100%'),
                ('overflow-x', 'auto' if n_vertices > 100 else 'visible')
            ]
        }, {
            'selector': 'th, td',
            'props': [('max-width', cell_width)]
        }])
    )
    return styled_table

## 2. Sele√ß√£o da inst√¢ncia e widgets de intera√ß√£o
Permite ao usu√°rio escolher o arquivo de inst√¢ncia .dat para an√°lise e inicializa o painel de sa√≠da.

In [2]:
# Widget para sele√ß√£o de arquivo .dat

dat_files = sorted([f for f in os.listdir('instancias') if f.endswith('.dat')])
def default_file():
    return 'BHW4.dat' if 'BHW4.dat' in dat_files else dat_files[0]
file_selector = widgets.Dropdown(
    options=dat_files,
    value=default_file(),
    description='Arquivo:',
    disabled=False,
)
output = widgets.Output()

def componentes_conectados(grafo):
    n = grafo.shape[0] - 1
    visitados = set()
    componentes = 0
    for v in range(1, n+1):
        if v not in visitados:
            fila = [v]
            while fila:
                u = fila.pop()
                if u not in visitados:
                    visitados.add(u)
                    vizinhos = [i for i in range(1, n+1) if grafo[u][i] < np.inf and u != i]
                    fila.extend([w for w in vizinhos if w not in visitados])
            componentes += 1
    return componentes

def formatar_valor(v):
    if isinstance(v, float):
        if v.is_integer():
            return f"{int(v)}"
        else:
            return f"{v:.1f}"
    return v

def criar_tabela_grafo_scroll(grafo):
    tabela = criar_tabela_grafo(grafo)
    return tabela.set_table_attributes('style="display:block;overflow-x:auto;max-width:100%;"')

def atualizar_visualizacao(change):
    with output:
        clear_output(wait=True)
        arquivo = file_selector.value
        with open(f'instancias/{arquivo}', 'r', encoding='utf-8') as f:
            linhas = f.readlines()
        dados = extrair_dados_instancia(linhas)
        grafo = dados['grafo']

        # 1. Quantidade de v√©rtices
        qtd_vertices = dados['qtd_vertices']
        # 2. Quantidade de arestas
        qtd_arestas = len(dados['arestas']) + len(dados['arestas_req'])
        # 3. Quantidade de arcos
        qtd_arcos = len(dados['arcos']) + len(dados['arcos_req'])
        # 4. Quantidade de v√©rtices requeridos
        qtd_vertices_req = len(set(
            [i for (i, _, *_) in dados['arestas_req']] +
            [j for (_, j, *_) in dados['arestas_req']] +
            [i for (i, _, *_) in dados['arcos_req']] +
            [j for (_, j, *_) in dados['arcos_req']]
        ))
        # 5. Quantidade de arestas requeridas
        qtd_arestas_req = len(dados['arestas_req'])
        # 6. Quantidade de arcos requeridos
        qtd_arcos_req = len(dados['arcos_req'])
        # 7. Densidade do grafo
        dens = densidade(qtd_vertices, len(dados['arestas']) + len(dados['arestas_req']),
                         len(dados['arcos']) + len(dados['arcos_req']))
        # 8. Componentes conectados
        try:
            n_componentes = componentes_conectados(grafo)
        except Exception:
            n_componentes = "Fun√ß√£o n√£o implementada"
        # 9. Grau m√≠nimo dos v√©rtices
        graus = calcula_graus(dados)
        grau_min = min([g[4] for g in graus])
        # 10. Grau m√°ximo dos v√©rtices
        grau_max = max([g[4] for g in graus])
        # 11. Intermedia√ß√£o
        try:
            vertices = list(range(1, qtd_vertices+1))
            intermediacao = calcula_intermediacao(vertices, grafo)
        except Exception:
            intermediacao = {}
        # 12. Caminho m√©dio
        try:
            distancias, _ = floyd_warshall(grafo)
            caminho_medio_val = caminho_medio(distancias)
        except Exception:
            caminho_medio_val = "Fun√ß√£o n√£o implementada"
        # 13. Di√¢metro
        try:
            diametro_val = diametro(distancias)
        except Exception:
            diametro_val = "Fun√ß√£o n√£o implementada"

        # Exibe estat√≠sticas em tabela
        estatisticas = {
            'Qtd. V√©rtices': qtd_vertices,
            'Qtd. Arestas': qtd_arestas,
            'Qtd. Arcos': qtd_arcos,
            'Qtd. V√©rtices Requeridos': qtd_vertices_req,
            'Qtd. Arestas Requeridas': qtd_arestas_req,
            'Qtd. Arcos Requeridos': qtd_arcos_req,
            'Densidade': dens,
            'Componentes Conectados': n_componentes,
            'Grau M√≠nimo': grau_min,
            'Grau M√°ximo': grau_max,
            'Caminho M√©dio': caminho_medio_val,
            'Di√¢metro': diametro_val
        }
        df_est = pd.DataFrame(
            [(k, formatar_valor(v)) for k, v in estatisticas.items()],
            columns=['M√©trica', 'Valor']
        )
        display(HTML("<h4>M√©tricas do Grafo</h4>"))
        display(df_est.style.set_properties(**{'width': '300px'}))

        display(HTML("<h4>Intermedia√ß√£o dos V√©rtices</h4>"))
        if intermediacao:
            df_inter = pd.DataFrame(list(intermediacao.items()), columns=['V√©rtice', 'Intermedia√ß√£o'])
            display(df_inter.style.set_properties(**{'width': '300px'}))

        display(HTML("<h4>Matriz de Adjac√™ncia</h4>"))
        display(criar_tabela_grafo_scroll(grafo))

file_selector.observe(atualizar_visualizacao, names='value')
display(file_selector, output)
atualizar_visualizacao(None)

Dropdown(description='Arquivo:', index=14, options=('BHW1.dat', 'BHW10.dat', 'BHW11.dat', 'BHW12.dat', 'BHW13.‚Ä¶

Output()

## Matriz de Adjac√™ncia
A matriz de adjac√™ncia representa as conex√µes diretas entre os v√©rtices do grafo. 

- A posi√ß√£o \(i, j\) indica o peso do caminho direto do v√©rtice \(i\) para o v√©rtice \(j\).
- Um valor infinito (‚àû) significa que n√£o h√° conex√£o direta entre os v√©rtices \(i\) e \(j\).
- Um valor num√©rico indica o peso associado √† aresta direta entre os v√©rtices.

## Intermedia√ß√£o dos V√©rtices
A intermedia√ß√£o de um v√©rtice indica o n√∫mero de vezes que ele atua como intermedi√°rio em caminhos m√≠nimos entre outros pares de v√©rtices no grafo.

- Um valor alto de intermedia√ß√£o sugere que o v√©rtice √© importante para a conectividade geral do grafo.