# Análise dos Dados dos Algoritmos ACO e GRASP

Neste notebook, vamos analisar os dados salvos dos algoritmos GRASP e Colônia de Formigas aplicados ao problema do caixeiro viajante. Vamos carregar os dados salvos com `np.savez`, convertê-los para DataFrames e criar gráficos para analisar diferentes aspectos de sua qualidade e execução.


## Importando bibliotecas

In [2]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt


## Carregamento e processamento dos dados (GRASP)
Vamos processar os dados do GRASP para converter os resultados em DataFrames do Pandas.


In [12]:
def carregar_dados_grasp(arquivo):
    """Carrega e agrega dados do arquivo NPZ."""
    dados_grasp = np.load(arquivo, allow_pickle=True)
    execucoes_grasp = []

    # Supondo que os dados estejam sob a chave 'resultados_grasp'
    chave = 'resultados_grasp'
    if chave in dados_grasp:
        dados = dados_grasp[chave]
        if isinstance(dados, np.ndarray):
            for execucao_dados in dados:
                if isinstance(execucao_dados, dict):
                    # Adiciona a chave 'execucao' para identificar a execução
                    execucao_dados['execucao'] = execucao_dados.get('execucao_num', None)
                    execucoes_grasp.append(execucao_dados)
                else:
                    print(f"Tipo de dados inesperado na execução: {type(execucao_dados)}")
        else:
            print(f"Tipo de dados inesperado para a chave {chave}: {type(dados)}")
    else:
        print(f"Chave {chave} não encontrada no arquivo NPZ.")

    return execucoes_grasp


In [14]:
def criar_dataframe_resultados(arquivo):
    """Cria um DataFrame com base nos resultados carregados do arquivo NPZ."""
    execucoes_grasp = carregar_dados_grasp(arquivo)
    return pd.DataFrame(execucoes_grasp)

# Carregar e criar DataFrame de resultados
df_grasp = criar_dataframe_resultados('resultados_grasp.npz')

# Verificar as colunas do DataFrame
print("Colunas do DataFrame:", df_grasp.columns)

# Mostrar DataFrame com execuções e distância total
try:
    print(df_grasp[['execucao', 'distancia_total', 'melhor_caminho']])
except KeyError as e:
    print(f"Erro ao acessar colunas: {e}")


# Verificar as colunas do DataFrame
print("Colunas do DataFrame:", df_grasp.columns)

# Mostrar DataFrame com execuções e distância total
try:
    print(df_grasp[['execucao', 'distancia_total', 'melhor_caminho']])
except KeyError as e:
    print(f"Erro ao acessar colunas: {e}")


Colunas do DataFrame: Index(['execucao_num', 'melhor_caminho', 'tempo_execucao', 'distancia_total',
       'historico_custos', 'execucao'],
      dtype='object')
    execucao  distancia_total  \
0          1      7544.365902   
1          2      7544.365902   
2          3      7544.365902   
3          4      7544.365902   
4          5      7544.365902   
5          6      7544.365902   
6          7      7544.365902   
7          8      7544.365902   
8          9      7544.365902   
9         10      7544.365902   
10        11      7544.365902   
11        12      7598.442341   
12        13      7656.578347   
13        14      7598.442341   
14        15      7544.365902   
15        16      7619.153101   
16        17      7544.365902   
17        18      7544.365902   
18        19      7544.365902   
19        20      7544.365902   
20        21      7544.365902   
21        22      7544.365902   
22        23      7544.365902   
23        24      7544.365902   
24        25 

## Carregarmento e processamento dos dados (ACO)

Agora, vamos carregar e processar os dados do Algoritmo de Colônia de Formigas (ACO).


In [4]:
def carregar_dados_aco(arquivo):
    """Carrega e agrega dados do arquivo NPZ."""
    dados_aco = np.load(arquivo, allow_pickle=True)
    execucoes_aco = []

    # Supondo que os dados estejam sob a chave 'resultados_aco'
    chave = 'resultados_aco'
    if chave in dados_aco:
        dados = dados_aco[chave]
        if isinstance(dados, np.ndarray):
            for execucao_dados in dados:
                if isinstance(execucao_dados, dict):
                    # Adiciona a chave 'execucao' para identificar a execução
                    execucao_dados['execucao'] = execucao_dados.get('execucao_num', None)
                    execucoes_aco.append(execucao_dados)
                else:
                    print(f"Tipo de dados inesperado na execução: {type(execucao_dados)}")
        else:
            print(f"Tipo de dados inesperado para a chave {chave}: {type(dados)}")
    else:
        print(f"Chave {chave} não encontrada no arquivo NPZ.")

    return execucoes_aco


In [6]:
def processar_dados_aco(dados):
    if isinstance(dados, list) and all(isinstance(item, dict) for item in dados):
        return pd.DataFrame({
            'execucao': [item.get('execucao') for item in dados],
            'melhor_caminho': [item.get('melhor_caminho') for item in dados],
            'distancia_total': [item.get('distancia_total') for item in dados],
            'tempo_execucao': [item.get('tempo_execucao') for item in dados],
            'historico_custos': [item.get('historico_custos') for item in dados]
        })
    else:
        raise ValueError("Estrutura dos dados não reconhecida.")

# Carregar e processar dados
execucoes_aco = carregar_dados_aco('resultados_aco.npz')
if execucoes_aco:
    df_aco = processar_dados_aco(execucoes_aco)
    # Exibir as primeiras linhas do DataFrame
    print(df_aco.tail(5))
else:
    print("Nenhum dado foi carregado.")


    execucao                                     melhor_caminho  \
25        26  [(14, 5), (5, 3), (3, 24), (24, 11), (11, 27),...   
26        27  [(48, 31), (31, 44), (44, 18), (18, 40), (40, ...   
27        28  [(1, 6), (6, 41), (41, 16), (16, 2), (2, 17), ...   
28        29  [(21, 0), (0, 48), (48, 31), (31, 44), (44, 18...   
29        30  [(14, 5), (5, 3), (3, 24), (24, 11), (11, 27),...   

    distancia_total  tempo_execucao  \
25      7549.289019      175.621375   
26      7623.435051      176.197247   
27      7714.998073      175.543964   
28      7720.210741      111.571393   
29      7544.365902      111.490778   

                                     historico_custos  
25  [12832.607480315375, 13131.874216757386, 13712...  
26  [12924.160650860416, 13619.154922861784, 14208...  
27  [14271.35281422834, 11908.54985083788, 12957.5...  
28  [12946.265778062749, 12630.363259259899, 13043...  
29  [12110.561934010464, 13928.615300297188, 13829...  


### Consultar as colunas do data frame

In [9]:
# Verifique as colunas do DataFrame df_aco
print(df_aco.columns)


Index(['execucao', 'melhor_caminho', 'distancia_total', 'tempo_execucao',
       'historico_custos'],
      dtype='object')


# Análise e Visualização

### Distribuição da Distância Total para GRASP

In [None]:

distancia_constante = df_grasp['distancia_total'].iloc[0]  # Obtendo o valor constante

plt.figure(figsize=(12, 6))
plt.scatter(range(len(df_grasp)), df_grasp['distancia_total'], color='skyblue', alpha=0.7)
plt.axhline(y=distancia_constante, color='red', linestyle='--', label=f'Valor Constante: {distancia_constante}')
plt.title('Distância Total para GRASP (Dispersão)')
plt.xlabel('Execução')
plt.ylabel('Distância Total')
plt.legend()
plt.grid(True)
plt.show()


### Distribuição do Tempo de Execução para GRASP

In [None]:
plt.figure(figsize=(12, 6))
plt.plot(range(1, len(df_grasp) + 1), df_grasp['tempo_execucao'], label='GRASP', color='blue', marker='o')
plt.title('Tempo de Execução ao Longo das Execuções - GRASP')
plt.xlabel('Número da Execução')
plt.ylabel('Tempo de Execução (segundos)')
plt.grid(True)
plt.show()

### Distribuição da Distância Total para ACO


In [None]:
plt.figure(figsize=(12, 6))
plt.plot(df_aco['distancia_total'], df_aco['execucao_num'], marker='o', linestyle='-', color='salmon', label='ACO')
plt.title('Evolução da Distância Total para ACO')
plt.xlabel('Distância Total')
plt.ylabel('Número de Execução')
plt.grid(True)
plt.legend()
plt.show()


### Distribuição do Tempo de Execução para ACO


In [None]:
# Gráfico de linha para o tempo de execução ao longo das execuções - ACO
plt.figure(figsize=(12, 6))
plt.plot(range(1, len(df_aco) + 1), df_aco['tempo_execucao'], label='ACO', color='red', marker='o')
plt.title('Tempo de Execução ao Longo das Execuções - ACO')
plt.xlabel('Número da Execução')
plt.ylabel('Tempo de Execução (segundos)')
plt.grid(True)
plt.show()


### Comparar Distribuição da Distância Total entre GRASP e ACO


In [None]:
# Comparar distribuição da distância total entre GRASP e ACO
plt.figure(figsize=(12, 6))
plt.hist(df_grasp['distancia_total'], bins=20, alpha=0.5, label='GRASP', edgecolor='k')
plt.hist(df_aco['distancia_total'], bins=20, alpha=0.5, label='ACO', edgecolor='k')
plt.title('Comparação da Distância Total entre GRASP e ACO')
plt.xlabel('Distância Total')
plt.ylabel('Frequência')
plt.legend()
plt.show()


### Comparar Distribuição do Tempo de Execução entre GRASP e ACO


In [None]:
# Gráfico de linha para o tempo de execução ao longo das execuções - GRASP e ACO
plt.figure(figsize=(12, 6))

# Linha para GRASP
plt.plot(range(1, len(df_grasp) + 1), df_grasp['tempo_execucao'], label='GRASP', color='blue', marker='o')

# Linha para ACO
plt.plot(range(1, len(df_aco) + 1), df_aco['tempo_execucao'], label='ACO', color='red', marker='o')

# Configurações do gráfico
plt.title('Tempo de Execução ao Longo das Execuções - GRASP vs ACO')
plt.xlabel('Número da Execução')
plt.ylabel('Tempo de Execução (segundos)')
plt.legend()
plt.grid(True)
plt.show()


# Análise Estatística para ACO e GRASP

Vamos realizar uma análise detalhada dos tempos de execução e das soluções encontradas para os algoritmos ACO e GRASP.



### Melhor Caminho de Cada Execução


In [None]:
print("Melhor Caminho Encontrado em Cada Execução (GRASP):")
print(df_grasp['melhor_caminho'])

print("Melhor Caminho Encontrado em Cada Execução (ACO):")
print(df_aco['melhor_caminho'])


### Melhor Caminho de Cada Iteração

In [None]:
# Exemplo para ACO
df_aco['melhor_caminho_iteracoes'] = [iteracao for iteracao in df_aco['historico_custos']]
print(df_aco[['melhor_caminho', 'melhor_caminho_iteracoes']])


### Distância do Melhor Caminho e Distância a Cada Iteração


In [None]:
print("Distância do Melhor Caminho (GRASP):")
print(df_grasp['distancia_total'])

print("Distância do Melhor Caminho (ACO):")
print(df_aco['distancia_total'])

print("Distâncias ao Longo das Iterações (ACO):")
print(df_aco['historico_custos'])


### Tempo de Cada Execução

In [None]:
print("Tempo de Execução (GRASP):")
print(df_grasp['tempo_execucao'])

print("Tempo de Execução (ACO):")
print(df_aco['tempo_execucao'])


## Estatísticas Básicas: Média, Mediana e Moda


In [None]:
from scipy import stats

def estatisticas(df, coluna):
    media = df[coluna].mean()
    mediana = df[coluna].median()
    
    # Calcula a moda
    moda_resultado = stats.mode(df[coluna], keepdims=True)
    moda = moda_resultado.mode[0] if moda_resultado.count[0] > 0 else np.nan
    
    desvio_padrao = df[coluna].std()
    minimo = df[coluna].min()
    maximo = df[coluna].max()
    
    return media, mediana, moda, desvio_padrao, minimo, maximo

# Estatísticas para GRASP
media_tempo_grasp, mediana_tempo_grasp, moda_tempo_grasp, desvio_padrao_tempo_grasp, min_tempo_grasp, max_tempo_grasp = estatisticas(df_grasp, 'tempo_execucao')
media_distancia_grasp, mediana_distancia_grasp, moda_distancia_grasp, desvio_padrao_distancia_grasp, min_distancia_grasp, max_distancia_grasp = estatisticas(df_grasp, 'distancia_total')

# Estatísticas para ACO
media_tempo_aco, mediana_tempo_aco, moda_tempo_aco, desvio_padrao_tempo_aco, min_tempo_aco, max_tempo_aco = estatisticas(df_aco, 'tempo_execucao')
media_distancia_aco, mediana_distancia_aco, moda_distancia_aco, desvio_padrao_distancia_aco, min_distancia_aco, max_distancia_aco = estatisticas(df_aco, 'distancia_total')

print(f"GRASP - Tempo de Execução: Média={media_tempo_grasp}, Mediana={mediana_tempo_grasp}, Moda={moda_tempo_grasp}, Desvio Padrão={desvio_padrao_tempo_grasp}, Minimo={min_tempo_grasp}, Máximo={max_tempo_grasp}")
print(f"GRASP - Distância Total: Média={media_distancia_grasp}, Mediana={mediana_distancia_grasp}, Moda={moda_distancia_grasp}, Desvio Padrão={desvio_padrao_distancia_grasp}, Minimo={min_distancia_grasp}, Máximo={max_distancia_grasp}")

print(f"ACO - Tempo de Execução: Média={media_tempo_aco}, Mediana={mediana_tempo_aco}, Moda={moda_tempo_aco}, Desvio Padrão={desvio_padrao_tempo_aco}, Minimo={min_tempo_aco}, Máximo={max_tempo_aco}")
print(f"ACO - Distância Total: Média={media_distancia_aco}, Mediana={mediana_distancia_aco}, Moda={moda_distancia_aco}, Desvio Padrão={desvio_padrao_distancia_aco}, Minimo={min_distancia_aco}, Máximo={max_distancia_aco}")


## Desvio Padrão


In [None]:
# Desvio padrão para ACO
desvio_padrao_tempo_aco = df_aco['tempo_execucao'].std()
desvio_padrao_distancia_aco = df_aco['distancia_total'].std()

print("ACO:")
print(f"Desvio padrão do tempo de execução: {desvio_padrao_tempo_aco}")
print(f"Desvio padrão da distância total: {desvio_padrao_distancia_aco}")

# Desvio padrão para GRASP (assumindo que df_grasp já está definido)
desvio_padrao_tempo_grasp = df_grasp['tempo_execucao'].std()
desvio_padrao_distancia_grasp = df_grasp['distancia_total'].std()

print("\nGRASP:")
print(f"Desvio padrão do tempo de execução: {desvio_padrao_tempo_grasp}")
print(f"Desvio padrão da distância total: {desvio_padrao_distancia_grasp}")


### Ponto de Convergência


In [None]:
# Para ACO
def detectar_convergencia(historico_custos):
    melhorias = np.diff(historico_custos)  # Diferença entre custos consecutivos
    estagnacao = np.where(melhorias <= 0)[0]  # Índices onde não há melhoria
    if len(estagnacao) > 0:
        return estagnacao[0] + 1  # Retorna a primeira iteração de estagnação
    return len(historico_custos)  # Se não houver estagnação, retorna o total de iterações

df_aco['ponto_convergencia'] = df_aco['historico_custos'].apply(detectar_convergencia)
print(df_aco[['ponto_convergencia']])


### Histórico de Custo


In [None]:
# Plotar o histórico de custos para ACO
plt.figure(figsize=(12, 6))
for i, row in df_aco.iterrows():
    plt.plot(row['historico_custos'], label=f'Execução {i+1}')

plt.title('Histórico de Custo ao Longo das Iterações (ACO)')
plt.xlabel('Número da Iteração')
plt.ylabel('Custo')
plt.legend()
plt.grid(True)
plt.show()
