# Análise dos Dados dos Algoritmos ACO e GRASP

Neste notebook, vamos analisar os dados salvos dos algoritmos GRASP e Colônia de Formigas aplicados ao problema do caixeiro viajante. Vamos carregar os dados salvos com `np.savez`, convertê-los para DataFrames e criar gráficos para analisar diferentes aspectos de sua qualidade e execução.


## Importando bibliotecas

In [1]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt


## Carregamento e processamento dos dados (GRASP)
Vamos processar os dados do GRASP para converter os resultados em DataFrames do Pandas.


In [2]:
def carregar_dados_grasp(arquivo):
    """Carrega e agrega dados do arquivo NPZ."""
    dados_grasp = np.load(arquivo, allow_pickle=True)
    execucoes_grasp = []

    for chave in dados_grasp.files:
        dados = dados_grasp[chave]
        if isinstance(dados, np.ndarray) and dados.ndim == 0:
            dados = dados.item()  # Converte o array 0-dimensional para um objeto Python (dicionário)
            if isinstance(dados, dict):
                execucoes_grasp.append(dados)
            else:
                print(f"Tipo de dados inesperado para a chave {chave}: {type(dados)}")
        else:
            print(f"Tipo de dados inesperado para a chave {chave}: {type(dados)}")

    return execucoes_grasp

def processar_dados_grasp(dados):
    """Converte a lista de dicionários em um DataFrame do Pandas."""
    if isinstance(dados, list) and all(isinstance(item, dict) for item in dados):
        return pd.DataFrame({
            'melhor_caminho': [item['melhor_caminho'] for item in dados],
            'distancia_total': [item['distancia_total'] for item in dados],
            'tempo_execucao': [item['tempo_execucao'] for item in dados],
            'historico_custos': [item['historico_custos'] for item in dados]
        })
    else:
        raise ValueError("Estrutura dos dados não reconhecida.")

def criar_dataframe_resultados(dados_grasp):
    """Cria um DataFrame com base nos resultados carregados."""
    resultados_grasp = {k: v.item() for k, v in dados_grasp.items()}
    lista_resultados = []

    for execucao, dados in resultados_grasp.items():
        dados['execucao'] = execucao
        lista_resultados.append(dados)

    return pd.DataFrame(lista_resultados)

# Carregar e processar dados
execucoes_grasp = carregar_dados_grasp('resultados_grasp.npz')

# Criar DataFrame de resultados
df_grasp = criar_dataframe_resultados(np.load('resultados_grasp.npz', allow_pickle=True))

# Processar dados GRASP
if execucoes_grasp:
    df_grasp_processado = processar_dados_grasp(execucoes_grasp)
    # Exibir as primeiras linhas do DataFrame processado
    print(df_grasp_processado.head())
else:
    print("Nenhum dado foi carregado.")

# Mostrar DataFrame com execuções e distância total
print(df_grasp[['execucao', 'distancia_total']])


                                      melhor_caminho  distancia_total  \
0  [33, 43, 10, 9, 8, 41, 19, 45, 32, 49, 1, 22, ...      7544.365902   
1  [30, 23, 20, 50, 29, 16, 46, 44, 34, 35, 36, 3...      7544.365902   
2  [31, 22, 1, 49, 32, 45, 19, 41, 8, 9, 10, 43, ...      7544.365902   

   tempo_execucao                                   historico_custos  
0      265.960417  [[11321.406811487523, 10971.476389585001, 1067...  
1      268.547644  [[10516.052125051114, 10226.818865417084, 9940...  
2      224.408046  [[11190.399529984757, 10624.519111231328, 1027...  
     execucao  distancia_total
0  execucao_1      7544.365902
1  execucao_2      7544.365902
2  execucao_3      7544.365902


## Carregarmento e processamento dos dados (ACO)

Agora, vamos carregar e processar os dados do Algoritmo de Colônia de Formigas (ACO).


In [3]:
data_aco = np.load('resultados_colonia_formigas.npz', allow_pickle=True)

# Listar todas as chaves disponíveis no arquivo
# print("Chaves do arquivo ACO:", data_aco.files)

execucoes_aco = []

# Inspecionar e agregar dados
for chave in data_aco.files:
    dados = data_aco[chave]
    if isinstance(dados, np.ndarray) and dados.ndim == 0:
        dados = dados.item()  # Converte o array 0-dimensional para um objeto Python (dicionário)
        if isinstance(dados, dict):
            execucoes_aco.append(dados)
        else:
            print(f"Tipo de dados inesperado para a chave {chave}: {type(dados)}")
    else:
        print(f"Tipo de dados inesperado para a chave {chave}: {type(dados)}")

def processar_dados_aco(dados):
    if isinstance(dados, list) and all(isinstance(item, dict) for item in dados):
        return pd.DataFrame({
            'melhor_caminho': [item['melhor_caminho'] for item in dados],
            'distancia_total': [item['distancia_total'] for item in dados],
            'tempo_execucao': [item['tempo_execucao'] for item in dados],
            'historico_custos': [item['historico_custos'] for item in dados]
        })
    else:
        raise ValueError("Estrutura dos dados não reconhecida.")

# Processar dados
if execucoes_aco:
    df_aco = processar_dados_aco(execucoes_aco)
    # Exibir as primeiras linhas do DataFrame
    print(df_aco.head())
else:
    print("Nenhum dado foi carregado.")


                                      melhor_caminho  distancia_total  \
0  [(9, 8), (8, 7), (7, 40), (40, 18), (18, 44), ...      7786.889227   
1  [(21, 0), (0, 48), (48, 31), (31, 44), (44, 18...      7728.279855   
2  [(21, 0), (0, 48), (48, 31), (31, 44), (44, 18...      7544.662211   

   tempo_execucao                                   historico_custos  
0       90.987671  [13714.982913899496, 12616.504728270604, 12816...  
1       91.298795  [13556.374853956328, 13856.724862471181, 13556...  
2       91.175339  [13628.899806499294, 13157.589119278362, 12996...  


### Consultar as colunas do data frame

In [None]:
# Verifique as colunas do DataFrame df_aco
print(df_aco.columns)


In [4]:
# Adicionar uma coluna 'execucao_num' com a ordem das execuções
df_grasp['execucao_num'] = df_grasp.index + 1
df_aco['execucao_num'] = df_aco.index + 1


# Análise e Visualização

### Distribuição da Distância Total para GRASP

In [None]:

distancia_constante = df_grasp['distancia_total'].iloc[0]  # Obtendo o valor constante

plt.figure(figsize=(12, 6))
plt.scatter(range(len(df_grasp)), df_grasp['distancia_total'], color='skyblue', alpha=0.7)
plt.axhline(y=distancia_constante, color='red', linestyle='--', label=f'Valor Constante: {distancia_constante}')
plt.title('Distância Total para GRASP (Dispersão)')
plt.xlabel('Execução')
plt.ylabel('Distância Total')
plt.legend()
plt.grid(True)
plt.show()


### Distribuição do Tempo de Execução para GRASP

In [None]:
plt.figure(figsize=(12, 6))
plt.plot(range(1, len(df_grasp) + 1), df_grasp['tempo_execucao'], label='GRASP', color='blue', marker='o')
plt.title('Tempo de Execução ao Longo das Execuções - GRASP')
plt.xlabel('Número da Execução')
plt.ylabel('Tempo de Execução (segundos)')
plt.grid(True)
plt.show()

### Distribuição da Distância Total para ACO


In [None]:
plt.figure(figsize=(12, 6))
plt.plot(df_aco['distancia_total'], df_aco['execucao_num'], marker='o', linestyle='-', color='salmon', label='ACO')
plt.title('Evolução da Distância Total para ACO')
plt.xlabel('Distância Total')
plt.ylabel('Número de Execução')
plt.grid(True)
plt.legend()
plt.show()


### Distribuição do Tempo de Execução para ACO


In [None]:
# Gráfico de linha para o tempo de execução ao longo das execuções - ACO
plt.figure(figsize=(12, 6))
plt.plot(range(1, len(df_aco) + 1), df_aco['tempo_execucao'], label='ACO', color='red', marker='o')
plt.title('Tempo de Execução ao Longo das Execuções - ACO')
plt.xlabel('Número da Execução')
plt.ylabel('Tempo de Execução (segundos)')
plt.grid(True)
plt.show()


### Comparar Distribuição da Distância Total entre GRASP e ACO


In [None]:
# Comparar distribuição da distância total entre GRASP e ACO
plt.figure(figsize=(12, 6))
plt.hist(df_grasp['distancia_total'], bins=20, alpha=0.5, label='GRASP', edgecolor='k')
plt.hist(df_aco['distancia_total'], bins=20, alpha=0.5, label='ACO', edgecolor='k')
plt.title('Comparação da Distância Total entre GRASP e ACO')
plt.xlabel('Distância Total')
plt.ylabel('Frequência')
plt.legend()
plt.show()


### Comparar Distribuição do Tempo de Execução entre GRASP e ACO


In [None]:
# Gráfico de linha para o tempo de execução ao longo das execuções - GRASP e ACO
plt.figure(figsize=(12, 6))

# Linha para GRASP
plt.plot(range(1, len(df_grasp) + 1), df_grasp['tempo_execucao'], label='GRASP', color='blue', marker='o')

# Linha para ACO
plt.plot(range(1, len(df_aco) + 1), df_aco['tempo_execucao'], label='ACO', color='red', marker='o')

# Configurações do gráfico
plt.title('Tempo de Execução ao Longo das Execuções - GRASP vs ACO')
plt.xlabel('Número da Execução')
plt.ylabel('Tempo de Execução (segundos)')
plt.legend()
plt.grid(True)
plt.show()


# Análise Estatística para ACO e GRASP

Vamos realizar uma análise detalhada dos tempos de execução e das soluções encontradas para os algoritmos ACO e GRASP.



### Melhor Caminho de Cada Execução


In [None]:
print("Melhor Caminho Encontrado em Cada Execução (GRASP):")
print(df_grasp['melhor_caminho'])

print("Melhor Caminho Encontrado em Cada Execução (ACO):")
print(df_aco['melhor_caminho'])


### Melhor Caminho de Cada Iteração

In [None]:
# Exemplo para ACO
df_aco['melhor_caminho_iteracoes'] = [iteracao for iteracao in df_aco['historico_custos']]
print(df_aco[['melhor_caminho', 'melhor_caminho_iteracoes']])


### Distância do Melhor Caminho e Distância a Cada Iteração


In [None]:
print("Distância do Melhor Caminho (GRASP):")
print(df_grasp['distancia_total'])

print("Distância do Melhor Caminho (ACO):")
print(df_aco['distancia_total'])

print("Distâncias ao Longo das Iterações (ACO):")
print(df_aco['historico_custos'])


### Tempo de Cada Execução

In [None]:
print("Tempo de Execução (GRASP):")
print(df_grasp['tempo_execucao'])

print("Tempo de Execução (ACO):")
print(df_aco['tempo_execucao'])


## Estatísticas Básicas: Média, Mediana e Moda


In [None]:
from scipy import stats

def estatisticas(df, coluna):
    media = df[coluna].mean()
    mediana = df[coluna].median()
    
    # Calcula a moda
    moda_resultado = stats.mode(df[coluna], keepdims=True)
    moda = moda_resultado.mode[0] if moda_resultado.count[0] > 0 else np.nan
    
    desvio_padrao = df[coluna].std()
    minimo = df[coluna].min()
    maximo = df[coluna].max()
    
    return media, mediana, moda, desvio_padrao, minimo, maximo

# Estatísticas para GRASP
media_tempo_grasp, mediana_tempo_grasp, moda_tempo_grasp, desvio_padrao_tempo_grasp, min_tempo_grasp, max_tempo_grasp = estatisticas(df_grasp, 'tempo_execucao')
media_distancia_grasp, mediana_distancia_grasp, moda_distancia_grasp, desvio_padrao_distancia_grasp, min_distancia_grasp, max_distancia_grasp = estatisticas(df_grasp, 'distancia_total')

# Estatísticas para ACO
media_tempo_aco, mediana_tempo_aco, moda_tempo_aco, desvio_padrao_tempo_aco, min_tempo_aco, max_tempo_aco = estatisticas(df_aco, 'tempo_execucao')
media_distancia_aco, mediana_distancia_aco, moda_distancia_aco, desvio_padrao_distancia_aco, min_distancia_aco, max_distancia_aco = estatisticas(df_aco, 'distancia_total')

print(f"GRASP - Tempo de Execução: Média={media_tempo_grasp}, Mediana={mediana_tempo_grasp}, Moda={moda_tempo_grasp}, Desvio Padrão={desvio_padrao_tempo_grasp}, Minimo={min_tempo_grasp}, Máximo={max_tempo_grasp}")
print(f"GRASP - Distância Total: Média={media_distancia_grasp}, Mediana={mediana_distancia_grasp}, Moda={moda_distancia_grasp}, Desvio Padrão={desvio_padrao_distancia_grasp}, Minimo={min_distancia_grasp}, Máximo={max_distancia_grasp}")

print(f"ACO - Tempo de Execução: Média={media_tempo_aco}, Mediana={mediana_tempo_aco}, Moda={moda_tempo_aco}, Desvio Padrão={desvio_padrao_tempo_aco}, Minimo={min_tempo_aco}, Máximo={max_tempo_aco}")
print(f"ACO - Distância Total: Média={media_distancia_aco}, Mediana={mediana_distancia_aco}, Moda={moda_distancia_aco}, Desvio Padrão={desvio_padrao_distancia_aco}, Minimo={min_distancia_aco}, Máximo={max_distancia_aco}")


## Desvio Padrão


In [None]:
# Desvio padrão para ACO
desvio_padrao_tempo_aco = df_aco['tempo_execucao'].std()
desvio_padrao_distancia_aco = df_aco['distancia_total'].std()

print("ACO:")
print(f"Desvio padrão do tempo de execução: {desvio_padrao_tempo_aco}")
print(f"Desvio padrão da distância total: {desvio_padrao_distancia_aco}")

# Desvio padrão para GRASP (assumindo que df_grasp já está definido)
desvio_padrao_tempo_grasp = df_grasp['tempo_execucao'].std()
desvio_padrao_distancia_grasp = df_grasp['distancia_total'].std()

print("\nGRASP:")
print(f"Desvio padrão do tempo de execução: {desvio_padrao_tempo_grasp}")
print(f"Desvio padrão da distância total: {desvio_padrao_distancia_grasp}")


### Ponto de Convergência


In [None]:
# Para ACO
def detectar_convergencia(historico_custos):
    melhorias = np.diff(historico_custos)  # Diferença entre custos consecutivos
    estagnacao = np.where(melhorias <= 0)[0]  # Índices onde não há melhoria
    if len(estagnacao) > 0:
        return estagnacao[0] + 1  # Retorna a primeira iteração de estagnação
    return len(historico_custos)  # Se não houver estagnação, retorna o total de iterações

df_aco['ponto_convergencia'] = df_aco['historico_custos'].apply(detectar_convergencia)
print(df_aco[['ponto_convergencia']])


### Histórico de Custo


In [None]:
# Plotar o histórico de custos para ACO
plt.figure(figsize=(12, 6))
for i, row in df_aco.iterrows():
    plt.plot(row['historico_custos'], label=f'Execução {i+1}')

plt.title('Histórico de Custo ao Longo das Iterações (ACO)')
plt.xlabel('Número da Iteração')
plt.ylabel('Custo')
plt.legend()
plt.grid(True)
plt.show()
