# Relatório da Fase de Multiprocessamento (5 Execuções)

**Equipa CIFO**

**Data:** 15 de maio de 2025

## 1. Introdução

Esta secção do projeto foca-se na avaliação do desempenho dos algoritmos de otimização (Hill Climbing, Simulated Annealing e quatro configurações de Algoritmos Genéticos) quando executados múltiplas vezes em paralelo. O objetivo principal desta fase foi obter dados estatisticamente mais robustos sobre a eficácia e eficiência de cada abordagem, executando cada algoritmo 5 vezes. A utilização de multiprocessamento permitiu realizar estas execuções concorrentes, otimizando o tempo total de experimentação.

Os resultados desta fase são cruciais para identificar os algoritmos e configurações mais promissores, que serão posteriormente submetidos a um número mais elevado de execuções (30 runs) para uma análise de desempenho ainda mais aprofundada.


## 2. Metodologia Experimental

### 2.1. Algoritmos Avaliados

Os seguintes algoritmos e configurações foram avaliados nesta fase:

1.  **Hill Climbing (HC)**: Um algoritmo de busca local iterativo.
2.  **Simulated Annealing (SA)**: Um algoritmo probabilístico inspirado no processo de recozimento em metalurgia.
3.  **Algoritmos Genéticos (AG)**: Quatro configurações distintas foram testadas, variando operadores de mutação, cruzamento e seleção:
    *   **GA_Config_1_SwapConst1PtPreferVTournVarK**: Mutação Swap Constrained, Cruzamento One-Point Prefer Valid, Seleção Tournament Variable K (k=3).
    *   **GA_Config_2_TargetExchUnifPreferVRanking**: Mutação Targeted Player Exchange, Cruzamento Uniform Prefer Valid, Seleção Ranking.
    *   **GA_Config_3_ShuffleWithin1PtPreferVBoltzmann**: Mutação Shuffle Within Team Constrained, Cruzamento One-Point Prefer Valid, Seleção Boltzmann.
    *   **GA_Config_4_TargetExchUnifPreferVTournVarK_k5**: Mutação Targeted Player Exchange, Cruzamento Uniform Prefer Valid, Seleção Tournament Variable K (k=5).

### 2.2. Parâmetros de Execução

*   **Número de Execuções por Algoritmo**: Cada algoritmo/configuração foi executado 5 vezes.
*   **Paralelização**: As execuções foram realizadas em paralelo utilizando o módulo `multiprocessing` do Python.
*   **Métricas Coletadas**: Melhor Fitness Geral, Fitness Média, Desvio Padrão da Fitness, Tempo Médio de Execução.
*   **Ambiente**: Sandbox fornecido, dados de `players.csv`.

### 2.3. Geração de População e Validade das Soluções

A geração da população inicial e a manutenção da validade das soluções seguiram as restrições definidas (estrutura das equipas, orçamento máximo, etc.).


## 3. Resultados e Discussão

Após a execução do script `main_script_mp.py` para 5 execuções de cada algoritmo, os resultados foram compilados. Vamos carregar e exibir o sumário dos resultados.


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os

# Definir o estilo dos plots
plt.style.use('seaborn-v0_8-whitegrid')

results_file_path = "/home/ubuntu/CIFO_EXTENDED_Project/images_mp/run_5_results/all_algorithms_summary_mp_5runs.csv"
output_image_dir = "/home/ubuntu/CIFO_EXTENDED_Project/images_mp/run_5_results/notebook_generated/"

# Criar diretório de saída para imagens se não existir
os.makedirs(output_image_dir, exist_ok=True)

try:
    df_results_5_runs = pd.read_csv(results_file_path)
    print("Sumário dos Resultados (5 Execuções):")
    display(df_results_5_runs)
except FileNotFoundError:
    print(f"Erro: O ficheiro {results_file_path} não foi encontrado.")
except Exception as e:
    print(f"Erro ao ler o ficheiro de resultados: {e}")


### 3.1. Análise da Qualidade da Solução (Fitness)

Observa-se um resultado notável: todos os algoritmos/configurações (Simulated Annealing, GA_Config_1, GA_Config_2, GA_Config_3, e GA_Config_4) conseguiram alcançar o mesmo valor de **Melhor Fitness Geral (Overall Best Fitness)** de aproximadamente **0.057143**. O Hill Climbing, embora tenha atingido este valor em algumas execuções, apresentou uma **Fitness Média** ligeiramente superior (0.0671), indicando menor consistência em atingir a melhor solução encontrada pelos outros.

O **Simulated Annealing** e a configuração **GA_Config_4_TargetExchUnifPreferVTournVarK_k5** destacaram-se pela consistência, ambos apresentando um **Desvio Padrão da Fitness** de **0.0**. Isto significa que, em todas as 5 execuções, estes dois algoritmos convergiram para o mesmo valor ótimo de fitness. As outras configurações de AG (Config_1, Config_2, Config_3) e o HC mostraram maior variabilidade nos resultados de fitness entre as execuções.

A **Fitness Média** da GA_Config_4 (0.057143) foi a melhor entre os AGs, igualando o SA. As GA_Config_1, GA_Config_2 e GA_Config_3 apresentaram fitness médias piores (0.0770, 0.0890, e 0.0936, respetivamente).


In [None]:
if 'df_results_5_runs' in locals():
    # Gráfico de Barras: Fitness Média
    plt.figure(figsize=(12, 7))
    sns.barplot(x='Mean Fitness', y='Algorithm', data=df_results_5_runs, palette='viridis')
    plt.title('Fitness Média por Algoritmo (5 Execuções)')
    plt.xlabel('Fitness Média (Quanto menor, melhor)')
    plt.ylabel('Algoritmo')
    plt.tight_layout()
    mean_fitness_path = os.path.join(output_image_dir, 'mp_5runs_mean_fitness.png')
    plt.savefig(mean_fitness_path)
    plt.show()
    print(f"Gráfico de Fitness Média guardado em: {mean_fitness_path}")
    
    # Gráfico de Barras: Melhor Fitness Geral
    plt.figure(figsize=(12, 7))
    sns.barplot(x='Overall Best Fitness', y='Algorithm', data=df_results_5_runs, palette='mako')
    plt.title('Melhor Fitness Geral por Algoritmo (5 Execuções)')
    plt.xlabel('Melhor Fitness Geral (Quanto menor, melhor)')
    plt.ylabel('Algoritmo')
    plt.tight_layout()
    overall_best_fitness_path = os.path.join(output_image_dir, 'mp_5runs_overall_best_fitness.png')
    plt.savefig(overall_best_fitness_path)
    plt.show()
    print(f"Gráfico de Melhor Fitness Geral guardado em: {overall_best_fitness_path}")
    
    # Gráfico de Barras: Desvio Padrão da Fitness
    plt.figure(figsize=(12, 7))
    sns.barplot(x='Std Dev Fitness', y='Algorithm', data=df_results_5_runs, palette='crest')
    plt.title('Desvio Padrão da Fitness por Algoritmo (5 Execuções)')
    plt.xlabel('Desvio Padrão da Fitness (Quanto menor, mais consistente)')
    plt.ylabel('Algoritmo')
    plt.tight_layout()
    std_dev_fitness_path = os.path.join(output_image_dir, 'mp_5runs_std_dev_fitness.png')
    plt.savefig(std_dev_fitness_path)
    plt.show()
    print(f"Gráfico de Desvio Padrão da Fitness guardado em: {std_dev_fitness_path}")
else:
    print("DataFrame 'df_results_5_runs' não encontrado. Execute a célula anterior para carregar os dados.")


### 3.2. Análise da Eficiência (Tempo de Execução)

No que diz respeito ao **Tempo Médio de Execução**, as diferenças são significativas:

*   **Hill Climbing** foi, de longe, o mais rápido, com um tempo médio de aproximadamente **0.47 segundos** por execução.
*   Entre os Algoritmos Genéticos, a **GA_Config_1_SwapConst1PtPreferVTournVarK** foi a mais rápida, com cerca de **6.05 segundos**.
*   A **GA_Config_4_TargetExchUnifPreferVTournVarK_k5**, que demonstrou excelente consistência e qualidade de solução, teve um tempo médio de **8.19 segundos**.
*   O **Simulated Annealing**, apesar da sua ótima performance em fitness e consistência, foi consideravelmente mais lento, com uma média de **17.60 segundos**.
*   As configurações **GA_Config_2** e **GA_Config_3** foram as mais lentas, com tempos médios de execução a rondar os **61-62 segundos**, o que as torna menos atrativas apesar de terem alcançado a melhor fitness geral em algumas execuções.


In [None]:
if 'df_results_5_runs' in locals():
    # Gráfico de Barras: Tempo Médio de Execução
    plt.figure(figsize=(12, 7))
    sns.barplot(x='Mean Exec Time (s)', y='Algorithm', data=df_results_5_runs, palette='rocket')
    plt.title('Tempo Médio de Execução por Algoritmo (5 Execuções)')
    plt.xlabel('Tempo Médio de Execução (s)')
    plt.ylabel('Algoritmo')
    plt.tight_layout()
    mean_exec_time_path = os.path.join(output_image_dir, 'mp_5runs_mean_exec_time.png')
    plt.savefig(mean_exec_time_path)
    plt.show()
    print(f"Gráfico de Tempo Médio de Execução guardado em: {mean_exec_time_path}")
else:
    print("DataFrame 'df_results_5_runs' não encontrado. Execute a célula anterior para carregar os dados.")


### 3.3. Observações Adicionais

*   A capacidade de todos os algoritmos (exceto, em média, o HC) de encontrar a mesma melhor fitness sugere que, para 5 execuções e os parâmetros atuais, este pode ser um ótimo local robusto ou mesmo o ótimo global para o problema com os dados fornecidos.
*   A consistência (baixo desvio padrão da fitness) é uma característica desejável, e o SA e a GA_Config_4 foram exemplares neste aspeto.
*   O compromisso entre a qualidade da solução, a consistência e o tempo de execução é um fator chave na seleção dos algoritmos para testes mais extensivos.

(Nota: Os gráficos de convergência individuais para a melhor execução de cada algoritmo foram gerados pelo script `main_script_mp.py` e guardados em `/home/ubuntu/CIFO_EXTENDED_Project/images_mp/run_5_results/`. Para incluí-los diretamente aqui, precisaríamos do código que os gera ou carregar os ficheiros de imagem.)


## 4. Conclusões Preliminares e Próximos Passos

Com base nos resultados de 5 execuções em multiprocessamento:

*   O **Hill Climbing** é extremamente rápido, mas menos consistente em encontrar a melhor solução em comparação com os outros.
*   O **Simulated Annealing** encontra consistentemente a melhor solução, mas com um custo de tempo de execução moderado.
*   A configuração de Algoritmo Genético **GA_Config_4_TargetExchUnifPreferVTournVarK_k5** emerge como uma candidata muito forte, pois igualou o SA e o HC na melhor fitness geral, demonstrou consistência perfeita (std dev = 0) e teve um tempo de execução significativamente mais baixo que o SA e as outras duas configurações de AG mais lentas (Config_2 e Config_3).
*   A **GA_Config_1_SwapConst1PtPreferVTournVarK** também é notável pela sua rapidez entre os AGs, embora com menor consistência na fitness média.

Estes resultados fornecem uma base sólida para a próxima fase do projeto: a seleção dos algoritmos mais promissores para serem executados 30 vezes. A análise detalhada destes resultados permitirá refinar a escolha dos algoritmos e dos seus parâmetros para investigações futuras.
