## Relatório de comparação de desempenho de algoritmos para solução do problema do caixeiro viajante

### Introdução
Neste relatório, discutirei e compararei os resultados obtidos para três implementações diferentes do problema do caixeiro viajante e, em uma delas, farei também a comparação de desempenho com três abordagens diferentes, sendo elas, execução serial, execução paralelizada e execução em hardware especializado ou GPU.

### Heurística
O primeiro método abordado será o que leva em consideração uma heurística para resolver o problema.
A heuristica desenvolvida é a seguinte:

* A partida se da na cidade 0;
* Para cada cidade que não seja a atual, encontrar a que fica a menor distância desta;
* Tornar a cidade escolhida a atual cidade;
* Repetir a partir da etapa 2 até que todas as cidades tenham sido visitadas;

Portanto, nossa heurística parte do pressuposto que partiremos de uma única cidade e que buscaremos sempre o a cidade mais próxima para prosseguirmos no caminho.

<img src='heuristico/final_performance_long.png'>

Os testes de tempo são promissores já que, até mesmo para um número elevado de cidades, o tempo decorrido é extremamente pequeno.

Contudo, como nossa heurística não é perfeita, as distâncias finais não se aproximam nem um pouco das melhores distâncias possíveis e, devido a natureza do algoritmo, temos um tempo quadrático do tipo O(n²) em execução.

### Busca exaustiva
O segundo método utilizado foi a busca exaustiva que, em resumo, busca a melhor solução global, ou seja, a solução ótima que descreve o melhor caminho possível dado um vetor de cidades, partindo que qualquer cidade no início da execução.

O gráfico de tempos de execução não foi incluido devido aos tempos de execução serem extremamente altos já que, para encontrarmos a solução global dado um vetor de cidades, é necessário esperarmos um tempo equivalente a O(n!) sendo n o número de cidades no vetor.

O ponto negativo desta implementação é esse, apesar de termos a melhor solução possível que é desejável, perderemos muito tempo de execução.

### Busca local (serial, paralela e GPU)
A busca local é um método que tenta alcançar resultados bons a nível local gastando tempos razoalmente pequenos em relação a entrada.
Dado um vetor de cidades de tamanho N, iteramos N * 10 vezes em uma cópia desse vetor embaralhado e encontramos a melhor permutação dos itens dele em profundidade única. Após todas a iterações, comparamos os resultados de cada uma e escolhemos a melhor entre estas. Por melhor entende-se a permutação com a menor distância para o caminho final dado pelo vetor embaralhado e já permutado.
Para essa solução, fora implementado três versões diferentes, uma trivial rodando serialmente, uma conversão desta para utilizar multiplos cores de CPU, e uma que roda em CUDA em uma GPU.

<img src="busca-local/final_performance.png">

Algo interessante pode ser visto no gráfico de comparação acima. Óbviamente o código serial é o pior de todos em comparação, contudo, o paralelizado supera o em Cuda ligeiramente. Contudo, caso observarmos mais a fundo, é possível ver uma tendência de crescimento maior nos testes paralelos em comparação aos em Cuda.
Aumentando a granularidade dos inputs de teste e aumentando o número de cidades máximo, temos a seguinte comparação.

<img src="busca-local/final_performance_long.png">

Devido a natureza multicores da GPU, para grandes volumes de dados, ela acaba vencendo os cores de um processador comum.

### Perguntas do roteiro

* Se você pudesse escolher um método para resolver este problema, qual seria?

A escolha de um método neste caso se dá pelas condições para a solução.
Caso o volume de dados fosse pequeno e a acurácia não fosse tão desejável, eu escolheria o método heurístico.
Caso o volume de dados fosse pequeno e a acurácia fosse desejável, eu escolheria a busca local paralelizada.
Caso o volume de dados fosse grande, eu escolheria a versão em GPU.

* Fizemos implementações paralelas da busca local. Valeria a pena gastar dinheiro comprando uma CPU com mais cores ou uma GPU potente?

Igualmente a questão anterior, voltaria a pensar nas condições de solução.
Contudo, até certo ponto no volume de dados, mesmo que a implementação em GPU seja superior em questão de tempo, o preço das CPUs é extremamente inferior comparado as GPUs. Assim, eu escolheria investir em CPUs para volumes de dados não tão exorbitantes.

* Vale a pena esperar pelo resultado da busca exaustiva?

A busca exaustiva seria aceita em casos particulares onde é desejável saber com 100% de precisão o melhor caminho a se seguir. Contudo, o tempo necessário para que isso ocorra é enorme.
Sendo assim, só é justo esperarmos pelo tempo de execução para volumes pequenos de dados, em outros casos, o busca exaustiva nos daria resultados não tão diferentes do que diversas execuções da busca local sendo ela paralelizada ou não.