# Problema

Para el desarrollo de este proyecto se ha elegido el problema del vendedor viajero, ya que de esta manera se podrá  hacer un análisis que compare los algoritmos probabilísticos genético y Simulated Annealing y así determinar cuál de estos se ejecuta más rapidamente y poder averiguar cuál de las soluciones es la de mayor calidad. Para esto se utilizarán 17 localidades de nuestro país y se explicará la configuración de los parámetros para cada algoritmo.

El hardware se ha considerado de los principales limitantes de este proyecto, puesto que de este depende la cantidad de pruebas que se pueden hacer en un tiempo dterminado, ya que entre mayor sea la cantidad de pruebas se va a requerir una mayor capacidad de almacenamiento y velocidad en el procesado.

# Hipótesis

Se espera que en terminos de calidad de la solucion el Algoritmo Genético sea mejor ya que aumenta la presición de esta ya que guarda otras posibles soluciones muy similares, no obstante esto último sacrifica valioso tiempo por lo que se espera que el Algoritmo de Simulated Annealing sea superior en términos de velocidad.

# Metodología

Para poder hacer la comparación entre ambos algoritmos se planea hacer inicialmente 3 pruebas para cada algoritmo, cambiando únicamente los parámetros de entrada. Se empezará con parámetros altos, posteriormente con parámetros medios y por último bajos. Después de esto se procederá a hacer combinaciones entre estos y así hacer un experimento con una entrada promedio para determinar la eficiencia en términos regulares entre estos dos algoritmos. Los resultados serán puestos en tablas que permitirán una mejor comprensión de los datos para así hacer la comparación con mayor facilidad. Lo que se tomará en cuenta para esta comparación será el tiempo de ejecución y los costos generados según los parámetros dados.

En esta investigación contamos con 2 archivos para realizar pruebas, ambos ubicados en la carpeta 'datos'. El primer archivo es un archivo de ejemplo, que se puede utilizar para realizar pruebas pequeñas y resolver el problema a "fuerza bruta". En este caso utilizamos solamente el archivo con las 17 localidades. La razón detrás de esto se debe a que al ser el primero un archivo muy pequeño, variar los parámetros realmente no genera soluciones diferentes, entonces se decidió que era innecesario realizar múltiples pruebas en este archivo si al final, los parámetros no iban a reflejar cambios en el problema real, que es resolver el problema del vendedor viajero con 17 localidades de Costa Rica.

Para la reproducción de estos experimentos, es necesario saber que los parámetros variarán según el problema, ya que estos algoritmos, tanto el algoritmo genético y simulated annealing, dependen de la configuración de los parámetros. Las pruebas aquí realizadas pretenden mostrar un acercamiento a la mejor solución, no obstante, no significa que solo estas configuraciones produzcan buenos resultados, el truco en este tipo de algoritmos es ir cambiando las variables e ir experimentando.


## Descripcion de pruebas

En todos las pruebas se tendrá 20 repeticiones para el ciclo exterior, ya que no es necesario aumentar este parámetro, porque el comportamiento de los resultados será similar. Este iterador puede ser más grande o más pequeño, eso dependerá de la cantidad de muestras que se quieran analizar.

Los algoritmos que vamos a usar en estas pruebas son:


In [None]:
def simulated_annealing():
    
    temperatura = 1e41
    tasa_enfriamiento = 0.999888
    
    archivo = open('resultados.txt', 'a')
    archivo.write("\n\n"+"Parámetros combinados 3 simulated annealing(temperatura = "+str(temperatura)+", tasa_enfriamiento = "+str(tasa_enfriamiento)+")")
    archivo.close()

    inicio_total = time.perf_counter()
    
    for i in range(0,20):
        inicio = time.perf_counter()
        dominio = DominioTSP('datos/ciudades_cr.csv', 'Liberia')
        sol = optimizar_sa(dominio, temperatura, tasa_enfriamiento)
        final = time.perf_counter()
        tiempo = final-inicio
        print(tiempo)
        print("Iteración:",i,"Recorrido:", DominioTSP.texto(dominio, sol), "Costo:", DominioTSP.fcosto(dominio, sol))

        archivo = open('resultados.txt', 'a')
        archivo.write("\n"+"Iteración: "+str(i)+" Tiempo: "+str(tiempo)+" Costo:"+str(DominioTSP.fcosto(dominio, sol))+" Recorrido: "+ str(DominioTSP.texto(dominio, sol)))
        archivo.close()

    final_total = time.perf_counter()
    duracion_total = final_total-inicio_total
    
    print(duracion_total)

    return 0

def algoritmo_genetico():

    tam_pobl = 1000
    porc_elite = 0.5
    prob_mut = 0.9
    reps = 10000
    
    archivo = open('resultados.txt', 'a')
    archivo.write("\n\n"+"Parámetros combinados 3 algoritmo genético(tam_pobl = "+str(tam_pobl)+", porc_elite = "+str(porc_elite)+", prob_mut = "+str(prob_mut)+", reps = "+str(reps)+")")
    archivo.close()

    inicio_total = time.perf_counter()

    for i in range(0,20):
        inicio = time.perf_counter()
        dominio = DominioAGTSP('datos/ciudades_cr.csv', 'Liberia')
        sol = optimizar_ag(dominio, tam_pobl, porc_elite, prob_mut, reps)
        final = time.perf_counter()
        tiempo = final-inicio
        print(tiempo)
        print("Iteración:",i,"Recorrido:", DominioAGTSP.texto(dominio, sol), "Costo:", DominioAGTSP.fcosto(dominio, sol))

        archivo = open('resultados.txt', 'a')
        archivo.write("\n"+"Iteración: "+str(i)+" Tiempo: "+str(tiempo)+" Costo:"+str(DominioAGTSP.fcosto(dominio, sol))+" Recorrido: "+ str(DominioAGTSP.texto(dominio, sol)))
        archivo.close()

    
    final_total = time.perf_counter()
    duracion_total = final_total-inicio_total

    print(duracion_total)
    return 0

El código mostrado anteriormente nos permitirá probar los algoritmos y guardar los resultados.
En esta investigación, como se aclaró al principio, nos interesa compararlos y una de las mejores formas para comparar el desempeño de cierto algoritmo es su tiempo de ejecución.

Por esta misma razón, se usa la libreria "time". En ambos algoritmos se calcula el tiempo de ejecución de la solución y de la iteración completa, para poder realizar un análisis más detallado.

Ejecutar estas funciones producirán datos para realizar la comparación. Estos datos se almacenan en un archivo txt, incluyendo la siguiente información: 
1. Iteración actual
2. Tiempo de ejecución
3. Costo de la solución
4. Recorrido de la solución

Estos datos se utilizarán luego en el análisis de resultados para comparar ambos algoritmos.

### Nota:

Debido a que las pruebas se realizarán en dos distintos algoritmos con distintas variables los parámetros que manejaremos son distintos para cada algoritmo. 
Las variables del algoritmo simulated_annealing que se alteran son:

#### temperatura
#### tasa_enfriamiento


Las variables del algoritmo algoritmo_genetico que se alteran son:

#### tam_pobl                                  
#### porc_elite                 
#### prob_mut                      
#### reps

Estas variables se deben cambiar cada vez que se vaya a realizar una de las pruebas, para poder almacenar la información correctamente. Si se desea hacer pruebas con parámetros diferentes a los descritos a continuación, estos son los elementos a editar.

### Parámetros

#### Parámetros altos

Para el algoritmo_genetico se usan de parámetros:

tam_pobl = 1000                
porc_elite = 0.9                 
prob_mut = 0.9                                                  
reps = 5000                                                      

Para el algoritmo simulated_annealing se usan de parámetros:

temperatura = 10e32                                    
tasa_enfriamiento = 0.999                 



#### Parámetros medios

Para el algoritmo_genetico se usan de parámetros:

tam_pobl = 500                
porc_elite = 0.5                 
prob_mut = 0.5                                         
reps = 2500                                                          

Para el algoritmo simulated_annealing se usan de parámetros:

temperatura = 5e32                                    
tasa_enfriamiento = 0.5             



#### Parámetros bajos

Para el algoritmo_genetico se usan de parámetros:

tam_pobl = 200                
porc_elite = 0.5                 
prob_mut = 0.1                           
reps = 1000                                    

Para el algoritmo simulated_annealing se usan de parámetros:

temperatura = 1e6                                    
tasa_enfriamiento = 0.111              



### Combinación

Como se especificó anteriormente se procederá a hacer combinaciones entre estos para determinar la eficiencia en términos regulares entre estos dos algoritmos; con diferentes parámetros. 
Para ser específico se procederán a realizar tres combinaciones con distintos parámetros, estos son:

#### Combinación 1

Para el algoritmo_genetico se usan de parámetros:

tam_pobl = 1000                
porc_elite = 0.5                 
prob_mut = 0.5                           
reps = 5000                                    

Para el algoritmo simulated_annealing se usan de parámetros:

temperatura = 10e32                                    
tasa_enfriamiento = 0.999              



#### Combinación 2

Para el algoritmo_genetico se usan de parámetros:

tam_pobl = 1000                
porc_elite = 0.5                 
prob_mut = 0.9                           
reps = 5000                                    

Para el algoritmo simulated_annealing se usan de parámetros:

temperatura = 1e45                                    
tasa_enfriamiento = 0.999              



#### Combinación 3 

Para el algoritmo_genetico se usan de parámetros:

tam_pobl = 1000                
porc_elite = 0.5                 
prob_mut = 0.9                           
reps = 10000                                    

Para el algoritmo simulated_annealing se usan de parámetros:

temperatura = 10e32                                    
tasa_enfriamiento = 0.999888              



### Especificación de equipo para las pruebas

Python 3
Visual Studio Code
Ubuntu 18.04.4 LTS 64 bits
Memoria Ram: 16 GB
Procesador: AMD Ryzen™ 2600 CPU @ 3.6GHz × 6

# Conclusión

Con la ayuda de esta exhaustiva investigación se ha llegado a una conclusión bastante similar a la de la hipótesis que se planteó al inicio de la misma, puesto que se demostró que en términos de rapidez el algoritmo de Simulated Annealing es mejor elección que el algoritmo Genético ya que utilizando los parámetros bajos y en las combinaciones, este tiende a tener un comportamiento más eficiente tomando en cuenta la relación duración-costo. A si mismo como se supuso desde la hipótesis el algoritmo Genético tiende a tener mejores resultados con forme los parámetros sean más altos, esto puesto que con su estilo de cruces dados por selección natural la solución se hace cada vez más precisa.
Por estas razones es que se ha concluido que los parámetros más óptimos para realizar este ejercico serían los siguientes:

#### Algoritmos genéticos:
- Un tamaño de población de 1000
- Un porcentaje de élite del 0.5
- Una probabilidad de mutar del 0.9
- 5000 repeticiones

La razón detrás de estos parámetros es la mencionada anteriormente. Al realizar más repeticiones y tener un tamaño de población más grande, el algoritmo realizar más su proceso y consigue mejores soluciones, por lo que es recomendado que estos sean valores altos.

#### Simulated annealing:
- Temperatura: 10e32
- Tasa de enfriamiento: 0.999989

El por qué de esto, se debe a que a temperaturas altas el algoritmo se comporta mejor y otorga una mejor solución. Esto lo descubrimos realizando las pruebas, ya que cada vez que se aumentaba más y más la temperatura, los resultados mejoraban. Otro de los factores a notar es que entre más cerca de 1 esté la tasa de enfriamiento, también se consiguen mejores soluciones.