# Correr experimentos
En este archivo está el código para correr los experimentos y escribir los resultados en archivos CSV.
> Los archivos se guardan en la carpeta _resultados_ en formato csv.

In [37]:
import math, subprocess
import pandas as pd
import numpy as np
from IPython.display import display, clear_output

A continuación leemos los datasets en dataframes de Pandas.

La siguiente función sirve para correr el código sobre una instancia ejecutando un método en particular.
- HS1: Heuristica secuencial golosa por grado en G.
- HS2: Heuristica secuencial golosa por grado en H.
- HGV: Heuristica golosa por coloreo de vertices según H.
- HS1B: Heuristica secuencial golosa con búsqueda local golosa por grado en G.
- HS2B: Heuristica secuancial golosa con búsqueda local golosa por grado en H.
- HGA: Heuristica golosa por coloreo de aristas según H.
- TSS: Tabú search utilizando memoria por soluciones y vecindad con operador change y swap.
- TSE: Tabú search utilizando memoria por estructura de solución y vecindad con operador change y swap.
- TSSA: Tabú search utilizando memoria por soluciones y vecindad por coloreo en H. 
- TSSB: Tabú search utilizando memoria por soluciones, vecindad con operador change y swap y partiendo de una solucion inicial menos óptima.
- TSEB:Tabú search utilizando memoria por estructura de solución, vecindad con operador change y swap y partiendo de una solucion inicial menos óptima.
- TSSAB: Tabú search utilizando memoria por soluciones, vecindad por coloreo en H y partiendo de una solucion inicial menos óptima. 

In [38]:
def leer_instancia(path_instancia):
    with open(path_instancia, "r") as f:
        return f.read();
#generamos otro dataframe con datos equitativos de la cantidad de vertices, seleccionando de forma aleatoria de los datos generados para instancias-costo
def seleccionEquitativaDeDatos(df,k, cantV,j):
    df_array=[];
    df_array.append(df[df["cantidad_vertices"]==10].sample(n=25))#porque tiene solo 25
    
    for cantVertices in range(20,cantV+1,j):
        df_array.append(df[df["cantidad_vertices"]==cantVertices].sample(n=k));
    
    df_instanciasRandom_costo = pd.concat(df_array).reset_index();
    return df_instanciasRandom_costo

df_peor_caso_hs1 = pd.read_csv("instancias/peor-caso-hs1/indice.csv");
df_peor_caso_hs2 = pd.read_csv("instancias/peor-caso-hs2/indice.csv");
df_mejor_caso_hs1 = pd.read_csv("instancias/mejor-caso-hs1/indice.csv");
df_mejor_caso_hs2 = pd.read_csv("instancias/mejor-caso-hs2/indice.csv");
df_instancias_calidad = pd.read_csv("instancias/instancias-calidad/indice.csv");
df_instancias_costo = pd.read_csv("instancias/instancias-costo/indice.csv");

## Corremos los experimentos
Vamos a guardar una tabla con las ejecuciones y sus respectivos tiempos.

In [39]:
def correr_experimento(metodo,T,pVecinos,I2,I1, archivo_instancia):
    # Leer archivo de la instancia.
    instancia = leer_instancia(archivo_instancia)
    # Crear proceso para ejecutar el codigo.
    
    if(metodo[0]=='T'):
        command = '../pcmi ' + '"' + metodo + '"' + ' ' + str(T) + ' ' + str(pVecinos) + ' ' + str(I2) + ' ' + str(I1)
        res = (subprocess.getstatusoutput(command + ' < ' + archivo_instancia))[1].splitlines()
        tiempo_de_ejecucion = float(res[0]);
        impacto= int(res[1]);
    
    else :
        process = subprocess.Popen(["../pcmi", metodo], stderr=subprocess.PIPE, stdout=subprocess.PIPE, stdin=subprocess.PIPE, universal_newlines = True)
        # Poner la instancia en la entrada estandar.
        process.stdin.write(instancia)
        process.stdin.flush()
        # Correr experimento.
        exit_code = process.wait();
        # Verificar que el proceso no fallo.
        if (exit_code != 0): raise(F"Hubo un error en la experimentacion para el algoritmo: {metodo} con la instancia {archivo_instancia}.")
        # Leer salida de STDERR con los tiempos de ejecucion de cada metodo.
        tiempo_de_ejecucion = float(process.stderr.read());
        impacto = int(process.stdout.read().split('\n')[0]);

        process.stdin.close();
        process.stdout.close();
        process.stderr.close();
    
    return [tiempo_de_ejecucion,impacto];

In [40]:
experimentos = [];

## Experimento 1: Complejidad y calidad de Heuristicas secuenciales

Correr la Heuristica secuencial en sus variantes HS1 y HS2 en sus primeras [A DEFINIR] instancias con sus peores casos respectivamente e instancias generadas aleatoriamente para medir sus costos. 

In [34]:
#seleccionamos los datos de manera equitativa por cantidad de vertices
df_instanciasRandom_costo = seleccionEquitativaDeDatos(df_instancias_costo,2,110,2);

for n in range(0, df_peor_caso_hs1.shape[0]):    
    fila_n = df_peor_caso_hs1.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HS1",fila_n["archivo"]]);

for n in range(0, df_mejor_caso_hs1.shape[0]):    
    fila_n = df_mejor_caso_hs1.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HS1",fila_n["archivo"]]);    

for n in range(0, df_instanciasRandom_costo.shape[0]):
    fila_n = df_instanciasRandom_costo.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HS1",fila_n["archivo"]]);

for n in range(0, df_peor_caso_hs2.shape[0]):   
    fila_n = df_peor_caso_hs2.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HS2",fila_n["archivo"]]);

for n in range(0, df_mejor_caso_hs2.shape[0]):    
    fila_n = df_mejor_caso_hs2.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HS2",fila_n["archivo"]]);    

for n in range(0, df_instanciasRandom_costo.shape[0]):
    fila_n = df_instanciasRandom_costo.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HS2",fila_n["archivo"]]);


## Experimento 2 : Complejidad y calidad de Heuristica golosa de coloreo según H
Correr HGV para su peor caso y para las instancias generadas aleatoriamente para medir los costos 

In [35]:
#seleccionamos los datos de manera equitativa por cantidad de vertices
df_instanciasRandom_costo = seleccionEquitativaDeDatos(df_instancias_costo,1,110,2);

for n in range(0, df_instanciasRandom_costo.shape[0]):
    fila_n = df_instanciasRandom_costo.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HGV",fila_n["archivo"]]);


## Experimento 3 : Impacto del método utilizado para generar vecinos en Tabú search
Correr TSS y TSSA para las instancias de calidad y costo.

In [49]:
#seleccionamos los datos de manera equitativa por cantidad de vertices
df_instanciasRandom_costo = seleccionEquitativaDeDatos(df_instancias_costo,5,60,2);

for n in range(0, df_instancias_calidad.shape[0]):
    fila_n = df_instancias_calidad.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSS", 1000, 30, 100, 1000,fila_n["archivo"]]);

for n in range(0, df_instanciasRandom_costo.shape[0]):
    fila_n = df_instanciasRandom_costo.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSS", 1000, 30, 100, 1000,fila_n["archivo"]]);

for n in range(0, df_instancias_calidad.shape[0]):
    fila_n = df_instancias_calidad.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSSA", 1000, 30, 100, 1000,fila_n["archivo"]]);

for n in range(0, df_instanciasRandom_costo.shape[0]):
    fila_n = df_instanciasRandom_costo.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSSA", 1000, 30, 100, 1000,fila_n["archivo"]]);


## Experimento 4: Impacto de la solución inicial en Tabú search
Correr TSSB y TSSAB para las instancias de csoto y calidad.

In [8]:
#seleccionamos los datos de manera equitativa por cantidad de vertices
df_instanciasRandom_costo = seleccionEquitativaDeDatos(df_instancias_costo,5,60,2);

for n in range(0, df_instancias_calidad.shape[0]):
    fila_n = df_instancias_calidad.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSSAB", 1000, 30, 100, 1000,fila_n["archivo"]]);

for n in range(0, df_instanciasRandom_costo.shape[0]):
    fila_n = df_instanciasRandom_costo.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSSAB", 1000, 30, 100, 1000,fila_n["archivo"]]);

for n in range(0, df_instancias_calidad.shape[0]):
    fila_n = df_instancias_calidad.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSSB", 1000, 30, 100, 1000,fila_n["archivo"]]);

for n in range(0, df_instanciasRandom_costo.shape[0]):
    fila_n = df_instanciasRandom_costo.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSSB", 1000, 30, 100, 1000,fila_n["archivo"]]);


## Experimento 5 : Impacto del tipo de memoria utilizada en Tabú search
Correr TSE para las instancias de costo y calidad

In [61]:
#seleccionamos los datos de manera equitativa por cantidad de vertices
df_instanciasRandom_costo = seleccionEquitativaDeDatos(df_instancias_costo,5,60,2);

for n in range(0, df_instancias_calidad.shape[0]):
    fila_n = df_instancias_calidad.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSE", 1000, 30, 100, 1000,fila_n["archivo"]]);

for n in range(0, df_instanciasRandom_costo.shape[0]):
    fila_n = df_instanciasRandom_costo.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSE", 1000, 30, 100, 1000,fila_n["archivo"]]);


## Experimento 6 : Configuración de los parametros de Tabú search
Correr TSS, TSE y TSSA para las instancias de costo variando sus parametros.

In [41]:
#seleccionamos los datos de manera equitativa por cantidad de vertices
df_instanciasRandom_costo = seleccionEquitativaDeDatos(df_instancias_costo,1,30,2);

for n in range(0, df_instanciasRandom_costo.shape[0]):
    for t in range(100, 6101,1000):
        for p in range(10, 101, 20):
            fila_n = df_instanciasRandom_costo.iloc[n];
            experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSS", t, p, 500, 1000,fila_n["archivo"]]);
            experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSSA", t, p, 500, 1000,fila_n["archivo"]]);

for n in range(0, df_instanciasRandom_costo.shape[0]):
    for itsm in range(0,1001,200):
        for it in range(0,5001,1000):
            fila_n = df_instanciasRandom_costo.iloc[n];
            experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSS", 1000, 30, itsm, it,fila_n["archivo"]]);
            experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSSA", 1000, 30, itsm, it,fila_n["archivo"]]);

for n in range(0, df_instancias_calidad.shape[0]):
    for t in range(100, 6101,1000):
        for p in range(10, 101, 20):
            fila_n = df_instancias_calidad.iloc[n];
            experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSS", t, p, 500, 1000,fila_n["archivo"]]);
            experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSSA", t, p, 500, 1000,fila_n["archivo"]]);

for n in range(0, df_instancias_calidad.shape[0]):
    for itsm in range(0,1001,200):
        for it in range(0,5001,1000):
            fila_n = df_instancias_calidad.iloc[n];
            experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSS", 1000, 30, itsm, it,fila_n["archivo"]]);
            experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSSA", 1000, 30, itsm, it,fila_n["archivo"]]);

## Experimento 7 : Contraste entre los distintos métodos para resolver el problema
Correr TSS, TSE y TSSA para contrastar con los demás métodos

In [None]:
#seleccionamos los datos de manera equitativa por cantidad de vertices
df_instanciasRandom_costo = seleccionEquitativaDeDatos(df_instancias_costo,5,60,2);

#cuando averiguemos la mejor configuracion hay que ponerla en este exp
for n in range(0, df_instancias_calidad.shape[0]):
    fila_n = df_instancias_calidad.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSS",2000,30,100,2500,fila_n["archivo"]]);
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSE",2000,30,100,2500,fila_n["archivo"]]);
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSSA",2000,30,100,2500,fila_n["archivo"]]);
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HS1",fila_n["archivo"]]);
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HS2",fila_n["archivo"]]);
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HGV",fila_n["archivo"]]);

for n in range(0, df_instanciasRandom_costo.shape[0]):
    fila_n = df_instanciasRandom_costo.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSS",2000,30,100,2500,fila_n["archivo"]]);
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSE",2000,30,100,2500,fila_n["archivo"]]);
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "TSSA",2000,30,100,2500,fila_n["archivo"]]);


## Experimento 8 : Contraste  entre búsqueda local golosa y tabú search 
Correr HS1B y HS2B sobre las instancias de costo y calidad para contrastar con TSSB y TSSAB.

In [12]:
#seleccionamos los datos de manera equitativa por cantidad de vertices
df_instanciasRandom_costo = seleccionEquitativaDeDatos(df_instancias_costo,5,60,2);

for n in range(0, df_instancias_calidad.shape[0]):
    fila_n = df_instancias_calidad.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HS1B",fila_n["archivo"]]);

for n in range(0, df_instanciasRandom_costo.shape[0]):
    fila_n = df_instanciasRandom_costo.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HS1B",fila_n["archivo"]]);

for n in range(0, df_instancias_calidad.shape[0]):
    fila_n = df_instancias_calidad.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HS2B",fila_n["archivo"]]);

for n in range(0, df_instanciasRandom_costo.shape[0]):
    fila_n = df_instanciasRandom_costo.iloc[n];
    experimentos.append([fila_n["dataset"], fila_n["cantidad_vertices"], fila_n["impacto_esperado"], "HS2B",fila_n["archivo"]]);


## Ejecutar los experimentos y guardar los resultados en un archivo CSV.
Este paso puede tardar unos minutos hasta terminar de ejecutarse.

In [43]:
columnas = ["dataset", "cantidad_vertices", "impacto_esperado","impacto_obtenido","gap","metodo","tamano_memoria","%_de_vecindad","iteraciones_sin_mejora","iteraciones", "tiempo"];
filas = [];
numero = 1
T = 5 # Numero de veces que se ejecuta cada experimento (para mayor fidelidad del tiempo).
for experimento in experimentos:
    # Voy mostrando que experimento se esta ejecutando.
    clear_output(wait=True)
    display('Experimento: ' + str(numero) + "/" + str(len(experimentos)))
    numero += 1
    
    # Ejecutamos el experimento T veces y obtenemos la mediana del impacto y de los tiempos.
    tiempos = []
    impactos = []
    gaps = []
    for i in range(0, T):
        if(experimento[3][0]=='T'):
            res = correr_experimento(experimento[3], experimento[4], experimento[5], experimento[6], experimento[7], experimento[8]);
            impactos.append(res[1]);
            if(int(experimento[2])!=0):
                gaps.append(100 - res[1]*100/int(experimento[2]));#dada la randomizacion tomamos la mediana de los gaps en los metodos de tabu
            else:
                gaps.append(0);
        else:
            res= correr_experimento(experimento[3],-1,-1,-1,-1, experimento[4]);
            impactos = [res[1]];
            if(int(experimento[2])!=0):
                gaps = 100 - res[1]*100/int(experimento[2]);# como no va a variar el impacto en los secuenciales 
            else:
                gaps = 0 #sabemos que nuestro algoritmo no va a dar más porque tenemos un verificador de que el coloreo sea valido, 
                         #al ser el impacto esperado cero entonces, no es posible dar más que eso por lo tanto nuestra validacion va a activarse
            
        tiempos.append(res[0]);
        
    tiempo = np.median(tiempos);
    impacto = np.median(impactos);
    gap = np.median(gaps);
    if(experimento[3][0]=='T'):
        filas.append([experimento[0], experimento[1], experimento[2],impacto,gap,experimento[3], experimento[4], experimento[5], experimento[6], experimento[7],tiempo]);
    else:
        filas.append([experimento[0], experimento[1], experimento[2],impacto,gap,experimento[3],'-','-','-','-', tiempo]);
df_resultado = pd.DataFrame(filas, columns=columnas);
df_resultado.to_csv("resultados/resultados.csv", index=False, header=True);

'Experimento: 6248/6248'

In [42]:
len(experimentos)

6248