# Correr Experimentos

## Includes

In [15]:
%load_ext autoreload
%autoreload 2

import subprocess
import numpy as np
import pandas as pd
from IPython.display import display, clear_output

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


In [3]:
!cd ../src && make

make: 'jt' is up to date.


In [4]:
BIN = "../src/jt"
def run(metodo: str, archivo: str) -> float:
    completed_process = subprocess.run([BIN, metodo, archivo], capture_output=True)
    
    completed_process.check_returncode()
    return float(completed_process.stderr)

In [5]:
run("DP", "../src/input/ejemplo")

0.004162

In [6]:
df_fuerza_bruta = pd.read_csv("instancias/fuerza-bruta/indice.csv")
df_mejor_caso_bt = pd.read_csv("instancias/mejor-caso-bt/indice.csv")
df_peor_caso_bt = pd.read_csv("instancias/peor-caso-bt/indice.csv")
df_baja_densidad = pd.read_csv("instancias/baja-densidad/indice.csv")
df_alta_densidad = pd.read_csv("instancias/alta-densidad/indice.csv")
df_muchos_productos = pd.read_csv("instancias/muchos-productos/indice.csv")

experimentos = []

##  Experimento 1: Complejidad de Fuerza bruta

In [7]:
METODO = "BF"
for _, row in df_fuerza_bruta.iterrows():
    experimentos.append({
        "dataset" : row["dataset"],
        "archivo" : row["filename"],
        "metodo"  : METODO,
        "n"       : row["n"],
        "R"       : row["R"],
    })

## Experimento 2: Complejidad backtracking

Mejor y peor caso con ambas podas:

In [8]:
METODO = "BT"
for _, row in df_mejor_caso_bt.iterrows():
    experimentos.append({
        "dataset" : row["dataset"],
        "archivo" : row["filename"],
        "metodo"  : METODO,
        "n"       : row["n"],
        "R"       : row["R"],
    })

for _, row in df_peor_caso_bt.iterrows():
    experimentos.append({
        "dataset" : row["dataset"],
        "archivo" : row["filename"],
        "metodo"  : METODO,
        "n"       : row["n"],
        "R"       : row["R"],
    })

## Experiemento 3: Comparación de podas en backtracking

Usando los datasets de densidad alta y baja comparamos qué tanto mejoran el rendimiento del algoritmo las podas (BT, BT-F, BT-O).

In [9]:
for _, row in df_baja_densidad.iterrows():
    experimentos.append({
        "dataset" : row["dataset"],
        "archivo" : row["filename"],
        "metodo"  : "BT",
        "n"       : row["n"],
        "R"       : row["R"],
    })
    experimentos.append({
        "dataset" : row["dataset"],
        "archivo" : row["filename"],
        "metodo"  : "BT-F",
        "n"       : row["n"],
        "R"       : row["R"],
    })
    experimentos.append({
        "dataset" : row["dataset"],
        "archivo" : row["filename"],
        "metodo"  : "BT-O",
        "n"       : row["n"],
        "R"       : row["R"],
    })

In [10]:
for _, row in df_alta_densidad.iterrows():
    experimentos.append({
        "dataset" : row["dataset"],
        "archivo" : row["filename"],
        "metodo"  : "BT",
        "n"       : row["n"],
        "R"       : row["R"],
    })
    experimentos.append({
        "dataset" : row["dataset"],
        "archivo" : row["filename"],
        "metodo"  : "BT-F",
        "n"       : row["n"],
        "R"       : row["R"],
    })
    experimentos.append({
        "dataset" : row["dataset"],
        "archivo" : row["filename"],
        "metodo"  : "BT-O",
        "n"       : row["n"],
        "R"       : row["R"],
    })

## Experimento 4: Comparación programación dinámica con distintas densidades

In [11]:
METODO = "DP"
for _, row in df_baja_densidad.iterrows():
    experimentos.append({
        "dataset" : row["dataset"],
        "archivo" : row["filename"],
        "metodo"  : METODO,
        "n"       : row["n"],
        "R"       : row["R"],
    })
for _, row in df_alta_densidad.iterrows():
    experimentos.append({
        "dataset" : row["dataset"],
        "archivo" : row["filename"],
        "metodo"  : METODO,
        "n"       : row["n"],
        "R"       : row["R"],
    })

## Experimento 5: Programción dinámica con muchos productos

In [12]:
METODO = "DP"
for _, row in df_muchos_productos.iterrows():
    experimentos.append({
        "dataset" : row["dataset"],
        "archivo" : row["filename"],
        "metodo"  : METODO,
        "n"       : row["n"],
        "R"       : row["R"],
    })

In [13]:
len(experimentos)

411

## Corremos los experimentos

In [25]:
cols = ["dataset", "metodo", "n", "R", "tiempo"];
res = []
numero = 1
T = 5

for exp in experimentos:
    
    clear_output(wait=True)
    display(f'Experimento: {numero}/{len(experimentos)}')
    numero += 1
    
    tiempos = []
    for _ in range(0, T):
        tiempos.append(run(exp["metodo"], exp["archivo"]))
    tiempo_avg = np.median(tiempos)
    
    res.append([exp["dataset"], exp["n"], exp["R"], exp["metodo"], tiempo_avg])
        
df_res = pd.DataFrame(res, columns=cols)
df_res.to_csv("resultados/resultados.csv", index=False, header=True)

'Experimento: 411/411'