# Experimentación

En este notebook corremos los experimentos descritos en el informe

In [None]:
%load_ext autoreload
%autoreload 2

In [1]:
import subprocess

def run(algorithm: str, instance_path: str) -> (int, float):
    """Corre el programa para la instancia dada y devuelve (resultado, tiempo de ejecucion)."""
    result = subprocess.run(
        f"../build/npm {algorithm} < {instance_path}",
        shell=True, capture_output=True, text=True, check=True,
    )

    return int(result.stdout), float(result.stderr)

In [2]:
import json
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

def run_solapamiento(instance_path: str):
    """Corre el programa para la instancia dada y devuelve (resultado, matriz de solapamiento)."""
    result = subprocess.run(
        f"../build/npm GR < {instance_path}",
        shell=True, capture_output=True, text=True, check=True,
    )

    return json.loads(result.stderr.split('\n')[0])["pd_accesses"]


# TODO: arreglar sta mierda
#df1 = pd.DataFrame(run_solapamiento("instancias/grupos/1-grupos_1.in"))
#df25 = pd.DataFrame(run_solapamiento("instancias/grupos/25-grupos_1.in"))

#fig, ax = plt.subplots(ncols=2, sharey=True)
#g = sns.heatmap(data=df25, cbar=True, ax=ax[0])
#g.set_title("25")
#sns.heatmap(data=df1, cbar=True, ax=ax[1])

In [3]:
from typing import List

def get_instances(dataset: str) -> List[str]:
    """Para cada dataset devuelve la lista de instancias correspondientes con el path completo"""
    instances = os.listdir(f"instancias/{dataset}")
    return list(filter(
        lambda i: i.endswith(".in"),
        map(lambda i: f"instancias/{dataset}/"+i, instances),
    ))


In [4]:
def run_instance(rows: list, dataset: str, algorithms: List[str]):
    """
    Corre una instancia para todos los algoritmos, llenando por referencia
    la lista de rows. Lanza una excepcion si para alguna instancia los
    resultados de todos los algoritmos no coinciden.
    """
    for instance in tqdm(get_instances(dataset), "instancias"):
        results = {}
        for alg in algorithms:
            res, t = run(alg, instance)
            rows.append({
                "dataset": dataset,
                "algorithm": alg,
                "time_ms": t,
                "instance": instance,
            })

            results[alg] = res

        if not np.alltrue([results[algorithms[0]] == res for res in results.values()]):
            print(f"Ojo que con la instancia {instance} no dieron todos iguales. Resultados: {results}")

## Implementación de la experimentación

In [5]:
ALL = ["FB", "BT", "BT-F", "BT-O-G", "BT-O-C", "DP"]

In [None]:
# type experimento struct {
#     algoritmos: []string
#     dataset: string
# }

experimentos = [
    {
        "algoritmos" : ALL,
        "dataset"    : "control",
    },
    {
    # DP para ver cómo afecta el solapamiento y BT debería ser siempre más o menos igual
    
    # TODO: revisar la matriz de solapamiento
        "algoritmos" : ["BT", "DP"],
        "dataset"    : "grupos",
    },
    # Optimalidad
    {
        "algoritmos" : ALL,
        "dataset"    : "one-to-rule",
    },
    {
        "algoritmos" : ALL,
        "dataset"    : "identicos",
    },
    # Factibilidad
    {
        "algoritmos" : ALL,
        "dataset"    : "low-M",
    },
    # Programación Dinámica
    {
        "algoritmos" : ["BT-F", "DP"],
        "dataset"    : "cache",
    },
    {
        "algoritmos" : ["DP"],
        "dataset"    : "complejidad-DP",
    }
]


In [7]:
import os
import numpy as np
import pandas as pd

from tqdm import tqdm

rows = []

for i, experimento in enumerate(experimentos):
    print("Corriendo el experimento {0} ({1}/{2})".format(experimento["dataset"], i+1, len(experimentos)))
    run_instance(rows, experimento["dataset"], experimento["algoritmos"])

df_results = pd.DataFrame(rows, columns=["dataset", "algorithm", "time_ms", "instance"])
print("Finished!")

instancias:   1%|▏         | 1/78 [00:00<00:07,  9.96it/s]

Corriendo el experimento control (1/7)


instancias:  36%|███▌      | 28/78 [01:50<05:24,  6.49s/it]

Ojo que con la instancia instancias/control/n_7-i_1.in no dieron todos iguales. Resultados: {'FB': 174, 'BT': 160, 'BT-F': 174, 'BT-O-G': 160, 'BT-O-C': 174, 'DP': 174}


instancias: 100%|██████████| 78/78 [11:29<00:00,  6.10s/it]
instancias:   0%|          | 4/1365 [00:00<00:38, 35.46it/s]

Corriendo el experimento grupos (2/7)


instancias: 100%|██████████| 1365/1365 [00:44<00:00, 28.46it/s]
instancias:   0%|          | 0/1365 [00:00<?, ?it/s]

Corriendo el experimento one-to-rule (3/7)


instancias:   4%|▎         | 50/1365 [13:55<9:01:02, 24.69s/it] 

KeyboardInterrupt: 

In [None]:
df_results.to_csv("resultados.csv")