## Prueba 2: variabilidad de $s_i$

In [2]:
import sys
sys.path.append('../')

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from glob import glob
from generacion_dataset import generar_dataset
from persistencia import importar_dataset, exportar_dataset, crear_directorio_salida
from mediciones import promediar_tiempos_ejecucion

In [4]:
MIN = 100
MAX = 10000
STEP = 100

RUTA_DATASET_02 = f"../datasets/02_variando_si_1_100"
RUTA_DATASET_03 = f"../datasets/03_variando_si_1_100000"
RUTA_DATASET_04 = f"../datasets/04_variando_si_1_100000000"

RUTA_TIEMPOS_02 = f"../mediciones/02_tiempos_ejecucion_variando_si_1_100.csv"
RUTA_TIEMPOS_03 = f"../mediciones/03_tiempos_ejecucion_variando_si_1_100000.csv"
RUTA_TIEMPOS_04 = f"../mediciones/04_tiempos_ejecucion_variando_si_1_100000000.csv"

RUTA_FIGURAS = f"../figuras/02_variando_si"

In [5]:
crear_directorio_salida(RUTA_DATASET_02)
crear_directorio_salida(RUTA_DATASET_03)
crear_directorio_salida(RUTA_DATASET_04)

### Generando datasets variando $s_i$

In [5]:
for n in range(MIN, MAX, STEP):
    dataset = generar_dataset(n, min_si = 1, max_si = 100, min_ai = 1, max_ai = 100)
    ruta = f"{RUTA_DATASET_02}/{n}_elementos.csv"
    exportar_dataset(dataset, ruta)

In [6]:

for n in range(MIN, MAX, STEP):
    dataset = generar_dataset(n, min_si = 1, max_si = 100000, min_ai = 1, max_ai = 100)
    ruta = f"{RUTA_DATASET_03}/{n}_elementos.csv"
    exportar_dataset(dataset, ruta)

In [7]:
for n in range(MIN, MAX, STEP):
    dataset = generar_dataset(n, min_si = 1, max_si = 100000000, min_ai = 1, max_ai = 100)
    ruta = f"{RUTA_DATASET_04}/{n}_elementos.csv"
    exportar_dataset(dataset, ruta)

### Midiendo tiempos

In [8]:
iteraciones = 30
resultados = []
archivos = glob(f"./{RUTA_DATASET_02}/*.csv")


for archivo in archivos:
    n_elementos = archivo.split('/')[-1].split('_')[0]
    rivales = importar_dataset(archivo)
    tiempo_promedio = promediar_tiempos_ejecucion(rivales, iteraciones)
    resultados.append({"cantidad": int(n_elementos), "tiempo_ms": tiempo_promedio})

exportar_dataset(resultados, RUTA_TIEMPOS_02, ["cantidad", "tiempo_ms"])

In [9]:
iteraciones = 30
resultados = []
archivos = glob(f"./{RUTA_DATASET_03}/*.csv")


for archivo in archivos:
    n_elementos = archivo.split('/')[-1].split('_')[0]
    rivales = importar_dataset(archivo)
    tiempo_promedio = promediar_tiempos_ejecucion(rivales, iteraciones)
    resultados.append({"cantidad": int(n_elementos), "tiempo_ms": tiempo_promedio})

exportar_dataset(resultados, RUTA_TIEMPOS_03, ["cantidad", "tiempo_ms"])

In [10]:
iteraciones = 30
resultados = []
archivos = glob(f"./{RUTA_DATASET_04}/*.csv")


for archivo in archivos:
    n_elementos = archivo.split('/')[-1].split('_')[0]
    rivales = importar_dataset(archivo)
    tiempo_promedio = promediar_tiempos_ejecucion(rivales, iteraciones)
    resultados.append({"cantidad": int(n_elementos), "tiempo_ms": tiempo_promedio})

exportar_dataset(resultados, RUTA_TIEMPOS_04, ["cantidad", "tiempo_ms"])

### Comparacion entre tiempos

In [11]:
df_02 = pd.read_csv(RUTA_TIEMPOS_02)
df_03 = pd.read_csv(RUTA_TIEMPOS_03) 
df_04 = pd.read_csv(RUTA_TIEMPOS_04)

In [12]:
df_02["Rango s_i"] = "1 - 100"
df_03["Rango s_i"] = "1 - 100000"
df_04["Rango s_i"] = "1 - 100000000"

df = pd.concat([df_04, df_02, df_03])

In [None]:
plt.style.use('ggplot')

fig,ax = plt.subplots(1,1,figsize=(8,6))
sns.lineplot(data = df, x="cantidad", y="tiempo_ms", ax=ax, palette = ["#6C8EBF", "#FF5733", "#D79B00"], hue = "Rango s_i")
ax.set_title("Tiempo de ejecución en función de la cantidad de rivales")
ax.set_xlabel("cantidad de rivales ($n$)")
ax.set_ylabel("tiempo (ms)")
ax.set_xlim((100, 9900))

fig.savefig(RUTA_FIGURAS, bbox_inches="tight")