## Prueba 3: variabilidad de $a_i$

In [1]:
import sys
sys.path.append('../')

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from glob import glob
from generacion_dataset import generar_dataset
from persistencia import importar_dataset, exportar_dataset
from mediciones import promediar_tiempos_ejecucion

In [4]:
MIN = 100
MAX = 10000
STEP = 100

RUTA_DATASET_05 = f"../datasets/05_variando_ai_1_100"
RUTA_DATASET_06 = f"../datasets/06_variando_ai_1_100000"
RUTA_DATASET_07 = f"../datasets/07_variando_ai_1_100000000"

RUTA_TIEMPOS_05 = f"../mediciones/05_tiempos_ejecucion_variando_ai_1_100.csv"
RUTA_TIEMPOS_06 = f"../mediciones/06_tiempos_ejecucion_variando_ai_1_100000.csv"
RUTA_TIEMPOS_07 = f"../mediciones/07_tiempos_ejecucion_variando_ai_1_100000000.csv"

RUTA_FIGURAS = f"../figuras/03_variando_ai"

### Generando datasets variando $a_i$

In [5]:
for n in range(MIN, MAX, STEP):
    dataset = generar_dataset(n, min_si = 1, max_si = 100, min_ai = 1, max_ai = 100)
    ruta = f"{RUTA_DATASET_05}/{n}_elementos.csv"
    exportar_dataset(dataset, ruta)

In [6]:

for n in range(MIN, MAX, STEP):
    dataset = generar_dataset(n, min_si = 1, max_si = 100, min_ai = 1, max_ai = 100000)
    ruta = f"{RUTA_DATASET_06}/{n}_elementos.csv"
    exportar_dataset(dataset, ruta)

In [7]:
for n in range(MIN, MAX, STEP):
    dataset = generar_dataset(n, min_si = 1, max_si = 100, min_ai = 1, max_ai = 100000000)
    ruta = f"{RUTA_DATASET_07}/{n}_elementos.csv"
    exportar_dataset(dataset, ruta)

### Midiendo tiempos

In [8]:
iteraciones = 30
resultados = []
archivos = glob(f"./{RUTA_DATASET_05}/*.csv")


for archivo in archivos:
    n_elementos = archivo.split('/')[-1].split('_')[0]
    rivales = importar_dataset(archivo)
    tiempo_promedio = promediar_tiempos_ejecucion(rivales, iteraciones)
    resultados.append({"cantidad": int(n_elementos), "tiempo_ms": tiempo_promedio})

exportar_dataset(resultados, RUTA_TIEMPOS_05, ["cantidad", "tiempo_ms"])

In [9]:
iteraciones = 30
resultados = []
archivos = glob(f"./{RUTA_DATASET_06}/*.csv")


for archivo in archivos:
    n_elementos = archivo.split('/')[-1].split('_')[0]
    rivales = importar_dataset(archivo)
    tiempo_promedio = promediar_tiempos_ejecucion(rivales, iteraciones)
    resultados.append({"cantidad": int(n_elementos), "tiempo_ms": tiempo_promedio})

exportar_dataset(resultados, RUTA_TIEMPOS_06, ["cantidad", "tiempo_ms"])

In [10]:
iteraciones = 30
resultados = []
archivos = glob(f"./{RUTA_DATASET_07}/*.csv")


for archivo in archivos:
    n_elementos = archivo.split('/')[-1].split('_')[0]
    rivales = importar_dataset(archivo)
    tiempo_promedio = promediar_tiempos_ejecucion(rivales, iteraciones)
    resultados.append({"cantidad": int(n_elementos), "tiempo_ms": tiempo_promedio})

exportar_dataset(resultados, RUTA_TIEMPOS_07, ["cantidad", "tiempo_ms"])

### Comparacion entre tiempos

In [11]:
df_02 = pd.read_csv(RUTA_TIEMPOS_05)
df_03 = pd.read_csv(RUTA_TIEMPOS_06) 
df_04 = pd.read_csv(RUTA_TIEMPOS_07)

In [12]:
df_02["Rango a_i"] = "1 - 100"
df_03["Rango a_i"] = "1 - 100000"
df_04["Rango a_i"] = "1 - 100000000"

df = pd.concat([df_04, df_02, df_03])

In [None]:
plt.style.use('ggplot')

fig,ax = plt.subplots(1,1,figsize=(8,6))
sns.lineplot(data = df, x="cantidad", y="tiempo_ms", ax=ax, palette = ["#6C8EBF", "#FF5733", "#D79B00"], hue = "Rango a_i")
ax.set_title("Tiempo de ejecución en función de la cantidad de rivales")
ax.set_xlabel("cantidad de rivales ($n$)")
ax.set_ylabel("tiempo (ms)")
ax.set_xlim((100, 9900))

fig.savefig(RUTA_FIGURAS, bbox_inches="tight")