Facultad de Ingenier√≠a Industrial y Sistemas - Universidad Nacional de Ingenier√≠a

Alejos Yarasca Fiorella Andrea (fiorella.alejos.y@uni.pe)

Llana Chavez Walter Rodolfo (walter.llana.c@uni.pe)

Medina Rodr√≠guez Henry (hmedinar@uni.pe)

Salazar Vega Edwin Mart√≠n (edwin.salazar.v@uni.pe)


Curso: Computaci√≥n Evolutiva - Maestr√≠a en Inteligencia

Artificial 2025-II


In [None]:
# -------------------------------------------------------------------
# Proyecto de Computaci√≥n Evolutiva
# Optimizaci√≥n Evolutiva de Asignaci√≥n de Pedidos (Dataset LADE)
# -------------------------------------------------------------------
# Este proyecto implementa un algoritmo evolutivo multiobjetivo,
# basado en NSGA-II, para abordar el problema de asignaci√≥n de pedidos
# a repartidores en servicios de entrega bajo demanda.
#
# Se utiliza el dataset LADE (Large-scale Dataset for Delivery),
# espec√≠ficamente el archivo pickup_yt.csv, que contiene informaci√≥n
# real de pedidos en el punto de recogida, incluyendo datos temporales
# y coordenadas geogr√°ficas.
#
# El problema se modela como un problema de asignaci√≥n, donde cada
# soluci√≥n candidata representa una posible asignaci√≥n de pedidos a
# un conjunto fijo de repartidores. No se utiliza la asignaci√≥n real
# del dataset (courier_id), ya que el objetivo es optimizar dicha
# asignaci√≥n mediante t√©cnicas evolutivas.
#
# El algoritmo NSGA-II permite optimizar simult√°neamente m√∫ltiples
# objetivos en conflicto, entre ellos:
#   - Minimizar el tiempo total estimado de atenci√≥n de los pedidos.
#   - Minimizar la distancia total asociada a los pedidos asignados.
#   - Minimizar el desbalance de carga entre repartidores.
#
# Debido al gran tama√±o del dataset LADE, se trabaja con subconjuntos.
#
# Como resultado, el proyecto obtiene un conjunto de soluciones no
# dominadas (frente de Pareto), que representan distintos compromisos
# entre los objetivos considerados, permitiendo analizar alternativas
# eficientes de asignaci√≥n de pedidos.
# -------------------------------------------------------------------


In [None]:
# Instala las librer√≠as necesarias para el proyecto:
# - pymoo: implementaci√≥n de algoritmos evolutivos y multiobjetivo (ej. NSGA-II)
# - pandas: manipulaci√≥n y an√°lisis de datos tabulares (dataset LADE)
# - numpy: operaciones num√©ricas y manejo de arreglos
# - matplotlib: visualizaci√≥n de resultados, como el frente de Pareto
!pip install pymoo pandas numpy matplotlib


In [None]:
#versiones fijadas
!pip install -q datasets==2.21.0 huggingface_hub==0.24.6 pyarrow pandas==2.2.2 fsspec==2024.6.1



In [None]:
!pip -q install datasets==2.21.0 huggingface_hub==0.24.6 fsspec==2024.6.1 aiohttp


In [None]:
import os
os.environ["HF_HUB_ETAG_TIMEOUT"] = "120"
os.environ["HF_HUB_DOWNLOAD_TIMEOUT"] = "600"
os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"


In [None]:
from huggingface_hub import snapshot_download

local_dir = snapshot_download(
    repo_id="Cainiao-AI/LaDe",
    repo_type="dataset",
    local_dir="LaDe_local",
    local_dir_use_symlinks=False,
    resume_download=True,
    max_workers=2
)

print("Dataset descargado en:", local_dir)


In [None]:
#ver con detalle el dataset descaragado
!find /content/LaDe_local -maxdepth 3 -type d


In [None]:
# ------------------------------------------------------------
# Dataset: LADE (Large-scale Dataset for Delivery)
# ------------------------------------------------------------
# Este proyecto utiliza el dataset LADE, un conjunto de datos
# a gran escala publicado por Cainiao-AI para investigaci√≥n en
# problemas de log√≠stica y servicios de entrega bajo demanda.
#
# El dataset contiene informaci√≥n real de pedidos, incluyendo:
# - Datos de recogida (pickup) en restaurantes o comercios
# - Datos de entrega (delivery) a clientes finales
# - Informaci√≥n de trayectorias de repartidores (opcional)
# - Red vial (road-network) para an√°lisis avanzados
#
# Para este trabajo se utiliza √∫nicamente el archivo:
#   /content/LaDe_local/pickup/pickup_yt.csv
#
# Este archivo contiene los pedidos en el punto de recogida,
# con informaci√≥n temporal y geogr√°fica suficiente para modelar
# el problema de asignaci√≥n de pedidos a repartidores.
#
# Debido al gran tama√±o del dataset completo, se trabaja con
# subconjuntos del archivo (por ventanas de tiempo) para construir
# instancias manejables del problema de optimizaci√≥n evolutiva.
#
# Las dem√°s carpetas del dataset (delivery, road-network y
# data_with_trajectory_20s) no se utilizan en esta implementaci√≥n,
# ya que exceden el alcance del presente proyecto.
# ------------------------------------------------------------


In [None]:
import pandas as pd

df = pd.read_csv(
    "/content/LaDe_local/pickup/pickup_yt.csv",
    low_memory=False
)

df.head()


In [None]:
print("‚úÖ CSV recargado. Filas:", len(df))
df[["accept_time"]].head()

In [None]:
df.columns


In [None]:
# -------------------------------------------------------------------
# Columnas del dataset LADE (archivo: pickup_yt.csv)
# -------------------------------------------------------------------
# order_id:
#   Identificador √∫nico del pedido.
#   Uso en el proyecto: NO (solo referencia y trazabilidad).
#
# region_id:
#   Identificador de la regi√≥n o zona dentro de la ciudad.
#   Uso en el proyecto: OPCIONAL (para filtrar pedidos por regi√≥n).
#
# city:
#   Ciudad donde se realiza el pedido.
#   Uso en el proyecto: OPCIONAL (se puede trabajar con una sola ciudad).
#
# courier_id:
#   Identificador del repartidor que atendi√≥ el pedido en el sistema real.
#   Uso en el proyecto: NO (informaci√≥n hist√≥rica; la asignaci√≥n es optimizada).
#
# accept_time:
#   Momento en que un repartidor acepta el pedido.
#   Uso en el proyecto: NO (dato hist√≥rico).
#
# time_window_start:
#   Inicio de la ventana de tiempo para la recogida del pedido.
#   Uso en el proyecto: OPCIONAL (restricci√≥n temporal en modelos avanzados).
#
# time_window_end:
#   Fin de la ventana de tiempo para la recogida del pedido.
#   Uso en el proyecto: OPCIONAL (restricci√≥n temporal en modelos avanzados).
#
# lng:
#   Longitud geogr√°fica del punto de recogida (restaurante).
#   Uso en el proyecto: S√ç (c√°lculo de distancias).
#
# lat:
#   Latitud geogr√°fica del punto de recogida (restaurante).
#   Uso en el proyecto: S√ç (c√°lculo de distancias).
#
# aoi_id:
#   Identificador del √°rea de inter√©s (Area of Interest).
#   Uso en el proyecto: OPCIONAL (agrupaci√≥n espacial o an√°lisis adicional).
#
# aoi_type:
#   Tipo de √°rea (residencial, comercial, etc.).
#   Uso en el proyecto: NO.
#
# pickup_time:
#   Hora real en la que se realiz√≥ la recogida del pedido.
#   Uso en el proyecto: NO (resultado hist√≥rico).
#
# pickup_gps_time:
#   Timestamp GPS registrado durante la recogida.
#   Uso en el proyecto: NO.
#
# pickup_gps_lng:
#   Longitud GPS registrada durante la recogida.
#   Uso en el proyecto: NO.
#
# pickup_gps_lat:
#   Latitud GPS registrada durante la recogida.
#   Uso en el proyecto: NO.
#
# accept_gps_time:
#   Timestamp GPS registrado cuando el pedido fue aceptado.
#   Uso en el proyecto: NO.
#
# accept_gps_lng:
#   Longitud GPS registrada al aceptar el pedido.
#   Uso en el proyecto: NO.
#
# accept_gps_lat:
#   Latitud GPS registrada al aceptar el pedido.
#   Uso en el proyecto: NO.
#
# ds:
#   Fecha del pedido (formato day stamp).
#   Uso en el proyecto: OPCIONAL (filtrado por d√≠a).
# -------------------------------------------------------------------


In [None]:
import pandas as pd
import numpy as np
import time

t0 = time.time()
print("üîπ Iniciando limpieza y reconstrucci√≥n de timestamps...")

# ------------------------------------------------------------
print("‚û°Ô∏è 1) Convirtiendo lat/lng a num√©rico...")
df["lat"] = pd.to_numeric(df["lat"], errors="coerce")
df["lng"] = pd.to_numeric(df["lng"], errors="coerce")
print("   ‚úî lat/lng listos")

# ------------------------------------------------------------
print("‚û°Ô∏è 2) Reconstruyendo accept_time_dt usando ds (MDD) + hora (HH:MM:SS)...")

YEAR = 2020  # Ajusta si tu dataset corresponde a otro a√±o

# ds viene como MDD (ej: 518 -> 05-18). Aseguramos 3 d√≠gitos m√≠nimo.
ds_str = df["ds"].astype("Int64").astype(str).str.zfill(3)  # ej: 518, 505, 511

mm = ds_str.str[:-2].str.zfill(2)   # mes: "5" -> "05"
dd = ds_str.str[-2:]                # d√≠a: "18"

# accept_time viene como "MM-DD HH:MM:SS" -> tomamos solo "HH:MM:SS"
time_str = df["accept_time"].astype(str).str[-8:]  # "08:16:00"

# Timestamp final coherente: "YYYY-MM-DD HH:MM:SS"
full_ts = f"{YEAR}-" + mm + "-" + dd + " " + time_str

df["accept_time_dt"] = pd.to_datetime(
    full_ts, format="%Y-%m-%d %H:%M:%S", errors="coerce"
)

ok_dt = df["accept_time_dt"].notna().sum()
print(f"   ‚úî accept_time_dt creado | No nulos: {ok_dt}")

# ------------------------------------------------------------
print("‚û°Ô∏è 3) Seleccionando columnas relevantes y eliminando nulos...")
cols_use = ["order_id", "city", "region_id", "accept_time_dt", "lat", "lng", "ds"]

before = len(df)
data = df[cols_use].dropna().copy()
after = len(data)

data = data.rename(columns={"accept_time_dt": "accept_time"})

print(f"   ‚úî Filas originales: {before}")
print(f"   ‚úî Filas v√°lidas:    {after}")
print(f"   ‚úî Eliminadas:       {before - after}")

# ------------------------------------------------------------
t1 = time.time()
print(f"‚úÖ Proceso finalizado en {t1 - t0:.2f} segundos")
print("üîé Vista previa (data):")
data.head(10)


In [None]:
# Ordenar los pedidos seg√∫n el tiempo de aceptaci√≥n
# Esto asegura que los pedidos sigan un orden temporal realista
data = data.sort_values("accept_time").reset_index(drop=True)

# Seleccionar los primeros 200 pedidos para construir una instancia del problema
# Esta instancia ser√° utilizada en los experimentos del algoritmo evolutivo
instance = data.head(200).reset_index(drop=True)
print("‚úÖ Pedidos en instancia:", len(instance))
instance.head()


In [None]:
import os

BASE_DIR = "/content/drive/MyDrive/LADE_Evolutionary_Project"
DATA_DIR = os.path.join(BASE_DIR, "data")
RESULTS_DIR = os.path.join(BASE_DIR, "results")

os.makedirs(DATA_DIR, exist_ok=True)
os.makedirs(RESULTS_DIR, exist_ok=True)

print("‚úÖ Carpetas creadas")


In [None]:
PARQUET_PATH = "/content/drive/MyDrive/LADE_Evolutionary_Project/data/LADE_instance_200.parquet"

instance.to_parquet(PARQUET_PATH, index=False)

print(f"‚úÖ Instancia guardada en:\n{PARQUET_PATH}")


In [None]:
from google.colab import drive
drive.mount('/content/drive')


In [None]:
!ls /content/drive/MyDrive/LADE_Evolutionary_Project/data


In [None]:

# Ruta
BASE_DIR = "/content/drive/MyDrive/LADE_Evolutionary_Project"
PARQUET_PATH = f"{BASE_DIR}/data/LADE_instance_200.parquet"

instance = pd.read_parquet(PARQUET_PATH)

print("‚úÖ Instancia cargada")
print("Pedidos:", len(instance))
instance.head()


In [None]:
coords = instance[["lat", "lng"]].to_numpy(dtype=float)

center_lat = coords[:, 0].mean()
center_lng = coords[:, 1].mean()


K = 20
V_KM_H = 20.0
SERVICE_MIN = 3.0

# Funci√≥n para calcular la distancia geod√©sica (en kil√≥metros)
# entre dos puntos dados por latitud y longitud usando la f√≥rmula de Haversine

def haversine_km(lat1, lon1, lat2, lon2):
    R = 6371.0
    lat1 = np.radians(lat1); lon1 = np.radians(lon1)
    lat2 = np.radians(lat2); lon2 = np.radians(lon2)
    dlat = lat2 - lat1
    dlon = lon2 - lon1
    a = np.sin(dlat/2.0)**2 + np.cos(lat1)*np.cos(lat2)*np.sin(dlon/2.0)**2
    return 2 * R * np.arcsin(np.sqrt(a))

# Inicializar generador de n√∫meros aleatorios con semilla fija
# Esto garantiza la reproducibilidad de los experimentos
# Bases de couriers (K puntos tomados de pedidos reales)
rng = np.random.default_rng(1)
base_idx = rng.choice(len(coords), size=K, replace=False)
bases = coords[base_idx]  # shape (K,2)

# Matriz distancias: dist_matrix[k, j] = distancia base courier k -> pedido j
dist_matrix = np.zeros((K, len(coords)), dtype=float)
for k in range(K):
    dist_matrix[k] = haversine_km(bases[k,0], bases[k,1], coords[:,0], coords[:,1])




In [None]:
from pymoo.core.problem import Problem

# Definici√≥n del problema de asignaci√≥n de pedidos a repartidores

class AssignOrdersProblem(Problem):
    def __init__(self, dist_matrix, K, v_kmh, service_min):
        """
        Inicializa el problema de optimizaci√≥n.

        Parameters:
        - dist_matrix: matriz de distancias (K x N), donde cada fila representa un repartidor
          y cada columna un pedido.
        - K: n√∫mero de repartidores.
        - v_kmh: velocidad promedio de desplazamiento (km/h).
        - service_min: tiempo fijo de servicio por pedido (minutos).
        """
        # n_var: n√∫mero de variables de decisi√≥n (una por pedido)
        # n_obj: n√∫mero de objetivos (makespan, distancia total, balance)
        # xl, xu: l√≠mites inferiores y superiores para la asignaci√≥n de pedidos
        # type_var: las variables son enteras (√≠ndice del repartidor)

        super().__init__(n_var=dist_matrix.shape[1], n_obj=3, xl=0, xu=K-1, type_var=int)
        self.dist_matrix = dist_matrix
        self.K = K
        # Conversi√≥n de velocidad de km/h a minutos por kil√≥metro
        self.min_per_km = 60.0 / v_kmh
        # Tiempo fijo de atenci√≥n por pedido
        self.service_min = service_min

    def _evaluate(self, X, out, *args, **kwargs):
        """
        Eval√∫a una poblaci√≥n de soluciones.

        Parameters:
        - X: matriz de decisiones (pop_size x n_orders),
             donde cada fila representa una soluci√≥n candidata.
        - out: diccionario donde se almacenan los valores de los objetivos.
        """
        pop_size, n_orders = X.shape

        f1 = np.zeros(pop_size)  # makespan
        f2 = np.zeros(pop_size)  # distancia total
        f3 = np.zeros(pop_size)  # desbalance
        # Evaluar cada soluci√≥n de la poblaci√≥n

        for i in range(pop_size):
            # Asignaci√≥n de pedidos a repartidores para la soluci√≥n i
            assign = X[i].astype(int)

            dist_per = np.zeros(self.K, dtype=float)
            cnt_per  = np.zeros(self.K, dtype=int)

            # sumar distancias por courier seg√∫n asignaci√≥n
            # Acumular distancias y pedidos seg√∫n la asignaci√≥n
            for j in range(n_orders):
                c = assign[j]
                dist_per[c] += self.dist_matrix[c, j]
                cnt_per[c]  += 1

            time_per = dist_per * self.min_per_km + cnt_per * self.service_min

            f1[i] = time_per.max()                # minimizar peor courier
            f2[i] = dist_per.sum()                # minimizar distancia total
            f3[i] = cnt_per.max() - cnt_per.min() # balance

            # penalizar couriers sin pedidos (opcional pero √∫til)
            empty = np.sum(cnt_per == 0)
            if empty > 0:
                f1[i] += 20.0 * empty
                f3[i] += empty
        # Asignar los valores de los objetivos al diccionario de salida
        out["F"] = np.column_stack([f1, f2, f3])

# Crear la instancia del problema con los par√°metros definidos
problem = AssignOrdersProblem(dist_matrix, K=K, v_kmh=V_KM_H, service_min=SERVICE_MIN)

# Mostrar informaci√≥n b√°sica del problema creado

print("‚úÖ Problema creado. Variables:", problem.n_var, "| Objetivos:", problem.n_obj)


In [None]:
from pymoo.algorithms.moo.nsga2 import NSGA2
from pymoo.optimize import minimize
import matplotlib.pyplot as plt

# Configuraci√≥n del algoritmo NSGA-II
# pop_size define el tama√±o de la poblaci√≥n en cada generaci√≥n
algorithm = NSGA2(pop_size=120)

# Ejecuci√≥n del proceso de optimizaci√≥n evolutiva
# - problem: instancia del problema multiobjetivo definido
# - algorithm: algoritmo evolutivo seleccionado (NSGA-II)
# - termination: criterio de parada basado en n√∫mero de generaciones
# - seed: semilla para asegurar reproducibilidad
# - verbose: muestra informaci√≥n del progreso en consola
# - save_history: almacena el historial evolutivo para an√°lisis posterior
res = minimize(
    problem,
    algorithm,
    termination=("n_gen", 250),
    seed=1,
    verbose=True,
    save_history=True
)
# Extraer los valores de las funciones objetivo de las soluciones del frente de Pareto
F = res.F
print("‚úÖ Pareto solutions:", F.shape[0])

# Visualizaci√≥n del frente de Pareto
# Ejes:
# - eje X: makespan (f1)
# - eje Y: distancia total (f2)
# El color representa el desbalance de carga (f3)
plt.figure()
sc = plt.scatter(F[:,0], F[:,1], c=F[:,2], s=18)
plt.xlabel("f1: Makespan (min) - max tiempo por courier")
plt.ylabel("f2: Distancia total (km)")
plt.colorbar(sc, label="f3: Desbalance (max-min)")
plt.title("Frente de Pareto - NSGA-II (LADE, 200 pedidos)")
plt.show()


In [None]:
# Inicializar listas para almacenar la mejor y la aptitud promedio
# de cada funci√≥n objetivo a lo largo de las generaciones
best_f1, avg_f1 = [], []
best_f2, avg_f2 = [], []
best_f3, avg_f3 = [], []

# Recorrer el historial evolutivo generado por NSGA-II
# Cada elemento de res.history corresponde a una generaci√≥n
for algo in res.history:
    # objetivos de la poblaci√≥n de esa generaci√≥n
    # Obtener los valores de las funciones objetivo de la poblaci√≥n actual
    # Fg tiene dimensi√≥n (tama√±o_poblaci√≥n x n√∫mero_de_objetivos)
    Fg = algo.pop.get("F")  # shape: (pop_size, 3)

    # f1: makespan
    # Guardar el mejor valor (m√≠nimo) y el valor promedio de la poblaci√≥n

    best_f1.append(Fg[:, 0].min())
    avg_f1.append(Fg[:, 0].mean())

    # f2: distancia total
    # Guardar el mejor valor (m√≠nimo) y el valor promedio de la poblaci√≥n

    best_f2.append(Fg[:, 1].min())
    avg_f2.append(Fg[:, 1].mean())

    # f3: desbalance de carga
    # Guardar el mejor valor (m√≠nimo) y el valor promedio de la poblaci√≥n

    best_f3.append(Fg[:, 2].min())
    avg_f3.append(Fg[:, 2].mean())

best_f1 = np.array(best_f1); avg_f1 = np.array(avg_f1)
best_f2 = np.array(best_f2); avg_f2 = np.array(avg_f2)
best_f3 = np.array(best_f3); avg_f3 = np.array(avg_f3)

# Mostrar el n√∫mero total de generaciones registradas
print("Generaciones registradas:", len(best_f1))


Grafica Convergencia

In [None]:
plt.figure()
plt.plot(best_f1, label="Mejor f1 (min)")
plt.plot(avg_f1, label="Promedio f1")
plt.xlabel("Generaci√≥n")
plt.ylabel("Makespan (min)")
plt.title("Convergencia de f1 (Makespan)")
plt.legend()
plt.show()


Grafico convergencia - Ditancia total

In [None]:
plt.figure()
plt.plot(best_f2, label="Mejor f2 (min)")
plt.plot(avg_f2, label="Promedio f2")
plt.xlabel("Generaci√≥n")
plt.ylabel("Distancia total (km)")
plt.title("Convergencia de f2 (Distancia total)")
plt.legend()
plt.show()


In [None]:
plt.figure()
plt.plot(best_f3, label="Mejor f3 (min)")
plt.plot(avg_f3, label="Promedio f3")
plt.xlabel("Generaci√≥n")
plt.ylabel("Desbalance (max-min)")
plt.title("Convergencia de f3 (Desbalance)")
plt.legend()
plt.show()


In [None]:
window = 30
delta_f1 = best_f1[-window] - best_f1[-1]
delta_f2 = best_f2[-window] - best_f2[-1]
delta_f3 = best_f3[-window] - best_f3[-1]

print(f"Mejora en best f1 (√∫ltimas {window} gens): {delta_f1:.4f}")
print(f"Mejora en best f2 (√∫ltimas {window} gens): {delta_f2:.4f}")
print(f"Mejora en best f3 (√∫ltimas {window} gens): {delta_f3:.4f}")


Grafica convergencia - desbalance

In [None]:
F = res.F.copy()

# normalizar a [0,1] cada objetivo
F_norm = (F - F.min(axis=0)) / (F.max(axis=0) - F.min(axis=0) + 1e-12)

# score por distancia al origen (0,0,0): menor = mejor compromiso
score = np.linalg.norm(F_norm, axis=1)

best_idx = np.argmin(score)
print("‚úÖ √çndice soluci√≥n compromiso:", best_idx)
print("f1,f2,f3:", res.F[best_idx])


In [None]:
best_assign = res.X[best_idx].astype(int)
instance_solution = instance.copy()
instance_solution["courier_assigned"] = best_assign

instance_solution.head()



In [None]:
counts = instance_solution["courier_assigned"].value_counts().sort_index()
print("Pedidos por courier (min/max):", counts.min(), counts.max())
counts.head()


In [None]:
out_path = f"{RESULTS_DIR}/best_solution_orders.csv"
instance_solution.to_csv(out_path, index=False)
print("‚úÖ Guardado:", out_path)


In [None]:
df = pd.read_csv(f"{RESULTS_DIR}/best_solution_orders.csv")
tabla_asignacion = (
    df.groupby("courier_assigned")
      .size()
      .reset_index(name="num_pedidos")
      .sort_values("courier_assigned")
)

tabla_asignacion


In [None]:
tabla_asignacion.to_csv(
    "tabla_asignacion_couriers.csv",
    index=False
)

In [None]:
min_pedidos = tabla_asignacion["num_pedidos"].min()
max_pedidos = tabla_asignacion["num_pedidos"].max()
balance = max_pedidos - min_pedidos

min_pedidos, max_pedidos, balance


Estudio de sensibilidad

In [None]:
import time
from pymoo.algorithms.moo.nsga2 import NSGA2
from pymoo.optimize import minimize

def run_nsga(pop_size, n_gen=250):
    algorithm = NSGA2(pop_size=pop_size)

    start = time.time()
    res = minimize(
        problem,
        algorithm,
        termination=("n_gen", n_gen),
        seed=1,
        verbose=False
    )
    elapsed = time.time() - start

    F = res.F

    return {
        "pop_size": pop_size,
        "best_f1": F[:,0].min(),
        "best_f2": F[:,1].min(),
        "best_f3": F[:,2].min(),
        "pareto_size": F.shape[0],
        "time_sec": elapsed
    }


In [None]:
results = []
for p in [60, 120, 200]:
    results.append(run_nsga(p))

df_sens = pd.DataFrame(results)
df_sens


In [None]:

def random_assignment(dist_matrix, K, v_kmh, service_min, seed=1):
    np.random.seed(seed)

    n_orders = dist_matrix.shape[1]
    assign = np.random.randint(0, K, size=n_orders)

    dist_per = np.zeros(K)
    cnt_per = np.zeros(K, dtype=int)

    for j in range(n_orders):
        c = assign[j]
        dist_per[c] += dist_matrix[c, j]
        cnt_per[c] += 1

    min_per_km = 60.0 / v_kmh
    time_per = dist_per * min_per_km + cnt_per * service_min

    f1 = time_per.max()
    f2 = dist_per.sum()
    f3 = cnt_per.max() - cnt_per.min()

    return f1, f2, f3


In [None]:
f1_rand, f2_rand, f3_rand = random_assignment(
    dist_matrix, K, V_KM_H, SERVICE_MIN
)

print("Baseline aleatorio")
print("f1:", f1_rand)
print("f2:", f2_rand)
print("f3:", f3_rand)
