

---

## **📌 Route Optimization Project using Clustering and TSP Algorithms**  
**Author:** Pedro Miguel Figueroa Domínguez  

### **📖 Introduction**  
This project is designed to **optimize visit routes** to different geographical locations using **clustering algorithms and the Traveling Salesman Problem (TSP) solution**. The process consists of two main steps:  

1. **Clustering Points:**  
   - A clustering algorithm groups locations into clusters with a **maximum of 281 points** each.  
   - These clusters are assigned to different **agents** to distribute the workload.  

2. **Route Optimization (TSP):**  
   - The **Nearest Neighbor Algorithm** is used to determine the optimal visiting order within each cluster.  
   - The route is sorted based on the **shortest distance between points**.  

### **⚙️ Prerequisites**  
Before running the notebook, install the required Python libraries:  

```python
!pip install pandas googlemaps ortools folium openpyxl
pip install folium pandas numpy scikit-learn geopy
```


### **🌍 Getting Coordinates (If Not Available in Your Data)**  
If your dataset does not contain **latitude and longitude coordinates**, you can extract them using the **Google Maps API**.  

#### **Steps to Obtain Coordinates**  

1. **Download an Address Dataset (if needed)**  
   - If you only have business names and addresses, your file should have structured address information.  
   - Recommended format: CSV or Excel with columns like **Business Name, Address, City, Country**.  

2. **Get a Google Maps API Key**  
   - Go to [Google Cloud Console](https://console.cloud.google.com/)  
   - Enable the **Geocoding API**  
   - Generate an **API Key**  

3. **Insert the API Key into the Code**  
   - The script will use this API key to query Google Maps and retrieve latitude/longitude.  

4. **Run the Script to Convert Addresses to Coordinates**  
   - The code will process each address and store the coordinates for later use.  

### **🚀 How to Use This Project**  

1. **Load the Data**  
   - Ensure your dataset includes either **coordinates** or **addresses** (if you plan to extract them).  
   - If missing coordinates, use the Google Maps API method to obtain them.  
   - The script will automatically load and process the dataset into a **DataFrame**.  

2. **Run the Route Optimization Algorithm**  
   - The script will create clusters of **maximum 281 points** each.  
   - It will then apply the **TSP algorithm** to determine the optimal visiting order.  

3. **Generate the CSV File and Visualize the Route**  
   - Enter the **agent number** to generate a **route table**.  
   - The script will generate a CSV file with the optimized route.  
   - A **map will be displayed**, showing the numbered points in the correct order.  

### **📌 Key Features**  
✔ **Efficient clustering** to distribute locations into manageable groups.  
✔ **Route optimization** using the **Nearest Neighbor TSP algorithm**.  
✔ **Automatic CSV generation** with sorted visiting orders.  
✔ **Interactive map visualization** with numbered points.  
✔ **Automatic coordinate retrieval** if not available.  

### **🎯 Expected Results**  
- **A well-organized table** displaying the optimal visiting order.  
- **An interactive map** showing points numbered in sequence.  
- **A CSV file** with the ordered route for each agent.  

### **📊 Excel File Structure**  
The Excel file used in this project must have the following structure:

- The **sheet** must be called `Sheet1`.  
- The **columns** should start from the **2nd row** with these headers:

|   | A              | B       | C   | D       | E          | F         |
|---|----------------|---------|-----|---------|------------|-----------|
| 1 |                |         |     |         |            |           |
| 2 | **Nombre Comercial** | **Calle** | **No.** | **Sector** | **Municipio** | **Provincia** |
| 3 | Example Name    | Example St. | 123 | Sector 1 | City 1     | Province 1 |
| 4 | Example Name 2  | Another St. | 456 | Sector 2 | City 2     | Province 2 |
| 5 | ...             | ...     | ... | ...     | ...        | ...       |

- Data should start from **row 3**. The **columns** are as follows:
  - **Nombre Comercial** (Business Name)  
  - **Calle** (Street)  
  - **No.** (Street Number)  
  - **Sector** (Sector)  
  - **Municipio** (City)  
  - **Provincia** (Province)  

---

💡 **This project streamlines visit planning and route optimization, ensuring efficiency in travel.** 🚀

## Installs

In [21]:
!pip install pandas googlemaps ortools folium openpyxl


Collecting googlemaps
  Downloading googlemaps-4.10.0.tar.gz (33 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting ortools
  Downloading ortools-9.11.4210-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (3.0 kB)
Collecting absl-py>=2.0.0 (from ortools)
  Downloading absl_py-2.1.0-py3-none-any.whl.metadata (2.3 kB)
Collecting protobuf<5.27,>=5.26.1 (from ortools)
  Downloading protobuf-5.26.1-cp37-abi3-manylinux2014_x86_64.whl.metadata (592 bytes)
Downloading ortools-9.11.4210-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (28.1 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m28.1/28.1 MB[0m [31m56.9 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading absl_py-2.1.0-py3-none-any.whl (133 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m133.7/133.7 kB[0m [31m12.7 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading protobuf-5.26.1-cp37-abi3-manylinux2014_x86_64.whl (302 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━

In [None]:

!pip install folium geopy numpy scikit-learn

## Carga de datos

In [11]:
import pandas as pd
from google.colab import files

# Subir archivo
uploaded = files.upload()
file_name = list(uploaded.keys())[0]
df = pd.read_excel(file_name, sheet_name="Sheet1",header=1)

Saving Localidades de los registrados en terrenas.xlsx to Localidades de los registrados en terrenas (5).xlsx


In [12]:
df.head()

Unnamed: 0,Cant.,RNC,Nombre Comercial,Situación,Tipo de Persona,Calle,No.,Sector,Edif/Apt/Local,Referencia,Municipio,Provincia,Teléfono \n(Opcional)
0,1,6600107000.0,VANGELO FERNANDEZ CABA,Suspendido,Personas Físicas,SANCHEZ,,CIUDAD,,F,Las Terrenas,Samaná,809-260-1601
1,2,7100101000.0,FRANK ALBERTO SANCHEZ DUARTE,Activo,Personas Físicas,EL BOULEVARD DEL ATLANTICO,11.0,LAS TERRENAS (MUNICIPIO),,FRENTE A LA PLAZA VENTURA EN EL LOCAL DE ORANGE,Las Terrenas,Samaná,809-875-3888
2,3,6600145000.0,GABRIEL VILORIO PEGUERO,Suspendido,Personas Físicas,DUARTE,23.0,LA BONITA (LLANO NO PLAYA),EL BULEVAR DEL ATLANTICO,,Las Terrenas,Samaná,809-240-5121
3,4,114796000.0,JACZORY ESTELA RAMIREZ DE LA CRUZ,Suspendido,Personas Físicas,JUAN PABLO DUARTE,196.0,LAS TERRENAS (MUNICIPIO),0,,Las Terrenas,Samaná,
4,5,6600164000.0,RAFAEL ANTONIO LORA GARCIA,Activo,Personas Físicas,PROLONG. SANCHEZ,10.0,SANTA BARBARA DE SAMANA (CENTRO),1,LAS TERRENAS,Las Terrenas,Samaná,809-809-8900245


## Limpieza de datos

In [17]:
print(df.columns.tolist())

['Cant.', 'RNC', 'Nombre Comercial ', 'Situación', 'Tipo de Persona', 'Calle ', 'No.', 'Sector ', 'Edif/Apt/Local', 'Referencia', 'Municipio ', 'Provincia ', 'Teléfono \n(Opcional)']


In [13]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2845 entries, 0 to 2844
Data columns (total 13 columns):
 #   Column                Non-Null Count  Dtype  
---  ------                --------------  -----  
 0   Cant.                 2845 non-null   int64  
 1   RNC                   2807 non-null   float64
 2   Nombre Comercial      2807 non-null   object 
 3   Situación             2807 non-null   object 
 4   Tipo de Persona       2807 non-null   object 
 5   Calle                 2807 non-null   object 
 6   No.                   2367 non-null   object 
 7   Sector                2791 non-null   object 
 8   Edif/Apt/Local        1603 non-null   object 
 9   Referencia            1129 non-null   object 
 10  Municipio             2807 non-null   object 
 11  Provincia             2807 non-null   object 
 12  Teléfono 
(Opcional)  2659 non-null   object 
dtypes: float64(1), int64(1), object(11)
memory usage: 289.1+ KB


In [19]:


# Crear columna 'Ubicacion' respetando NaNs originales
columnas_a_combinar = [
    "Calle ",
    "No.",
    "Sector ",
    "Municipio ",
    "Provincia "
]

df["Ubicacion"] = df[columnas_a_combinar].apply(
    lambda row: ', '.join([str(val) for val in row if pd.notna(val)]),
    axis=1
)

# Verificar resultado
df[["Ubicacion"] + columnas_a_combinar].head(10)

Unnamed: 0,Ubicacion,Calle,No.,Sector,Municipio,Provincia
0,"SANCHEZ, , CIUDAD ...",SANCHEZ,,CIUDAD,Las Terrenas,Samaná
1,"EL BOULEVARD DEL ATLANTICO, 11, LAS TERRENAS (...",EL BOULEVARD DEL ATLANTICO,11,LAS TERRENAS (MUNICIPIO),Las Terrenas,Samaná
2,"DUARTE, 23, LA BONITA (LLANO NO PLAYA), Las Te...",DUARTE,23,LA BONITA (LLANO NO PLAYA),Las Terrenas,Samaná
3,"JUAN PABLO DUARTE, 196, LAS TERRENAS (MUNICIPI...",JUAN PABLO DUARTE,196,LAS TERRENAS (MUNICIPIO),Las Terrenas,Samaná
4,"PROLONG. SANCHEZ, 10, SANTA BARBARA DE SAMANA ...",PROLONG. SANCHEZ,10,SANTA BARBARA DE SAMANA (CENTRO),Las Terrenas,Samaná
5,"EL CARMEN, 93, LAS TERRENAS, CENTRO DEL PUEBLO...",EL CARMEN,93,"LAS TERRENAS, CENTRO DEL PUEBLO",Las Terrenas,Samaná
6,"PLAZA GARREN BEACH, 6, LA CEIBA, Las Terrenas,...",PLAZA GARREN BEACH,6,LA CEIBA,Las Terrenas,Samaná
7,"PRINCIPAL, SN, CIUDAD, Las Terrenas, Samaná",PRINCIPAL,SN,CIUDAD,Las Terrenas,Samaná
8,"JUAN PABLO DUARTE, 0, SAMANA, CENTRO DEL PUEBL...",JUAN PABLO DUARTE,0,"SAMANA, CENTRO DEL PUEBLO",Las Terrenas,Samaná
9,"CALLE EL CARMEN /ESQ.ROSARIO, 36, CIUDAD, Las ...",CALLE EL CARMEN /ESQ.ROSARIO,36,CIUDAD,Las Terrenas,Samaná


## Conseguir Coordenadas

In [22]:
import googlemaps
import pandas as pd
import time
import logging
import json
from googlemaps.exceptions import ApiError, HTTPError, Timeout, TransportError

# Configuración inicial
API_KEY = "Introduce your API KEYs"
gmaps = googlemaps.Client(key=API_KEY)

# Configurar logging
logging.basicConfig(
    filename='geocoding.log',
    level=logging.INFO,
    format='%(asctime)s - %(levelname)s - %(message)s'
)

# Parámetros de ejecución
BATCH_SIZE = 50  # Tamaño de lote para procesamiento
DELAY = 2  # Segundos entre lotes
MAX_RETRIES = 3  # Reintentos por fallo

# Cargar cache si existe
try:
    with open('geocoding_cache.json', 'r') as f:
        cache = json.load(f)
except FileNotFoundError:
    cache = {}

def limpiar_nombres_columnas(df):
    """Elimina espacios adicionales en los nombres de las columnas"""
    df.columns = df.columns.str.strip()
    return df

def limpiar_datos(df):
    """Preprocesamiento de datos críticos"""
    # Llenar valores esenciales y limpiar espacios
    df['Provincia'] = df['Provincia'].fillna('').str.strip().str[:20]
    df['Municipio'] = df['Municipio'].fillna('').str.strip().str[:20]
    df['Calle'] = df['Calle'].fillna('').str.strip().str[:50]
    return df

def construir_direccion(row):
    """Construcción optimizada de dirección con componentes"""
    componentes = {
        'calle': f"{row['Calle']} {row['No.']}".strip() if pd.notna(row['No.']) else row['Calle'],
        'sector': row['Sector'] if pd.notna(row['Sector']) else '',
        'municipio': row['Municipio'],
        'provincia': row['Provincia']
    }

    # Filtrar componentes vacíos
    return {k: v for k, v in componentes.items() if v}

def geocodificar_con_reintentos(componentes, intento=1):
    """Lógica de geocodificación con reintentos inteligentes"""
    try:
        resultado = gmaps.geocode(
            language='es',
            components={
                'route': componentes.get('calle', ''),
                'sublocality': componentes.get('sector', ''),
                'locality': componentes.get('municipio', ''),
                'administrative_area': componentes.get('provincia', ''),
                'country': 'DO'
            }
        )

        if resultado:
            loc = resultado[0]['geometry']['location']
            if 17.4 < loc['lat'] < 19.9 and -72.0 < loc['lng'] < -68.3:
                return loc['lat'], loc['lng']

        # Fallback a municipio-provincia
        if intento == 1 and componentes.get('municipio') and componentes.get('provincia'):
            time.sleep(1)
            return geocodificar_con_reintentos({
                'municipio': componentes['municipio'],
                'provincia': componentes['provincia']
            }, intento=2)

        return None, None

    except (ApiError, HTTPError, Timeout, TransportError) as e:
        if intento < MAX_RETRIES:
            sleep_time = 2 ** intento
            logging.warning(f"Reintento {intento} en {sleep_time}s: {e}")
            time.sleep(sleep_time)
            return geocodificar_con_reintentos(componentes, intento + 1)
        logging.error(f"Fallo definitivo: {e}")
        return None, None

def geocodificar_con_cache(componentes):
    """Geocodificación con cache para evitar solicitudes repetidas"""
    clave_cache = json.dumps(componentes, sort_keys=True)
    if clave_cache in cache:
        return cache[clave_cache]

    lat, lng = geocodificar_con_reintentos(componentes)
    cache[clave_cache] = (lat, lng)

    # Guardar cache actualizado
    with open('geocoding_cache.json', 'w') as f:
        json.dump(cache, f)

    return lat, lng

# Preprocesamiento
df = limpiar_nombres_columnas(df)  # Corregir nombres de columnas
df = limpiar_datos(df)  # Limpiar datos críticos

# Procesar solo direcciones únicas
direcciones_unicas = df[['Calle', 'No.', 'Sector', 'Municipio', 'Provincia']].drop_duplicates()
coordenadas_unicas = {}

for idx, row in direcciones_unicas.iterrows():
    componentes = construir_direccion(row)
    if not componentes.get('provincia') or not componentes.get('municipio'):
        logging.warning(f"Fila {idx}: Datos insuficientes")
        continue

    coordenadas_unicas[json.dumps(componentes, sort_keys=True)] = geocodificar_con_cache(componentes)

# Asignar coordenadas al DataFrame original
def obtener_coordenadas(row):
    componentes = construir_direccion(row)
    clave = json.dumps(componentes, sort_keys=True)
    return coordenadas_unicas.get(clave, (None, None))

df[['Latitud', 'Longitud']] = df.apply(obtener_coordenadas, axis=1, result_type='expand')

# Guardar resultados
df.to_excel("direcciones_con_coordenadas_final.xlsx", index=False)

print("Proceso completado")
print(f"Éxitos: {df[['Latitud', 'Longitud']].notnull().all(axis=1).sum()}")
print(f"Fallos: {df[['Latitud', 'Longitud']].isnull().any(axis=1).sum()}")



Proceso completado
Éxitos: 2807
Fallos: 38


In [23]:
fallos = df[df['Latitud'].isnull() | df['Longitud'].isnull()]
print(fallos[['Calle', 'No.', 'Sector', 'Municipio', 'Provincia']])

     Calle  No. Sector Municipio Provincia
2807        NaN    NaN                    
2808        NaN    NaN                    
2809        NaN    NaN                    
2810        NaN    NaN                    
2811        NaN    NaN                    
2812        NaN    NaN                    
2813        NaN    NaN                    
2814        NaN    NaN                    
2815        NaN    NaN                    
2816        NaN    NaN                    
2817        NaN    NaN                    
2818        NaN    NaN                    
2819        NaN    NaN                    
2820        NaN    NaN                    
2821        NaN    NaN                    
2822        NaN    NaN                    
2823        NaN    NaN                    
2824        NaN    NaN                    
2825        NaN    NaN                    
2826        NaN    NaN                    
2827        NaN    NaN                    
2828        NaN    NaN                    
2829       

In [35]:
df.info()

<class 'pandas.core.frame.DataFrame'>
Index: 2807 entries, 0 to 2806
Data columns (total 16 columns):
 #   Column                Non-Null Count  Dtype  
---  ------                --------------  -----  
 0   Cant.                 2807 non-null   int64  
 1   RNC                   2807 non-null   float64
 2   Nombre Comercial      2807 non-null   object 
 3   Situación             2807 non-null   object 
 4   Tipo de Persona       2807 non-null   object 
 5   Calle                 2802 non-null   object 
 6   No.                   2367 non-null   object 
 7   Sector                2791 non-null   object 
 8   Edif/Apt/Local        1603 non-null   object 
 9   Referencia            1129 non-null   object 
 10  Municipio             2807 non-null   object 
 11  Provincia             2807 non-null   object 
 12  Teléfono 
(Opcional)  2659 non-null   object 
 13  Ubicacion             2807 non-null   object 
 14  Latitud               2807 non-null   float64
 15  Longitud              2807

## Predecir Rutas

In [50]:


import numpy as np
from geopy.distance import geodesic
from sklearn.cluster import KMeans
from sklearn.metrics import pairwise_distances
import folium
from folium import plugins
from IPython.display import display

# --- FILTRADO Y PREPARACIÓN DE DATOS ---
valid_coords_mask = df[['Latitud', 'Longitud']].notnull().all(axis=1)
valid_coords_df = df[valid_coords_mask].copy()
coordenadas = np.array(list(zip(valid_coords_df["Latitud"], valid_coords_df["Longitud"])))

# --- CLUSTERING CON K-MEANS ---
num_clusters = 10  # Se desean 10 clústeres en total
kmeans = KMeans(n_clusters=num_clusters, n_init=10, random_state=42)
labels = kmeans.fit_predict(coordenadas)
centroids = kmeans.cluster_centers_

# ====================== NUEVO: REBALANCEAR CLÚSTERES PARA QUE NINGUNO EXCEDA 281 PUNTOS ======================
capacidad = 281  # Máximo de puntos por clúster

# Crear diccionario: clave = número de clúster, valor = lista de índices de puntos
clusters_dict = {i: [] for i in range(num_clusters)}
for idx, label in enumerate(labels):
    clusters_dict[label].append(idx)

# Iterar mientras se puedan hacer cambios
cambios = True
while cambios:
    cambios = False
    for cl in range(num_clusters):
        if len(clusters_dict[cl]) > capacidad:
            # Ordenar los puntos del clúster de mayor a menor distancia respecto al centroide
            points_sorted = sorted(clusters_dict[cl],
                                   key=lambda i: np.linalg.norm(coordenadas[i] - centroids[cl]),
                                   reverse=True)
            for point_idx in points_sorted:
                if len(clusters_dict[cl]) <= capacidad:
                    break
                # Calcular las distancias del punto a todos los centroides
                dists_to_all = np.linalg.norm(centroids - coordenadas[point_idx], axis=1)
                candidatos = np.argsort(dists_to_all)
                # Buscar el primer clúster candidato que no sea el actual y que tenga capacidad
                for cand in candidatos:
                    if cand != cl and len(clusters_dict[cand]) < capacidad:
                        clusters_dict[cand].append(point_idx)
                        clusters_dict[cl].remove(point_idx)
                        cambios = True
                        break

# Reconstruir el vector de etiquetas a partir del diccionario rebalaceado
new_labels = np.empty_like(labels)
for cl in range(num_clusters):
    for idx in clusters_dict[cl]:
        new_labels[idx] = cl
labels = new_labels
# ===================================================================================================================

# --- ALGORITMO GENÉTICO OPTIMIZADO PARA TSP ---
def tsp_genetico_optimizado(coordenadas, poblacion_size=30, generaciones=100, tasa_mutacion=0.1):
    n = len(coordenadas)

    # Si hay menos de 3 puntos, retornar la ruta trivial
    if n < 3:
        return list(range(n))

    # Precalcular matriz de distancias (Euclideana aproximada en km)
    dist_matrix = pairwise_distances(coordenadas) * 111  # 1° ≈ 111 km
    np.fill_diagonal(dist_matrix, 0)

    def calcular_fitness(ruta):
        distancia_total = np.sum(dist_matrix[ruta[:-1], ruta[1:]])
        return 1 / distancia_total if distancia_total > 0 else 1e-6  # evitar división por cero

    def generar_individuo():
        return np.random.permutation(n).tolist()

    poblacion = [generar_individuo() for _ in range(poblacion_size)]

    for _ in range(generaciones):
        # Selección por torneo
        padres = []
        for _ in range(poblacion_size):
            indices = np.random.choice(len(poblacion), 3, replace=False)
            candidatos = [poblacion[i] for i in indices]
            padres.append(max(candidatos, key=lambda x: calcular_fitness(x)))

        # Cruzamiento OX
        nueva_poblacion = []
        for i in range(0, poblacion_size, 2):
            p1, p2 = padres[i], padres[i+1]
            punto_cruce = np.random.randint(1, n-1)
            hijo = p1[:punto_cruce] + [g for g in p2 if g not in p1[:punto_cruce]]
            nueva_poblacion.append(hijo)
            nueva_poblacion.append(p2)

        # Mutación
        for ind in nueva_poblacion:
            if np.random.rand() < tasa_mutacion:
                i, j = np.random.choice(n, 2, replace=False)
                ind[i], ind[j] = ind[j], ind[i]

    return max(poblacion, key=lambda x: calcular_fitness(x))

# --- OPTIMIZAR RUTAS POR CLÚSTER ---
rutas_optimas = []
for cluster_id in range(num_clusters):
    # Filtrar coordenadas del clúster según las etiquetas rebalaceadas
    mascara_cluster = (labels == cluster_id)
    coords_cluster = coordenadas[mascara_cluster]

    # Optimizar ruta solo si hay más de 1 punto
    if len(coords_cluster) > 1:
        ruta_optimizada = tsp_genetico_optimizado(coords_cluster)
        rutas_optimas.append(ruta_optimizada)
    else:
        rutas_optimas.append([])

# --- VISUALIZACIÓN ---
# Configurar mapa centrado en República Dominicana
mapa = folium.Map(location=[18.47, -69.93], zoom_start=9)
plugins.Fullscreen().add_to(mapa)

# Paleta de colores para clusters
colores = [
    '#FF0000', '#0000FF', '#00FF00', '#FFA500', '#800080',
    '#FFC0CB', '#008080', '#A52A2A', '#808000', '#00FFFF'
]
# Si se necesitan más colores, se añaden
if num_clusters > len(colores):
    import random
    while len(colores) < num_clusters:
        colores.append("#" + "".join([random.choice('0123456789ABCDEF') for _ in range(6)]))

# Añadir rutas al mapa
for cluster_id, ruta in enumerate(rutas_optimas):
    if len(ruta) < 2:
        continue

    # Obtener puntos del clúster
    mascara_cluster = (labels == cluster_id)
    coords_cluster = coordenadas[mascara_cluster]

    # Crear línea de ruta
    puntos_ruta = [coords_cluster[i] for i in ruta]
    folium.PolyLine(
        locations=puntos_ruta + [puntos_ruta[0]],
        color=colores[cluster_id],
        weight=2,
        opacity=0.7,
        tooltip=f'Agente {cluster_id+1} - {len(ruta)} puntos'
    ).add_to(mapa)

# Ajustar vista a todos los puntos
mapa.fit_bounds([[coordenadas[:, 0].min(), coordenadas[:, 1].min()],
                 [coordenadas[:, 0].max(), coordenadas[:, 1].max()]])

# Mostrar mapa
mapa.get_root().width = "1000px"
mapa.get_root().height = "700px"
display(mapa)

# --- GENERACIÓN DE TABLAS ---
for cluster_id, ruta in enumerate(rutas_optimas):
    if len(ruta) == 0:
        continue

    # Obtener índices originales
    mascara_cluster = (labels == cluster_id)
    df_cluster = valid_coords_df[mascara_cluster].iloc[ruta]

    print(f"\n=== Ruta Agente {cluster_id+1} ({len(ruta)} puntos) ===")
    display(df_cluster[['Nombre Comercial', 'Latitud', 'Longitud']].head())





=== Ruta Agente 1 (281 puntos) ===


Unnamed: 0,Nombre Comercial,Latitud,Longitud
1214,LICURGAS TIENDAS DE LICORES SRL,19.324123,-69.552728
2783,INVERSIONES TER 126 SRL,19.297731,-69.569336
1119,MULLENER & CO RELATIONS SRL,19.315472,-69.575048
2389,PARAMIS EIRL,19.324123,-69.552728
412,CATHERINE NICOLE P. PRORIOL CURABA,19.324123,-69.552728



=== Ruta Agente 2 (281 puntos) ===


Unnamed: 0,Nombre Comercial,Latitud,Longitud
419,ALEXANDRA MATOS KERY,19.299298,-69.555916
316,VIRGINIA MOREL TINEO,19.299298,-69.555916
236,RICARDY SILVERIO LINO,19.299298,-69.555916
461,CASTINE SRL,19.299298,-69.555916
817,LOS MANGOS DE SAMANA S A,19.299298,-69.555916



=== Ruta Agente 3 (281 puntos) ===


Unnamed: 0,Nombre Comercial,Latitud,Longitud
350,FABRICE CHRISTOPHE CONCHARD,19.320189,-69.538861
732,FLY FOR FUN SRL,19.319538,-69.540707
1186,ASOCIACION DE SERVIDORES PUBLICOS DEL AYUNTAMI...,19.316796,-69.540696
1515,PARADISE INVESTORS LLC SRL,19.319538,-69.540707
1453,DEMOGUAL DE LAS TERRENAS SRL,19.319538,-69.540707



=== Ruta Agente 4 (281 puntos) ===


Unnamed: 0,Nombre Comercial,Latitud,Longitud
2599,INVERSIONES TAMADABA,19.307897,-69.548472
43,DEYBY BENJAMIN UREÑA MARTINEZ,19.305659,-69.547926
1863,TOU MAR DEL CARIBE SRL,19.308946,-69.550946
331,WERNER KIPFER,19.306765,-69.553912
2159,TRANSPORTE Y SERVICIOS FRIAS ENCARNACION SRL,19.303937,-69.548743



=== Ruta Agente 5 (281 puntos) ===


Unnamed: 0,Nombre Comercial,Latitud,Longitud
1300,CENTRO CRISTIANO FE ESPERANZA Y AMOR,19.205366,-69.341074
2693,IMMOMEXX SRL,19.322422,-69.541421
2515,FELIPE LUNA COLON,19.313832,-69.54368
945,PACO CABANA SRL,19.321636,-69.539334
26,NADIA DERRADJI EP. HERNARESTIENNE,19.321459,-69.540204



=== Ruta Agente 6 (281 puntos) ===


Unnamed: 0,Nombre Comercial,Latitud,Longitud
2706,DIFERCA RD SRL,19.299298,-69.555916
2000,GALERAS 6 SRL,19.299298,-69.555916
2742,CORPORACION 1624 SRL,19.299298,-69.555916
2126,CLINICA VETERINARIA VALAR SRL,19.299298,-69.555916
2728,INVERSIONES TER 300 EIRL,19.299298,-69.555916



=== Ruta Agente 7 (281 puntos) ===


Unnamed: 0,Nombre Comercial,Latitud,Longitud
812,NICOLA VENUTA,19.323287,-69.533418
96,HIPOLITO BEATO SILVEN,19.310508,-69.542377
62,RUTH ELIZABETH GUZMAN MARTINEZ,19.326295,-69.546611
1490,SANDRO GONZALO LODIS CORDOVEZ,19.323393,-69.531894
728,CORPORATION REAL ESTATE ALAUNAN INVESTMENT SRL,19.323287,-69.533418



=== Ruta Agente 8 (278 puntos) ===


Unnamed: 0,Nombre Comercial,Latitud,Longitud
1492,RUSSELLS GARDEN CAFE S A,19.299298,-69.555916
1069,INVERSIONES AXIOME EIRL,19.299298,-69.555916
1630,INMOBILIARIA CARIBISLA S A,19.299298,-69.555916
1135,CONSTRUCCIONES ECONOMICAS REALES ORDINARIAS EL...,19.299298,-69.555916
1837,INVERSIONES TER 235 EIRL,19.299298,-69.555916



=== Ruta Agente 9 (281 puntos) ===


Unnamed: 0,Nombre Comercial,Latitud,Longitud
1954,GAMA SOCIEDAD CIVIL INMOBILIARIA,19.323287,-69.533418
2208,INVERSIONES DIVIKA EIRL,19.307521,-69.543833
186,RUDDY CASTILLO ENRIQUEZ,19.22811,-69.613061
2499,LUZ CITANIA GARCIA,19.311964,-69.542975
235,JOHANNY MATA PORTES,19.312074,-69.543099



=== Ruta Agente 10 (281 puntos) ===


Unnamed: 0,Nombre Comercial,Latitud,Longitud
2326,BCO BITCOIN & CRYPTO OFFICE SRL,19.320702,-69.540492
196,DIONICIA SALOME,19.32077,-69.53835
1974,INVERSIONES TER 208 SRL,19.320615,-69.540484
2304,INVERSIONES FOURCHERIE SRL,19.310225,-69.548277
1129,JESSLIOSA 44 SRL,19.320631,-69.540485


## Deploy

In [None]:
import folium
import pandas as pd
import numpy as np
from geopy.distance import geodesic

# --------------------- FUNCIÓN: ORDENAR POR DISTANCIA MÁS CERCANA ---------------------
def ordenar_por_distancia(coords):
    """
    Implementa el algoritmo de Vecino Más Cercano para encontrar la ruta óptima.
    """
    if len(coords) == 0:
        return []

    n = len(coords)
    visitado = np.zeros(n, dtype=bool)
    ruta = [0]  # Empezamos desde el primer punto
    visitado[0] = True

    for _ in range(n - 1):
        ult_punto = coords[ruta[-1]]
        distancias = [
            geodesic(ult_punto, coords[i]).kilometers if not visitado[i] else np.inf
            for i in range(n)
        ]
        siguiente = np.argmin(distancias)
        ruta.append(siguiente)
        visitado[siguiente] = True

    return ruta

# --------------------- BLOQUE: EXTRAER RUTA PARA UN AGENTE Y MOSTRAR MAPA ---------------------
# Solicitar el número del agente (entre 1 y 10)
agent_number = int(input("Ingrese el número del agente (1 a 10): "))
cluster_id = agent_number - 1

# Filtrar los puntos correspondientes al clúster del agente
mask = (labels == cluster_id)
if mask.sum() == 0:
    print(f"No hay puntos asignados para el agente {agent_number}.")
else:
    # Extraer la tabla del clúster
    df_cluster = valid_coords_df[mask].copy()

    # Extraer las coordenadas
    coords_cluster = coordenadas[mask]

    # Ordenar la ruta por distancia más cercana
    ruta_ordenada = ordenar_por_distancia(coords_cluster)

    # Aplicar el orden a la tabla
    df_ruta = df_cluster.iloc[ruta_ordenada].copy()
    df_ruta.reset_index(drop=True, inplace=True)

    # Agregar una columna "Orden" para indicar el número de visita
    df_ruta["Orden"] = df_ruta.index + 1

    # Mostrar la tabla ordenada
    display(df_ruta[['Orden', 'Nombre Comercial', 'Latitud', 'Longitud']])

    # Exportar la tabla a CSV
    csv_filename = f"ruta_agente_{agent_number}.csv"
    df_ruta.to_csv(csv_filename, index=False)
    print(f"CSV generado: {csv_filename}")

    # Crear un mapa centrado en el primer punto de la ruta
    m = folium.Map(location=[coords_cluster[0][0], coords_cluster[0][1]], zoom_start=12)

    # Color único para los puntos del agente
    color_ruta = "blue"  # Puedes cambiar el color aquí

    # Agregar marcadores numerados con el mismo color
    for i, (lat, lon) in enumerate(df_ruta[['Latitud', 'Longitud']].values):
        folium.Marker(
            location=[lat, lon],
            icon=folium.Icon(color=color_ruta, icon="info-sign"),
            popup=f"Orden {i+1}: {df_ruta.iloc[i]['Nombre Comercial']}"
        ).add_to(m)

    # Mostrar el mapa
    display(m)
