In [3]:
import pandas as pd
import re
from unidecode import unidecode
import os

In [6]:
# Palabras que suelen actuar como conectores en direcciones y que queremos tratar como separadores
SLUG_STOP_WORDS = ["con", "de", "del", "la", "las", "el", "los", "y", "a", "al", "en", "para", "por"]
ruta_archivo = r"D:\docs\trabajo\SecCultura\Cultura Ciudadana\Ambiente\Residuos\202505 Observación 100 puntos\202505 Puntos Observaciones Residuos.xlsx"

In [7]:
def crear_slug(texto_direccion):
    """
    Convierte un texto de dirección en un formato slug.
    Ejemplo: "Calle 1 con carrera 13" -> "calle-1-carrera-13"
    Ejemplo: "Avenida de los Héroes N° 24" -> "avenida-heroes-n-24"
    """
    if not isinstance(texto_direccion, str) or not texto_direccion.strip():
        return ""  # Retorna vacío si no es texto o está vacío/solo espacios

    # 1. Convertir a minúsculas y transliterar (quitar acentos, ñ -> n)
    slug = unidecode(str(texto_direccion)).lower()

    # 2. Reemplazar palabras de parada (stop words) específicas por un espacio.
    #    Esto ayuda a que se traten como separadores si están rodeadas de espacios.
    for word in SLUG_STOP_WORDS:
        slug = slug.replace(f" {word} ", " ") # Importante los espacios alrededor

    # 3. Reemplazar cualquier carácter que NO sea alfanumérico (letra, número) o un guion ya existente, por un solo guion.
    #    Esto incluye espacios, puntos, comas, #, °, etc.
    slug = re.sub(r'[^\w-]+', '-', slug)

    # 4. Reemplazar múltiples guiones seguidos por uno solo
    slug = re.sub(r'--+', '-', slug)

    # 5. Eliminar guiones al principio o al final del slug
    slug = slug.strip('-')

    return slug