In [1]:
## Importar todos los archivos de rutas
import os
import pandas as pd

# Directorios
ruta_raw = "Rutas_Raw"
ruta_cleaned = "Rutas_Cleaned"
ruta_cuadriculas = "Rutas_Cuadriculas"

### Separación de Cuadrículas y Limpieza de Archivos de Rutas para Exportación Organizada en CSVs Estandarizados

In [None]:
# Crear carpetas si no existen
os.makedirs(ruta_cleaned, exist_ok=True)
os.makedirs(ruta_cuadriculas, exist_ok=True)

# Lista para almacenar los DataFrames de cuadriculas
list_cuadriculas = []

# Obtener lista de archivos en Rutas_Raw
archivos = [f for f in os.listdir(ruta_raw) if f.endswith(".csv")]

for archivo in archivos:
    # Cargar el archivo CSV como DataFrame
    ruta_archivo = os.path.join(ruta_raw, archivo)
    df = pd.read_csv(ruta_archivo)

    # Extraer "ID_Ruta" y "CUADRICULA" en un nuevo DataFrame
    df_cuadricula = df[["ID_Ruta", "CUADRICULA"]].copy()

    # Explosión de la columna "CUADRICULA"
    df_cuadricula["CUADRICULA"] = df_cuadricula["CUADRICULA"].str.split(",")  # Dividir por coma
    df_cuadricula = df_cuadricula.explode("CUADRICULA").reset_index(drop=True)  # Crear una fila por cada valor

    # Añadir el DataFrame de cuadriculas a la lista
    list_cuadriculas.append(df_cuadricula)

    # Guardar en la carpeta Rutas_Cuadriculas
    #nombre_cuadricula = os.path.join(ruta_cuadriculas, archivo.replace(".csv", "_Cuadricula.csv"))
    #df_cuadricula.to_csv(nombre_cuadricula, index=False)

    # Eliminar "CUADRICULA" y otras columnas no deseadas del archivo original
    columnas_a_eliminar = ["CUADRICULA", "Provincia", "CC_AA", "ID", "ETAPA", "HUSO", "ID_SECTOR", "ID_CAMINO", 
                           "COD_CAMINO", "ID_ETAPA", "LONG_3D_GE", "NUM_CAMINO", "NOM_TOTAL", "XCENTROIDE",
                           "YCENTROIDE", "geometry", "source", "id.1", "fecha_edi", "recorrido", "estado",
                           "firme", "fecha_edit"]
    df_cleaned = df.drop(columns=[col for col in columnas_a_eliminar if col in df.columns])

    # Guardar el archivo limpio en Rutas_Cleaned
    nombre_cleaned = os.path.join(ruta_cleaned, archivo)
    df_cleaned.to_csv(nombre_cleaned, index=False)

    print(f"Procesado: {archivo}")

# Concatenar todos los DataFrames de cuadriculas en uno solo
df_combined_cuadriculas = pd.concat(list_cuadriculas, ignore_index=True)

# Guardar el archivo combinado en Rutas_Cuadriculas como "Rutas_Cuadriculas.csv"
df_combined_cuadriculas.to_csv(os.path.join(ruta_cuadriculas, "Rutas_Cuadriculas.csv"), index=False)

print("✔️ Todos los archivos han sido procesados correctamente.")

Procesado: rutas_Andalucía.csv
Procesado: rutas_Aragón.csv
Procesado: rutas_Canarias.csv
Procesado: rutas_Cantabria.csv
Procesado: rutas_Castilla-La_Mancha.csv
Procesado: rutas_Castilla_y_León.csv
Procesado: rutas_Cataluña_Catalunya.csv
Procesado: rutas_Ciudad_de_Ceuta.csv
Procesado: rutas_Comunidad_de_Madrid.csv
Procesado: rutas_Comunidad_Foral_de_Navarra.csv
Procesado: rutas_Comunitat_Valenciana.csv
Procesado: rutas_Extremadura.csv
Procesado: rutas_Galicia.csv
Procesado: rutas_Illes_Balears.csv
Procesado: rutas_La_Rioja.csv
Procesado: rutas_País_Vasco_Euskadi.csv
Procesado: rutas_Principado_de_Asturias.csv
Procesado: rutas_Región_de_Murcia.csv
✔️ Todos los archivos han sido procesados correctamente.


### Consolidación de Archivos de Rutas Limpias en un Único Dataset CSV Unificado

In [4]:
# Combinar todas las rutas en un solo archivo
dfs = [pd.read_csv(os.path.join(ruta_cleaned, archivo)) for archivo in os.listdir(ruta_cleaned)]
df = pd.concat(dfs)

# Guardar como un solo archivo
df.to_csv('RUTAS_TODAS.csv')