In [None]:
import pandas as pd
import geopandas as gpd
import numpy as np
from shapely.geometry import Polygon
from dbfread import DBF
from jenkspy import jenks_breaks
import matplotlib.pyplot as plt

import datetime
import math

In [None]:
# Verificar columnas del DF, para ver columnas a sumar, y columnas a recalcular

# Asegúrate de que pandas muestre todas las columnas y expanda el ancho de la visualización
pd.set_option('display.max_columns', None)  # Muestra todas las columnas
#pd.set_option('display.max_colwidth', None)  # No limite el ancho de las columnas
pd.set_option('display.expand_frame_repr', False)  # Evita el corte de DataFrames grandes

## Tratar aforos y extraer HMD

In [None]:
aforos_ruta = r"C:\Users\AMIM GTAC\Downloads\InformeEvolucionPeriodica.csv"

ruta_salida_todos = r"C:\Users\AMIM GTAC\Desktop\MINERVA\Aforos vehiculares\Vallarta y Lopez Mateos HMD 2025.xlsx"


In [None]:

aforo = pd.read_csv(aforos_ruta)

aforo = aforo.drop(columns=['Label', 'Label.1', 'IntensidadPorPM_Fecha_label.1',
       'IntensidadPorPM_Fecha_IntensidadPorPM_Hora_label.1',
       'IntensidadPorPM_Fecha_IntensidadPorPM_Hora_Value_DataValue0.1'])

# Crear un diccionario base con las columnas seleccionadas
columnas_seleccionadas = {
    'IntensidadPorPM_Fecha_label': 'dia',
    'IntensidadPorPM_Fecha_IntensidadPorPM_Hora_label': 'hora',
    'IntensidadPorPM_Fecha_IntensidadPorPM_Hora_Value_DataValue0': 'aforo',
    'textbox6': 'sensor'
}

# Función para renombrar columnas con un prefijo
def renombrar_columnas(dataframe):
    return dataframe.rename(columns=columnas_seleccionadas)

# Renombrar las columnas en ambos DataFrames
aforo_renamed = renombrar_columnas(aforo)


#borrar filas sin información
aforo_limpio = aforo_renamed.dropna(ignore_index = True)
aforo_ajustado=aforo_limpio.copy()

#multiplicar valores por valor de ajuste
aforo_ajustado["aforo"] = np.ceil(aforo_ajustado["aforo"]*.35)

In [None]:
def procesar_aforo(df, sensor_id):
    # Filtrar por sensor
    df = df[df['sensor'] == sensor_id].copy()
    
    # Convertir 'dia' y 'hora' a datetime
    df['timestamp'] = pd.to_datetime(df['dia'] + ' ' + df['hora'], format='%d/%m/%Y %H:%M')
    
    # Generar sumas intercaladas por hora
    resultados = []
    for t in df['timestamp']:
        rango_inicio = t - pd.Timedelta(minutes=60)
        rango_fin = t 
        suma_aforo = df[(df['timestamp'] > rango_inicio) & (df['timestamp'] <= rango_fin)]['aforo'].sum()
        fila_original = df[df['timestamp'] == t].iloc[0]
        resultados.append({'dia': t.date(), 'cuarto_fin': fila_original['hora'],'aforo': fila_original['aforo'], 'hora_fin': t.time(),  'suma_aforo': suma_aforo})
    
    df_resultados = pd.DataFrame(resultados)
    
    # Obtener la hora de máxima demanda matutina y vespertina
    resumen = df_resultados.groupby('dia').agg(total_vehiculos=('aforo', 'sum'))
    
    max_matutino = df_resultados[(df_resultados['hora_fin'] >= pd.to_datetime('01:00').time()) & (df_resultados['hora_fin'] <= pd.to_datetime('12:45').time())]
    max_vespertino = df_resultados[(df_resultados['hora_fin'] >= pd.to_datetime('12:15').time()) & (df_resultados['hora_fin'] <= pd.to_datetime('23:45').time())]
    # max_6_9 = df_resultados[(df_resultados['hora_fin'] >= pd.to_datetime('06:15').time()) & (df_resultados['hora_fin'] <= pd.to_datetime('09:45').time())]
    # max_10_11 = df_resultados[(df_resultados['hora_fin'] >= pd.to_datetime('10:15').time()) & (df_resultados['hora_fin'] <= pd.to_datetime('11:45').time())]
    # max_13_15 = df_resultados[(df_resultados['hora_fin'] >= pd.to_datetime('13:15').time()) & (df_resultados['hora_fin'] <= pd.to_datetime('15:45').time())]
    # max_17_21 = df_resultados[(df_resultados['hora_fin'] >= pd.to_datetime('17:15').time()) & (df_resultados['hora_fin'] <= pd.to_datetime('21:45').time())]
    max_6_9 = df_resultados[(df_resultados['hora_fin'] >= pd.to_datetime('07:00').time()) & (df_resultados['hora_fin'] <= pd.to_datetime('09:00').time())]
    max_10_11 = df_resultados[(df_resultados['hora_fin'] >= pd.to_datetime('11:00').time()) & (df_resultados['hora_fin'] <= pd.to_datetime('11:00').time())]
    max_13_15 = df_resultados[(df_resultados['hora_fin'] >= pd.to_datetime('14:00').time()) & (df_resultados['hora_fin'] <= pd.to_datetime('15:00').time())]
    max_17_21 = df_resultados[(df_resultados['hora_fin'] >= pd.to_datetime('18:00').time()) & (df_resultados['hora_fin'] <= pd.to_datetime('21:00').time())]
    max_18_19 = df_resultados[(df_resultados['hora_fin'] >= pd.to_datetime('19:30').time()) & (df_resultados['hora_fin'] <= pd.to_datetime('19:30').time())]
    max_22_23 = df_resultados[(df_resultados['hora_fin'] >= pd.to_datetime('23:30').time()) & (df_resultados['hora_fin'] <= pd.to_datetime('23:30').time())]
    
    max_matutino = max_matutino.loc[max_matutino.groupby('dia')['suma_aforo'].idxmax(), ['dia', 'hora_fin', 'suma_aforo']]
    max_vespertino = max_vespertino.loc[max_vespertino.groupby('dia')['suma_aforo'].idxmax(), ['dia', 'hora_fin', 'suma_aforo']]
    max_6_9 =   max_6_9.loc[max_6_9.groupby('dia')['suma_aforo'].idxmax(), ['dia', 'hora_fin', 'suma_aforo']]
    max_10_11 = max_10_11.loc[max_10_11.groupby('dia')['suma_aforo'].idxmax(), ['dia', 'hora_fin', 'suma_aforo']]
    max_13_15 = max_13_15.loc[max_13_15.groupby('dia')['suma_aforo'].idxmax(), ['dia', 'hora_fin', 'suma_aforo']]
    max_17_21 = max_17_21.loc[max_17_21.groupby('dia')['suma_aforo'].idxmax(), ['dia', 'hora_fin', 'suma_aforo']]
    max_18_19 = max_18_19.loc[max_18_19.groupby('dia')['suma_aforo'].idxmax(), ['dia', 'hora_fin', 'suma_aforo']]
    max_22_23 = max_22_23.loc[max_22_23.groupby('dia')['suma_aforo'].idxmax(), ['dia', 'hora_fin', 'suma_aforo']]
     
    resumen = resumen.merge(max_matutino, on='dia', how='left').rename(columns={'hora_fin': 'hmd_am', 'suma_aforo':'afo_hmd_am' })
    resumen = resumen.merge(max_vespertino, on='dia', how='left').rename(columns={'hora_fin': 'hmd_pm', 'suma_aforo':'afo_hmd_pm'})
    resumen = resumen.merge(max_6_9  , on='dia', how='left').rename(columns={'hora_fin': 'hmd_6_9', 'suma_aforo':'afo_hmd_6_9'})
    resumen = resumen.merge(max_10_11, on='dia', how='left').rename(columns={'hora_fin': 'hmd_10_11', 'suma_aforo':'afo_hmd_10_11'})
    resumen = resumen.merge(max_13_15, on='dia', how='left').rename(columns={'hora_fin': 'hmd_13_15', 'suma_aforo':'afo_hmd_13_15'})
    resumen = resumen.merge(max_17_21, on='dia', how='left').rename(columns={'hora_fin': 'hmd_17_21', 'suma_aforo':'afo_hmd_17_21'})
    resumen = resumen.merge(max_18_19, on='dia', how='left').rename(columns={'hora_fin': 'hmd_18_19', 'suma_aforo':'afo_hmd_18_19'})
    resumen = resumen.merge(max_22_23, on='dia', how='left').rename(columns={'hora_fin': 'hmd_22_23', 'suma_aforo':'afo_hmd_22_23'})

    return df_resultados, resumen

### exportar todos

In [None]:
#obtener sensores únicos
sensores = aforo_ajustado['sensor'].unique()
     
# Crear un archivo Excel y escribir cada sensor en una hoja
with pd.ExcelWriter(ruta_salida_todos) as writer:
    for sensor in sensores:
        df_resultados, resumen = procesar_aforo(aforo_ajustado, sensor)
        resumen.to_excel(writer, sheet_name=sensor[:9], index=False)  # Limitar nombre de hoja a 9 caracteres


### exportar uno solo

In [None]:
#obtener sensores únicos
sensores = aforo_ajustado['sensor'].unique()
sensores

In [None]:
#Colocar sensor de interés en la fórmula
df_resultados, resumen = procesar_aforo(aforo_ajustado,  'ATA 14250 (AV. VALLARTA / AV. LOPEZ MATEOS)')

In [None]:
#revisar df de resumen
resumen

In [None]:
#revisar df de df_resultados
df_resultados

In [None]:
#Revisar un día especifico del DF de resultados
df_resultados.loc[df_resultados['dia']==datetime.date(2025, 2, 3)]

In [None]:
#Exportar cualquiera de los DF a Excel, en ruta personalizada 
df_resultados.to_excel(r"C:\Users\AMIM GTAC\Desktop\lazaro_vall_24f_3m_horas.xlsx")

## Gráficas

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Cargar los datos
ruta_archivo = r"C:\Users\AMIM GTAC\Downloads\250325 Minerva Adicionales - Hoja 3 (2).csv"  # Reemplaza con la ubicación de tu archivo
df = pd.read_csv(ruta_archivo)

In [None]:
# Asegurar que la columna 'Fecha' es tipo datetime
df['Fecha'] = pd.to_datetime(df['Fecha'])

# Convertir 'Hora' en minutos desde la medianoche
df['Hora_inicio'] = df['Hora'].str.split(' a ').str[0]  # Extraer la hora inicial
df['Hora_inicio'] = pd.to_datetime(df['Hora_inicio'], format='%H:%M').dt.hour * 60 + \
                    pd.to_datetime(df['Hora_inicio'], format='%H:%M').dt.minute


In [None]:
df

In [None]:
# Definir el orden correcto de los días
dias_ordenados = ["Lunes", "Martes", "Miércoles", "Jueves", "Viernes", "Sábado", "Domingo"]
df['Día'] = pd.Categorical(df['Día'], categories=dias_ordenados, ordered=True)

# Asignar un desplazamiento para cada día (1440 min = 1 día completo)
df['Tiempo_continuo'] = df['Hora_inicio'] + (df['Fecha'] - df['Fecha'].min()).dt.days * 1440


In [None]:
# Convertir 'Fecha' a datetime si no lo está
df['Fecha'] = pd.to_datetime(df['Fecha'])

# Ordenar por fecha y hora
df = df.sort_values(by=['Fecha', 'Hora_inicio'])

# Calcular el tiempo continuo en minutos desde el primer registro
df['Tiempo_continuo'] = (df['Fecha'] - df['Fecha'].min()).dt.days * 1440 + df['Hora_inicio']


In [None]:
import matplotlib

In [None]:
plt.rcParams['font.sans-serif'] = ['Montserrat']

In [None]:
# Crear la gráfica
plt.figure(figsize=(12, 6))
palette = sns.color_palette("husl", n_colors=len(dias_ordenados))

# Los colores principales
color1 = '#eab819'
color2 = '#465055'

# Crear una lista con los colores de la paleta (asignar uno a cada día)
colores = [color1, color2]  # Puedes agregar más colores si lo deseas

# Asumiendo que 'dias_ordenados' es una lista con los días que deseas graficar
for i, dia in enumerate(dias_ordenados):
    subset = df[df['Día'] == dia]
    # Asignar el color correspondiente a cada día
    color = colores[i % len(colores)]  # Esto garantiza que el color se repita si hay más días que colores
    plt.fill_between(subset['Tiempo_continuo'], subset['Aforo'], color=color, alpha=0.6, label=dia)


# Configurar etiquetas y líneas guía
plt.xlabel("Día de la semana", fontsize=12)
plt.ylabel("Aforo vehicular", fontsize=12)
plt.title("Aforo vehicular por día de la semana", fontsize=14)

# Etiquetas en el eje X para cada día
ticks_x = df.groupby("Día")["Tiempo_continuo"].mean().values
plt.xticks(ticks=ticks_x, labels=dias_ordenados, rotation=0)

# Definir la frecuencia de las líneas (6 horas en segundos)
intervalo_6h = 6 * 3600  # 6 horas en segundos

# Graficar líneas punteadas cada 6 horas
for i in range(0, int(df['Tiempo_continuo'].max()), intervalo_6h):
    plt.axvline(x=i, color='lightgray', linestyle='--', linewidth=0.5, alpha=0.3)

# # Leyenda
# plt.legend(title="Día de la semana")

plt.show()