In [1]:
import pandas as pd
import numpy as np
import random
import plotly.express as px
import plotly.graph_objects as go

In [2]:
# Abrir documento con los datos de la clasificación de los micro-viajes
df = pd.read_csv("datos_cluster_completo.csv", sep=";")
# Cálcular pendiente en grados
df['Grade_pos_200m'] = np.arctan(df['Pend200_pos_mean']) * 180 / np.pi ## Pendiente en º
df['Grade_posmax_200m'] = np.arctan(df['Pend200_pos_max']) * 180 / np.pi ## Pendiente en º
df['Grade_neg_200m'] = np.arctan(df['Pend200_neg_mean']) * 180 / np.pi ## Pendiente en º
df['Grade_negmax_200m'] = np.arctan(df['Pend200_neg_max']) * 180 / np.pi ## Pendiente en º

In [3]:
def parametros(df1): #Promedio y desviación estandar de los parametros de micro-viajes
    ####################### VELOCIDADES #######################
    # Velocidad media
    Sp_mean = df1["Speed_mean"].mean()
    std_Sp = df1["Speed_mean"].std()
    # Velocidad máxima
    Sp_max_mean = df1["Speed_max"].mean()
    std_Sp_max = df1["Speed_max"].std()
    #################### ACELERACIONES #######################
    # Aceleración positiva
    Ac_pos_mean = df1["Acel_pos_mean"].mean()
    std_Ac_pos = df1["Acel_pos_mean"].std()
    # Aceleración positiva máxima
    Ac_pos_max_mean = df1["Acel_pos_max"].mean()
    std_pos_max = df1["Acel_pos_max"].std()
    # Aceleración negativa
    Ac_neg_mean = df1["Acel_neg_mean"].mean()
    std_Ac_neg = df1["Acel_neg_mean"].std()
    # Aceleración negativa máxima
    Ac_neg_max_mean = df1["Acel_neg_max"].mean()
    std_neg_max = df1["Acel_neg_max"].std()
    ################# DURACION/DISTANCIA ######################
    # Duración
    Duration_mean = df1["Duration"].mean()
    std_Duration = df1["Duration"].std()   
    # Distancia
    Distance_mean = df1["Distance"].mean()
    std_Distance = df1["Distance"].std()
    ############### TIEMPOS MOVIMIENTO y RALENTI ##############  
    # Tiempo en ralentí 
    t_idle_mean = df1["time_ralenti"].mean()
    std_t_idle = df1["time_ralenti"].std() 
    # Tiempo en movimiento 
    t_mov_mean = df1["time_mov"].mean()
    std_t_mov = df1["time_mov"].std() 
    ##################### PENDIENTES ######################### 
    # Pendiente positiva cada 200 m 
    P_pos_mean = df1["Grade_pos_200m"].mean()
    std_P_pos = df1["Grade_pos_200m"].std()
    # Pendiente positiva máxima cada 200 m 
    P_pos_max_mean = df1["Grade_posmax_200m"].mean()
    std_P_pos_max = df1["Grade_posmax_200m"].std()      
    # Pendiente negativa cada 200 m 
    P_neg_mean = df1["Grade_neg_200m"].mean()
    std_P_neg = df1["Grade_neg_200m"].std()
    # Pendiente neg máxima cada 200 m 
    P_neg_max_mean = df1["Grade_negmax_200m"].mean()
    std_P_neg_max = df1["Grade_negmax_200m"].std()   
    # Tiempo en pendiente positiva cada 200 m 
    t_P_pos_mean = df1["time_Pend200_pos"].mean()
    std_t_P_pos = df1["time_Pend200_pos"].std()
    # Tiempo en pendiente negativa cada 200 m 
    t_P_neg_mean = df1["time_Pend200_neg"].mean()
    std_t_P_neg = df1["time_Pend200_neg"].std()

    # Crear el DataFrame con los resultados
    results_df = pd.DataFrame()
    results_df["Parametro"] = ["Distance", "Duration", "Speed", "Speed_max", "Acel_pos",
                                "Acel_pos_max", "Acel_neg", "Acel_neg_max", "Idle_t",
                                "Move_time", "Grade_pos", "Grade_pos_max", "Grade_neg",
                                "Grade_neg_max", "Grade_pos_time", "Grade_neg_time"]
    results_df["Mean"] = [Distance_mean, Duration_mean, Sp_mean, Sp_max_mean, Ac_pos_mean,
                          Ac_pos_max_mean, Ac_neg_mean, Ac_neg_max_mean, t_idle_mean,
                          t_mov_mean, P_pos_mean, P_pos_max_mean, P_neg_mean,
                          P_neg_max_mean, t_P_pos_mean, t_P_neg_mean]
    results_df["std"] = [std_Distance, std_Duration, std_Sp,std_Sp_max, std_Ac_pos,
                         std_pos_max, std_Ac_neg, std_neg_max, std_t_idle,
                         std_t_mov, std_P_pos, std_P_pos_max, std_P_neg,
                         std_P_neg_max, std_t_P_pos, std_t_P_neg]
    
    # Redondear los valores a dos decimales
    results_df["Mean"] = results_df["Mean"].round(5)
    results_df["std"] = results_df["std"].round(5)
    
    return results_df

In [4]:
# Crear un dataframe para cada grupo
df_G1 = df[df["Cluster"]==1].copy()
df_G2 = df[df["Cluster"]==2].copy()
df_G3 = df[df["Cluster"]==3].copy()
df_G4 = df[df["Cluster"]==4].copy()

In [5]:
# Cálcular parametros de cada grupo
P_df_G1 = parametros(df_G1)
P_df_G1 = P_df_G1.rename(columns={"Mean": "Mean_C_1", "std": "std_C_1"})
P_df_G2 = parametros(df_G2)
P_df_G2 = P_df_G2.rename(columns={"Mean": "Mean_C_2", "std": "std_C_2"})
P_df_G3 = parametros(df_G3)
P_df_G3 = P_df_G3.rename(columns={"Mean": "Mean_C_3", "std": "std_C_3"})
P_df_G4 = parametros(df_G4)
P_df_G4 = P_df_G4.rename(columns={"Mean": "Mean_C_4", "std": "std_C_4"})

In [6]:
# organizar un solo dataframe con todos los parámetros de los grupos
P_df = pd.concat([P_df_G1, P_df_G3.iloc[:,1:3], P_df_G2.iloc[:,1:3], P_df_G4.iloc[:,1:3]], axis=1)
# guardar en un documento de excel los parámetros :
P_df.to_excel('Parametros_grupos.xlsx', index=False)
P_df

Unnamed: 0,Parametro,Mean_C_1,std_C_1,Mean_C_3,std_C_3,Mean_C_2,std_C_2,Mean_C_4,std_C_4
0,Distance,124.59122,195.6889,307.92562,420.62063,963.14836,927.64624,8758.53126,5641.90247
1,Duration,50.38041,42.3757,78.57418,70.05178,132.98132,104.65033,658.91304,334.12488
2,Speed,6.00162,5.55033,9.68871,8.03461,23.45968,8.73091,47.31233,9.33831
3,Speed_max,16.28612,13.65201,22.9993,16.41155,49.14921,13.80726,80.0492,14.02447
4,Acel_pos,0.37343,0.19232,0.36766,0.16608,0.60003,0.23866,0.3622,0.09825
5,Acel_pos_max,0.81205,0.40289,0.9114,0.40508,1.59655,0.4417,1.7887,0.59865
6,Acel_neg,-0.19365,0.1329,-0.23048,0.13673,-0.462,0.17756,-0.36408,0.09632
7,Acel_neg_max,-0.75775,0.36094,-0.86543,0.37918,-1.52289,0.42951,-1.78422,0.47922
8,Idle_t,49.23453,26.12125,38.00399,27.28007,16.69283,15.24446,2.80701,3.20391
9,Move_time,55.60501,25.94423,65.42149,26.44743,84.66669,14.9829,97.36994,3.19245


In [7]:
# Determinar paryicipacion de cada grupo en el número global de microviales
M_V_totales = len(df)
Participacion_M_V_G1 = ((len(df_G1)) / len(df))*100
Participacion_M_V_G2 = ((len(df_G2)) / len(df))*100
Participacion_M_V_G3 = ((len(df_G3)) / len(df))*100
Participacion_M_V_G4 = ((len(df_G4)) / len(df))*100

# Imprimir los resultados
print(f"Los micro-viajes del grupo 1 representan el {round(Participacion_M_V_G1, 2)}% de los viajes totales")
print(f"Los micro-viajes del grupo 2 representan el {round(Participacion_M_V_G2, 2)}% de los viajes totales")
print(f"Los micro-viajes del grupo 3 representan el {round(Participacion_M_V_G3, 2)}% de los viajes totales")
print(f"Los micro-viajes del grupo 4 representan el {round(Participacion_M_V_G4, 2)}% de los viajes totales")

Los micro-viajes del grupo 1 representan el 28.5% de los viajes totales
Los micro-viajes del grupo 2 representan el 31.62% de los viajes totales
Los micro-viajes del grupo 3 representan el 36.18% de los viajes totales
Los micro-viajes del grupo 4 representan el 3.7% de los viajes totales


In [8]:
# Calcular el número total de microviajes
num_microviajes_totales = len(df)

# Calcular el número de microviajes para cada grupo
num_microviajes_grupo_1 = len(df_G1)
num_microviajes_grupo_2 = len(df_G2)
num_microviajes_grupo_3 = len(df_G3)
#num_microviajes_grupo_4 = len(df_G4)

num_M_V_G1_G3 = num_microviajes_grupo_1 + num_microviajes_grupo_2 + num_microviajes_grupo_3


# Calcular la participación de cada grupo en el número total de los grupos 1 a 2
participacion_grupo_1 = (num_microviajes_grupo_1 / num_M_V_G1_G3) * 100
participacion_grupo_2 = (num_microviajes_grupo_2 / num_M_V_G1_G3) * 100
participacion_grupo_3 = (num_microviajes_grupo_3 / num_M_V_G1_G3) * 100
#participacion_grupo_4 = (num_microviajes_grupo_4 / num_microviajes_totales) * 100

# Imprimir los resultados
print(f"Los micro-viajes del grupo 1 representan el {round(participacion_grupo_1, 2)}% de los viajes")
print(f"Los micro-viajes del grupo 2 representan el {round(participacion_grupo_2, 2)}% de los viajes")
print(f"Los micro-viajes del grupo 3 representan el {round(participacion_grupo_3, 2)}% de los viajes")
#print(f"Los micro-viajes del grupo 4 representan el {round(participacion_grupo_4, 2)}% de los viajes totales")

Los micro-viajes del grupo 1 representan el 29.6% de los viajes
Los micro-viajes del grupo 2 representan el 32.83% de los viajes
Los micro-viajes del grupo 3 representan el 37.57% de los viajes


In [9]:
Distancia_estimada = 14000 # metros

Aporte_G1 = Distancia_estimada*(participacion_grupo_1/100)
Aporte_G2 = Distancia_estimada*(participacion_grupo_2/100)
Aporte_G3 = Distancia_estimada*(participacion_grupo_3/100)


# Imprimir los resultados
print(f"Los micro-viajes del grupo 1 aportan el {round(Aporte_G1, 2)}m")
print(f"Los micro-viajes del grupo 2 aportan el {round(Aporte_G2, 2)}m")
print(f"Los micro-viajes del grupo 3 aportan el {round(Aporte_G3, 2)}m")

Los micro-viajes del grupo 1 aportan el 4143.81m
Los micro-viajes del grupo 2 aportan el 4596.43m
Los micro-viajes del grupo 3 aportan el 5259.75m


In [8]:
# Abrir documento con los datos de la clasificación de los micro-viajes
df_viajes = pd.read_excel("Consolidado_all_Drivers_procesamiento2024.xlsx")

In [9]:
# Mapear los valores de cluster del primer DataFrame al segundo DataFrame
df_viajes["Cluster"] = df_viajes["micro_ciclo"].map(df.set_index("micro_ciclo")["Cluster"])
df_viajes.to_excel('Consolidado_general_allDrives.xlsx', index=False)

In [10]:
df_viajes

Unnamed: 0,Driver,latitude,longitude,accuracy(m),altitude(m),speed(m/s),sat_used,sat_inview,Edad_conductor,Estrato_conductor,...,N_intervalo_200m,Pendiente_200m,R2_200m,distancia_km,distancia_m,speed_km_h,distancia_total,acel_m_s2,micro_ciclo,Cluster
0,8,6.305090,-75.581267,6.0,1763.494,0.000,6.0,40,44,2,...,0,-0.076520,0.400125,0.000000,0.000,0.0,0.000000,0.0,0,
1,8,6.305092,-75.581272,6.2,1763.494,0.000,5.0,39,44,2,...,0,-0.076520,0.400125,0.000000,0.000,0.0,0.000000,0.0,0,
2,8,6.305113,-75.581238,6.2,1763.394,0.000,6.0,39,44,2,...,0,-0.076520,0.400125,0.000000,0.000,0.0,0.000000,0.0,0,
3,8,6.305115,-75.581250,6.1,1763.394,0.000,8.0,39,44,2,...,0,-0.076520,0.400125,0.000000,0.000,0.0,0.000000,0.0,0,
4,8,6.305160,-75.581227,6.0,1763.394,0.000,8.0,39,44,2,...,0,-0.076520,0.400125,0.000000,0.000,0.0,0.000000,0.0,0,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
205370,8,6.305427,-75.581203,3.0,1768.195,0.000,20.0,47,44,2,...,37,-0.000396,0.026653,7.654684,7654.684,0.0,1461.055642,0.0,1863,3.0
205371,8,6.305427,-75.581203,3.0,1768.195,0.000,20.0,47,44,2,...,37,-0.000396,0.026653,7.654684,7654.684,0.0,1461.055642,0.0,1863,3.0
205372,8,6.305443,-75.581130,2.8,1767.795,0.149,21.0,47,44,2,...,37,-0.000396,0.026653,7.654833,7654.833,0.0,1461.055642,0.0,1863,3.0
205373,8,6.305457,-75.581112,2.7,1769.195,0.115,20.0,47,44,2,...,37,-0.000396,0.026653,7.654948,7654.948,0.0,1461.055642,0.0,1863,3.0


#### Abrir desde este punto

In [None]:
# Abrir documento con los datos de la clasificación de los micro-viajes
#df = pd.read_csv("datos_cluster_completo.csv", sep=";")


In [3]:
# Calcular el número total de microviajes
num_microviajes_totales = len(df)

# Calcular el número de microviajes para cada grupo
num_microviajes_grupo_1 = len(df[df["Cluster"]==1])
num_microviajes_grupo_2 = len(df[df["Cluster"]==2])
num_microviajes_grupo_3 = len(df[df["Cluster"]==3])


num_M_V_G1_G3 = num_microviajes_grupo_1 + num_microviajes_grupo_2 + num_microviajes_grupo_3

# Calcular la participación de cada grupo en el número total de los grupos 1 a 2
participacion_grupo_1 = (num_microviajes_grupo_1 / num_M_V_G1_G3) * 100
participacion_grupo_2 = (num_microviajes_grupo_2 / num_M_V_G1_G3) * 100
participacion_grupo_3 = (num_microviajes_grupo_3 / num_M_V_G1_G3) * 100


# Imprimir los resultados
print(f"Los micro-viajes del grupo 1 representan el {round(participacion_grupo_1, 2)}% de los viajes")
print(f"Los micro-viajes del grupo 2 representan el {round(participacion_grupo_2, 2)}% de los viajes")
print(f"Los micro-viajes del grupo 3 representan el {round(participacion_grupo_3, 2)}% de los viajes")
#print(f"Los micro-viajes del grupo 4 representan el {round(participacion_grupo_4, 2)}% de los viajes totales")

Distancia_estimada = 12000 # metros Encuesta origen destino 8km, TFG Juan 11.4, AMVA 14km

Aporte_G1 = Distancia_estimada*(participacion_grupo_1/100)
Aporte_G2 = Distancia_estimada*(participacion_grupo_2/100)
Aporte_G3 = Distancia_estimada*(participacion_grupo_3/100)


# Imprimir los resultados
print(f"Los micro-viajes del grupo 1 aportan el {round(Aporte_G1, 2)}m")
print(f"Los micro-viajes del grupo 2 aportan el {round(Aporte_G2, 2)}m")
print(f"Los micro-viajes del grupo 3 aportan el {round(Aporte_G3, 2)}m")

Los micro-viajes del grupo 1 representan el 29.6% de los viajes
Los micro-viajes del grupo 2 representan el 32.83% de los viajes
Los micro-viajes del grupo 3 representan el 37.57% de los viajes
Los micro-viajes del grupo 1 aportan el 3551.84m
Los micro-viajes del grupo 2 aportan el 3939.8m
Los micro-viajes del grupo 3 aportan el 4508.36m


In [4]:
# Utilizar dataframe df = pd.read_csv("datos_cluster_completo.csv", sep=";")

def M_V_Aleatorios (df1, cluster, distancia_requerida):
    df_cluster = df1[df1["Cluster"]==cluster].copy() # Filtrado por cluster
    #print(df_cluster)

    distancia_total = 0
    microviajes_seleccionados = []
    # Selección aleatoria de micro_viajes hasta que la suma de las distancias sea menor que la distancia requerida
    while distancia_total < distancia_requerida:
        # Seleccionar aleatoriamente un micro_viaje
        microviaje = random.choice(df_cluster.index)
        # Agregar la distancia del micro_viaje seleccionado a la distancia total
        distancia_total += df_cluster.loc[microviaje, 'Distance']
        # Agregar el índice del micro_viaje seleccionado a la lista de micro_viajes seleccionados
        microviajes_seleccionados.append(microviaje)

        # Crear un nuevo DataFrame con los micro_viajes seleccionados
    df_seleccionados = df_cluster.loc[microviajes_seleccionados]

    return df_seleccionados

In [135]:
# Seleccion de micro_viajes cluster 1
cluster = 1
df_seleccionados_C1 = M_V_Aleatorios(df, cluster, Aporte_G1)
# Seleccion de micro_viajes cluster 2
cluster = 2
df_seleccionados_C2 = M_V_Aleatorios(df, cluster, Aporte_G2)
# Seleccion de micro_viajes cluster 3
cluster = 3
df_seleccionados_C3 = M_V_Aleatorios(df, cluster, Aporte_G3)


aporte_C1 = sum(df_seleccionados_C1["Distance"])
print(f"Los micro-viajes del grupo 1 seleccionados de forma aleatoria aportan {round(aporte_C1, 2)}m al ciclo")
aporte_C2 = sum(df_seleccionados_C2["Distance"])
print(f"Los micro-viajes del grupo 2 seleccionados de forma aleatoria aportan {round(aporte_C2, 2)}m al ciclo")
aporte_C3 = sum(df_seleccionados_C3["Distance"])
print(f"Los micro-viajes del grupo 3 seleccionados de forma aleatoria aportan {round(aporte_C3, 2)}m al ciclo")
print(" ")
total= aporte_C1+aporte_C2+aporte_C3
print(f"El ciclo urbano tiene una distancia recorrida de {round(total, 2)}m")

Los micro-viajes del grupo 1 seleccionados de forma aleatoria aportan 3844.78m al ciclo
Los micro-viajes del grupo 2 seleccionados de forma aleatoria aportan 4630.43m al ciclo
Los micro-viajes del grupo 3 seleccionados de forma aleatoria aportan 4749.88m al ciclo
 
El ciclo urbano tiene una distancia recorrida de 13225.09m


In [8]:
df_viajes = pd.read_excel('Consolidado_general_allDrives.xlsx')

In [136]:
# Extraer los DataFrames en función de la columna "micro_ciclo"
df_MV_Cluster1 = df_viajes[df_viajes['micro_ciclo'].isin(df_seleccionados_C1['micro_ciclo'])].copy()
df_MV_Cluster2 = df_viajes[df_viajes['micro_ciclo'].isin(df_seleccionados_C2['micro_ciclo'])].copy()
df_MV_Cluster3 = df_viajes[df_viajes['micro_ciclo'].isin(df_seleccionados_C3['micro_ciclo'])].copy()

In [137]:
Ciclo_AMVA_2024 = pd.concat([df_MV_Cluster1, df_MV_Cluster3, df_MV_Cluster2], axis=0)
Ciclo_AMVA_2024 = Ciclo_AMVA_2024.reset_index(drop=True) # Reindexar el DF
Ciclo_AMVA_2024["t_s"] = range(len(Ciclo_AMVA_2024)) # Crear nueva columna de tiempo 1 s
Ciclo_AMVA_2024['Grade_200m'] = np.arctan(Ciclo_AMVA_2024['Pendiente_200m']) * 180 / np.pi ## Pendiente en º

In [139]:
# Lista de nombres de columnas que deseas eliminar
columnas_a_eliminar = ['latitude', 'longitude', 'accuracy(m)', 'speed(m/s)', 'sat_used', 'sat_inview', 'Edad_conductor','altitude(m)', 'Travel',
       'Estrato_conductor', 'Genero', 'Escolaridad_conductor', 'Ocupación''Escolaridad', 'Marca', 'Referencia', 'Modelo','delta_tiempo', 
       'distancia', 'Altitude_api', 'Altitude_api_c','N_intervalo_100m', 'Pendiente_100m', 'R2_100m','N_intervalo_140m', 'Pendiente_140m', 
       'R2_140m', 'N_intervalo_160m','Pendiente_160m', 'R2_160m','distancia_km', 'distancia_m','distancia_total']

# Eliminar las columnas especificadas
Ciclo_AMVA_2024 = Ciclo_AMVA_2024.drop(columns=columnas_a_eliminar)
Ciclo_AMVA_2024.columns

Index(['Driver', 'speed_m_s', 't_s', 'Alt_api_c_f', 'N_intervalo_200m',
       'Pendiente_200m', 'R2_200m', 'speed_km_h', 'acel_m_s2', 'micro_ciclo',
       'Cluster', 'Grade_200m'],
      dtype='object')

In [140]:
# Ordenar las columnas
column_order = ['t_s', 'speed_m_s', 'speed_km_h', 'acel_m_s2', 'Alt_api_c_f', 'N_intervalo_200m','Pendiente_200m', 'R2_200m', 'Grade_200m', 'Driver','micro_ciclo','Cluster']
Ciclo_AMVA_2024 = Ciclo_AMVA_2024[column_order]
Ciclo_AMVA_2024['Cluster'] = Ciclo_AMVA_2024['Cluster'].astype(int)
Ciclo_AMVA_2024

Unnamed: 0,t_s,speed_m_s,speed_km_h,acel_m_s2,Alt_api_c_f,N_intervalo_200m,Pendiente_200m,R2_200m,Grade_200m,Driver,micro_ciclo,Cluster
0,0,0.000000,0.000000,0.303395,1496.338779,9,-0.016991,0.426911,-0.973421,8,23,1
1,1,0.632245,2.276081,0.756480,1496.320311,9,-0.016991,0.426911,-0.973421,8,23,1
2,2,1.417219,5.101989,0.835533,1496.289615,9,-0.016991,0.426911,-0.973421,8,23,1
3,3,2.259991,8.135966,0.821771,1496.248254,9,-0.016991,0.426911,-0.973421,8,23,1
4,4,2.995571,10.784056,0.578429,1496.197761,9,-0.016991,0.426911,-0.973421,8,23,1
...,...,...,...,...,...,...,...,...,...,...,...,...
3583,3583,0.000000,0.000000,0.000000,1434.027346,81,-0.001818,0.324263,-0.104141,1,1293,2
3584,3584,0.000000,0.000000,0.000000,1433.959517,81,-0.001818,0.324263,-0.104141,1,1293,2
3585,3585,0.000000,0.000000,0.000000,1433.909003,81,-0.001818,0.324263,-0.104141,1,1293,2
3586,3586,0.000000,0.000000,0.000000,1433.877557,81,-0.001818,0.324263,-0.104141,1,1293,2


In [None]:
Ciclo_AMVA_2024.to_excel('Ciclo_AMVA_2024.xlsx', index=False)
Ciclo_AMVA_2024

In [None]:
### FASE Extra urbana.
## Seleccionar de forma aleatoria un micro viaje  del cluster 4

df_ExtUrb = df[df["Cluster"]==4].copy() 
# Obtener los valores únicos de la columna 'micro_ciclo'
microviajes_disponibles = df_ExtUrb['micro_ciclo'].unique()

# Verificar si hay microviajes disponibles
if len(microviajes_disponibles) > 0:
    # Seleccionar aleatoriamente un microviaje de la lista
    microviajeX = random.choice(microviajes_disponibles)

df_viajeExtraUrb = df_viajes[df_viajes["micro_ciclo"]==microviajeX].copy()
df_viajeExtraUrb['Grade_200m'] = np.arctan(df_viajeExtraUrb['Pendiente_200m']) * 180 / np.pi ## Pendiente en º
# Lista de nombres de columnas que deseas eliminar
columnas_a_eliminar = ['latitude', 'longitude', 'accuracy(m)', 'speed(m/s)', 'sat_used', 'sat_inview', 'Edad_conductor','altitude(m)', 'Travel',
       'Estrato_conductor', 'Genero', 'Escolaridad_conductor', 'Ocupación','Escolaridad', 'Marca', 'Referencia', 'Modelo','delta_tiempo', 'distancia', 
       'Altitude_api', 'Altitude_api_c','N_intervalo_100m', 'Pendiente_100m', 'R2_100m','N_intervalo_140m', 'Pendiente_140m', 'R2_140m', 'N_intervalo_160m',
       'Pendiente_160m', 'R2_160m','distancia_km', 'distancia_m','distancia_total']

# Eliminar las columnas especificadas
df_viajeExtraUrb = df_viajeExtraUrb.drop(columns=columnas_a_eliminar)
# Ordenar las columnas
column_order = ['t_s', 'speed_m_s', 'speed_km_h', 'acel_m_s2', 'Alt_api_c_f', 'N_intervalo_200m','Pendiente_200m', 'R2_200m', 'Grade_200m', 'Driver','micro_ciclo','Cluster']
df_viajeExtraUrb = df_viajeExtraUrb[column_order]
df_viajeExtraUrb['Cluster'] = df_viajeExtraUrb['Cluster'].astype(int)

CicloFULL_AMVA_2024 = pd.concat([Ciclo_AMVA_2024, df_viajeExtraUrb], axis=0)
CicloFULL_AMVA_2024 = CicloFULL_AMVA_2024.reset_index(drop=True) # Reindexar el DF
CicloFULL_AMVA_2024["t_s"] = range(len(CicloFULL_AMVA_2024)) # Crear nueva columna de tiempo 1 s

In [154]:
dis = df[df["micro_ciclo"]==microviajeX]["Distance"]
dis

70    13286.5421
Name: Distance, dtype: float64

In [None]:
CicloFULL_AMVA_2024.to_excel('CicloFULL_AMVA_2024.xlsx', index=False)
CicloFULL_AMVA_2024

## PARA GRAFICOS USAR DF GUARDADOS

In [2]:
CicloFULL_AMVA_2024 = pd.read_excel('CicloFULL_AMVA_2024.xlsx')
Ciclo_AMVA_2024 = pd.read_excel('Ciclo_AMVA_2024.xlsx')

In [4]:
import plotly.graph_objs as go

# Crear una lista de colores para cada cluster
colores_clusters = {
    1: 'blue',
    2: 'orange',
    3: 'green',
    4: 'red'
}

# Crear una lista de trazos, uno para cada cluster
trazos = []
for cluster, datos_cluster in Ciclo_AMVA_2024.groupby('Cluster'):
    trazo = go.Scatter(
        x=datos_cluster['t_s'],
        y=datos_cluster['speed_km_h'],
        mode='lines',
        name=f'Cluster {cluster}',
        line=dict(color=colores_clusters[cluster])  # Asignar color del cluster
    )
    trazos.append(trazo)

# Crear la figura con los trazos
fig = go.Figure(data=trazos)

# Agregar la segunda traza de datos
fig.add_trace(go.Scatter(x=Ciclo_AMVA_2024["t_s"], y=Ciclo_AMVA_2024["Grade_200m"], name='Grade',yaxis='y2',line=dict(color='Gray',width=1.2)))


# Actualizar el diseño del gráfico
fig.update_layout(legend=dict(yanchor="top",y=1,xanchor="left",x=0.2,
        orientation='h'),plot_bgcolor='white',paper_bgcolor='white', autosize=False,
    width=900,height=400, title_text="AMVA motorcycle cycle 2024",
    xaxis=dict(ticklen=40,showgrid=False,zeroline=True,zerolinecolor='black',zerolinewidth=1,title="Time [s]",title_standoff=10),
    yaxis=dict(ticklen=40,showgrid=False,zeroline=True,zerolinecolor='black',
               zerolinewidth=1,title='Speed [km/h]',title_standoff=10, range=[0, 180]),
    yaxis2=dict(ticklen=40,showgrid=False,zeroline=True,zerolinecolor='black',zerolinewidth=1,
                title='Grade [º]',title_standoff=10,range=[-70, 35], 
                overlaying='y', side='right', position=1
                ,showline=True,linecolor='black',linewidth=1))

# Mostrar el gráfico
fig.show()


########################################################################################################################################
### CICLO FULL

# Crear una lista de colores para cada cluster
colores_clusters = {
    1: 'blue',
    2: 'orange',
    3: 'green',
    4: 'red'
}

# Crear una lista de trazos, uno para cada cluster
trazos = []
for cluster, datos_cluster in CicloFULL_AMVA_2024.groupby('Cluster'):
    trazo = go.Scatter(
        x=datos_cluster['t_s'],
        y=datos_cluster['speed_km_h'],
        mode='lines',
        name=f'Cluster {cluster}',
        line=dict(color=colores_clusters[cluster])  # Asignar color del cluster
    )
    trazos.append(trazo)

# Crear la figura con los trazos
fig = go.Figure(data=trazos)

# Agregar la segunda traza de datos
fig.add_trace(go.Scatter(x=CicloFULL_AMVA_2024["t_s"], y=CicloFULL_AMVA_2024["Grade_200m"], name='Grade',yaxis='y2',line=dict(color='Gray',width=1.2)))

# Actualizar el diseño del gráfico
fig.update_layout(legend=dict(yanchor="top",y=1,xanchor="left",x=0.2,
        orientation='h'),plot_bgcolor='white',paper_bgcolor='white', autosize=False,
    width=900,height=400, title_text="AMVA motorcycle cycle 2024 + Extra Urban interval",
    xaxis=dict(ticklen=40,showgrid=False,zeroline=True,zerolinecolor='black',zerolinewidth=1,title="Time [s]",title_standoff=10),
    yaxis=dict(ticklen=40,showgrid=False,zeroline=True,zerolinecolor='black',
               zerolinewidth=1,title='Speed [km/h]',title_standoff=10, range=[0, 180]),
    yaxis2=dict(ticklen=40,showgrid=False,zeroline=True,zerolinecolor='black',zerolinewidth=1,
                title='Grade [º]',title_standoff=10,range=[-70, 35], 
                overlaying='y', side='right', position=1
                ,showline=True,linecolor='black',linewidth=1))

# Mostrar el gráfico
fig.show()
