In [1]:
import pandas as pd
import os
import numpy as np
from scipy.signal import savgol_filter
import plotly.graph_objects as go
from scipy.integrate import simps



In [2]:
# Función para calculo de aceleracion. h ~ datos por segundo
def calcular_acel(df,h): # en m/s2
    vel = df["v_km_h_f"]
    v = np.array(vel)/3.6  # Pasa de km/h a m/s
    n = len(v)
    a = np.zeros(n)
    for i in range(n):
        if i == 0:
            a[i]=(-v[i+2] + 4*v[i+1] - 3*v[i])/(2*h)
            #print("i=0")
        elif i == 1:
            a[i]=(v[i+1] - v[i-1])/(2*h)
            #print("i=1")
        elif i == n-2:
            a[i]=(v[i+1] - v[i-1])/(2*h)
            #print("i=n-2")
        elif i == n-1:
            a[i]=(3*v[i] - 4*v[i-1] + v[i-2])/(2*h)
            #print("i=n-1")
        else:
            a[i] = (-v[i+2] + 8*v[i+1] - 8*v[i-1] + v[i-2])/(12*h)
    return(a)

import pandas as pd

def parametros_seccion(df1): 
    umbral = 0.1 #con valores de aceleración mayor a 0.1 m/s2. para ia, RPA y crucero
    
    # Calcular la distancia recorrida
    df1["v_m_s_f"] = df1["v_km_h_f"]/3.6
    distance_traveled = (simps(df1["v_m_s_f"].values, df1.t_s.values))  # En km
    # Calcular el tiempo total del recorrido
    total_time = (df1["t_s"].iloc[-1] - df1["t_s"].iloc[0])
    # Calcular la velocidad media
    speed_mean = (simps(df1["v_km_h_f"], df1["t_s"] * 1)) / (len(df1["t_s"]))
    # Calcular la velocidad máxima
    speed_max = df1["v_km_h_f"].max()
    # Calcular la velocidad máxima
    speed_mean_sup = (df1["v_km_h_f"].max()+speed_mean)/2
    # Calcular la aceleración media y máxima tanto negativa como positiva
    acel_pos_mean = df1[df1.acel_m_s2 > 0].acel_m_s2.mean()
    acel_pos_max = df1[df1.acel_m_s2 > 0].acel_m_s2.max()
    acel_neg_mean = df1[df1.acel_m_s2 <= 0].acel_m_s2.mean()
    acel_neg_max = df1[df1.acel_m_s2 <= 0].acel_m_s2.min()
    # Calcular tiempo en ralentí, tiempo en movimiento, tiempo en crucero
    time_ralenti = ((df1[df1.v_km_h_f <= 0].shape[0])) * (100 / total_time)
    time_mov = (df1[df1.v_km_h_f > 0].shape[0]) * (100 / total_time)
    
    t_crucero = (df1[(df1['ABS_Aceleracion'] <= 0.1) & (df1['v_km_h_f'] > 0)].shape[0]) * (100 / total_time)
    
    # Funcion que cuenta el numero de veces con valores de aceleración mayor a 0.1 m/s2.   
  
    df_filtered = df1[df1['acel_m_s2'] > umbral]
    n_datos = len(df_filtered)
    ## CALCULAR RPA
    # Calcular el producto de la velocidad por la aceleración [m3/s3 o W/kg]
    df1['vxa'] = df1['v_m_s_f']*df1["acel_m_s2"]
    # Calcular la distnacia recorrida del intervalo en metros
    distance_traveled =  (simps(df1["v_km_h_f"].divide(3.6).values,df1.t_s.values)) 
    # Calculo de velocidad media en cada intervalo         
    m_v_urban = df1['v_km_h_f'].mean()  
    # Extraer solo el dataframe con acel mayor a 0.1
    df_sort_Urban = df1[df1["acel_m_s2"]>0.1]
    # Ordenar de manera creciente de la vxa
    df_sort_vxa_urb = df_sort_Urban.sort_values(by='vxa')
    #Percentil para cada intervalo
    df_sort_vxa_urb['Percentil'] = range(1, len(df_sort_vxa_urb) + 1)
    df_sort_vxa_urb['Percentil']  = df_sort_vxa_urb['Percentil']/len(df_sort_vxa_urb)
    # interpolacion lineal para calcular el valor vxa para 0.95 en cada intervalo
    vxa_pos_urbano = df_sort_vxa_urb['vxa'].quantile(0.95, interpolation='linear')
    #Aceleració positiva relativa RPA
    RPA = (sum(df_sort_vxa_urb["vxa"]))/(distance_traveled)
    # Acumulado del valor absoluto de la derivada de la aceleracion
    ABS_Der_Acel = df1["Der_Acel_cumul"].max() #Acumulado del valor absoluto de la derivada de la aceleracion
    # Acumulado del valor absoluto de la derivada de la aceleracion por cada km recorrido
    ABS_Der_Acel_Per_distance = ABS_Der_Acel/(distance_traveled) #ABS_Der_Acel en cada km recorrido
    # Acumulado del valor absoluto de la aceleracion 
    ABS_Acel = df1['Acel_cumul'].max() #Acumulado del valor absoluto de la aceleracion
    # Acumulado del valor absoluto de la aceleracion por cada km recorrido
    ABS_Acel_Per_distance = ABS_Acel/(distance_traveled) #ABS_Acel en cada km recorrido
    # Indice XXX
    indiceX = (n_datos*RPA)/(total_time*((time_mov-t_crucero)/100))
    # Crear el DataFrame con los resultados
    results_df = pd.DataFrame(columns=["Variable", "Valor"])
    results_df["Variable"] = ["distance_traveled", "total_time", "speed_mean", "speed_max", "speed_mean_sup",
                              "acel_pos_mean", "acel_pos_max", "n_ia", "RPA", "acel_neg_mean", "acel_neg_max",
                              "time_ralenti", "time_mov","t_crucero", "ABS_Der_Acel", "ABS_Der_Acel/distance", "ABS_Acel", 
                              "ABS_Acel/distance", "indiceX"]
    results_df["Valor"] = [distance_traveled/1000, total_time, speed_mean, speed_max, speed_mean_sup,
                            acel_pos_mean, acel_pos_max, n_datos, RPA, acel_neg_mean, acel_neg_max,
                            time_ralenti, time_mov,t_crucero, ABS_Der_Acel, ABS_Der_Acel_Per_distance, ABS_Acel, 
                           ABS_Acel_Per_distance, indiceX]
    # Redondear los valores a dos decimales
    results_df["Valor"] = results_df["Valor"].round(5)
    
    return results_df


# Funcion para Calcular tiempo con velocidad por debajo de un umbral (intervalo Rural)
def umbral_ad_rural (df1):
    umbral = 60 #Velocidad minima del intervalo 
    # Calcular el tiempo total del recorrido
    total_time_1 = df1["t_s"].iloc[-1] - df1["t_s"].iloc[0]
    time_low = ((df1[df1.v_km_h_f<= umbral].shape[0]))*(100/total_time_1)
    time_high = ((df1[df1.v_km_h_f> umbral].shape[0]))*(100/total_time_1)
    print("El tiempo con velocidad por menor o igual a 60 km/h durante Intervalo Rural {:.1f} %".format(time_low))
    print("El tiempo con velocidad por mayor a 60 km/h durante Intervalo Rural {:.1f} %".format(time_high))

# Funcion para Calcular tiempo con velocidad por debajo de un umbral (intervalo Motorway)
def umbral_ad_aut (df1):
    umbral = 90 #Velocidad minima del intervalo 
    # Calcular el tiempo total del recorrido
    total_time_1 = df1["t_s"].iloc[-1] - df1["t_s"].iloc[0]
    time_low = ((df1[df1.v_km_h_f<= umbral].shape[0]))*(100/total_time_1)
    time_high = ((df1[df1.v_km_h_f> umbral].shape[0]))*(100/total_time_1)
    print("El tiempo con velocidad por menor o igual a 90 km/h durante Intervalo Motorway {:.1f} %".format(time_low))
    print("El tiempo con velocidad por mayor a 90 km/h durante Intervalo Motorway {:.1f} %".format(time_high))

    
def calcular_parametros_acel(df):
    Data_time = 1 # Un dato por segundo
    df = df.reset_index(drop=True) # Reindexar el DF
    df["v_m_s_f"] = df["v_km_h_f"]/3.6
    df["t_s"] = range(len(df)) # Crear nueva columna de tiempo con una frecuencia de 1hz
    df["acel_m_s2"] = calcular_acel(df,Data_time) 
    df['ABS_Aceleracion'] = abs(df['acel_m_s2'])
    df['Acel_cumul'] = df['ABS_Aceleracion'].cumsum()
    df['Derivada_Aceleracion'] = df['acel_m_s2'].diff()
    df['Derivada_Aceleracion'].fillna(0, inplace=True)
    df['ABS_Derivada_Aceleracion'] = abs(df['Derivada_Aceleracion'])
    df['Der_Acel_cumul'] = df['ABS_Derivada_Aceleracion'].cumsum()
    return df

In [3]:
# Ruta del directorio donde se encuentran los archivos Excel originales
directorio_origen = 'C:/Users/Lenovo/OneDrive - Universidad de Castilla-La Mancha/JAVIER_LONDONO/RDE_Development/01.Data_Acquisitions'

# Ruta del directorio donde se guardarán los archivos Excel modificados
directorio_destino = 'C:/Users/Lenovo/OneDrive - Universidad de Castilla-La Mancha/JAVIER_LONDONO/RDE_Development/03.Clasificacion'

# Lista para almacenar los nombres de los archivos Excel en el directorio de origen
archivos_excel = []

# Recorrer el directorio de origen y guardar los nombres de los archivos Excel
for archivo in os.listdir(directorio_origen):
    if archivo.endswith('.xlsx'):
        archivos_excel.append(archivo)

# Iterar sobre cada archivo Excel
for archivo in archivos_excel:
    # Ruta completa del archivo de origen
    ruta_origen = os.path.join(directorio_origen, archivo)
    
    # Cargar el archivo Excel en un DataFrame
    df = pd.read_excel(ruta_origen)
    
    # Aplicar la función para calcular los parámetros de aceleración
    df_modificado = calcular_parametros_acel(df)
    
    # Generar la ruta de destino para guardar el archivo modificado
    ruta_destino = os.path.join(directorio_destino, archivo)
    
    # Guardar el DataFrame modificado como un nuevo archivo Excel
    df_modificado.to_excel(ruta_destino, index=False)


In [4]:
import pandas as pd
import os

# Ruta del directorio donde se encuentran los archivos Excel
directorio = 'C:/Users/Lenovo/OneDrive - Universidad de Castilla-La Mancha/JAVIER_LONDONO/RDE_Development/03.Clasificacion'
directorio_guardar = 'C:/Users/Lenovo/OneDrive - Universidad de Castilla-La Mancha/JAVIER_LONDONO/RDE_Development/03.Clasificacion/Parametros Intervalos'

# Lista para almacenar los nombres de los archivos Excel
archivos_excel = []

# Lista para almacenar los DataFrames con los resultados
resultados = []

# Recorrer el directorio y guardar los nombres de los archivos Excel
for archivo in os.listdir(directorio):
    if archivo.endswith('2024.xlsx'):
        archivos_excel.append(archivo)

# Iterar sobre cada archivo Excel
for archivo in archivos_excel:
    # Ruta completa del archivo
    ruta_archivo = os.path.join(directorio, archivo)
    
    # Cargar el archivo Excel en un DataFrame
    df = pd.read_excel(ruta_archivo)
    


    # Aplicar la función para calcular los parámetros de sección
    df_resultados = parametros_seccion(df)

    
    # Generar la ruta de destino para guardar el archivo modificado
    ruta_destino = os.path.join(directorio_guardar, "P_"+archivo )
    
    # Guardar el DataFrame modificado como un nuevo archivo Excel
    df_resultados.to_excel(ruta_destino, index=False)




In [5]:
import pandas as pd
import os

def obtener_nombres_archivos(directorio, extension):
    return [archivo for archivo in os.listdir(directorio) if archivo.endswith(extension)]

def obtener_nombres_completos(nombres_archivos):
    return [os.path.splitext(archivo)[0] for archivo in nombres_archivos]

def obtener_nombres_finales(nombres_archivos, numeracion):
    return [nombre[11:-8] + str(num) for nombre, num in zip(nombres_archivos, numeracion)]

# Directorio donde se encuentran los archivos Excel
directorio = 'C:/Users/Lenovo/OneDrive - Universidad de Castilla-La Mancha/JAVIER_LONDONO/RDE_Development/03.Clasificacion/Parametros Intervalos'

# Obtener los nombres de los archivos Excel
archivos_excel = obtener_nombres_archivos(directorio, '2024.xlsx')

# Obtener los nombres base de los archivos (sin extensión)
nombres_archivos_base = obtener_nombres_completos(archivos_excel)

# Numeración para agregar a los nombres finales
Numeracion = [1, 2, 3, 1, 2, 3, 1, 2, 3]

# Obtener los nombres finales de los archivos
Nombres_r = obtener_nombres_finales(nombres_archivos_base, Numeracion)

# Lista para almacenar los DataFrames
dataframes = []

# Cargar los archivos Excel y cambiar el nombre de la segunda columna
for nombre_archivo in archivos_excel:
    # Cargar el archivo Excel
    ruta_archivo = os.path.join(directorio, nombre_archivo)
    df = pd.read_excel(ruta_archivo)
    # Cambiar el nombre de la segunda columna
    df.columns = [df.columns[0], Nombres_r.pop(0)]
    # Agregar el DataFrame a la lista
    dataframes.append(df)

# Combinar los DataFrames en uno solo
df_final = pd.concat([dataframes[0].iloc[:, :2]] + [df.iloc[:, 1] for df in dataframes[1:]], axis=1)
# Cambiar el nombre de la columna 'A' a 'NuevoNombre'
df_final = df_final.rename(columns={'Variable': 'Parameter'})
# Mostrar el DataFrame final
print(df_final)



                Parameter  Motorway_1  Motorway_2  Motorway_3     Rural_1  \
0       distance_traveled    33.80503    33.80646    33.87392    34.62031   
1              total_time  1052.00000  1076.00000  1119.00000  1713.00000   
2              speed_mean   115.57276   113.00208   108.88047    72.71477   
3               speed_max   137.17000   132.17000   135.76000    89.74000   
4          speed_mean_sup   126.37138   122.58604   122.32023    81.22739   
5           acel_pos_mean     0.16027     0.14493     0.36751     0.24588   
6            acel_pos_max     2.05301     2.59074     1.95880     2.03171   
7                    n_ia   222.00000   240.00000   437.00000   546.00000   
8                     RPA     0.04966     0.04790     0.16756     0.09695   
9           acel_neg_mean    -0.12556    -0.13705    -0.34992    -0.23231   
10           acel_neg_max    -2.64213    -1.60301    -2.16065    -3.12014   
11           time_ralenti     0.38023     0.18587     0.17873     0.93403   

In [6]:
# Transponer el DataFrame
df_final_T = df_final.transpose()
# Establecer la primera fila como nombres de columna
df_final_T.columns = df_final_T.iloc[0]
# Eliminar la primera fila (que ahora es el nombre de la columna)
df_final_T = df_final_T[1:]
# Actualizar Index y cambiar nombre a Ciclo
df_final_T.reset_index(inplace=True)
df_final_T.rename(columns={'index': 'ciclo'}, inplace=True)
# ver dataFrame
df_final_T

# guardar datos OBD motor en un archivo :
df_final_T.to_excel('C:/Users/Lenovo/OneDrive - Universidad de Castilla-La Mancha/JAVIER_LONDONO/RDE_Development/03.Clasificacion/Parametros Intervalos/Parametros_Intervalos.xlsx', index=False)

In [7]:
import os
import pandas as pd

def obtener_nombres_archivos(directorio, extension):
    return [archivo for archivo in os.listdir(directorio) if archivo.endswith(extension)]

def obtener_nombres_completos(nombres_archivos):
    return [os.path.splitext(archivo)[0] for archivo in nombres_archivos]

def obtener_nombres_finales(nombres_archivos, numeracion):
    return [nombre[11:-8] + str(num) for nombre, num in zip(nombres_archivos, numeracion)]

def generar_dataframe_equivalencias(directorio, extension, numeracion):
    # Obtener los nombres de los archivos Excel
    archivos_excel = obtener_nombres_archivos(directorio, extension)
    
    # Obtener los nombres base de los archivos (sin extensión)
    nombres_archivos_base = obtener_nombres_completos(archivos_excel)
    
    # Obtener los nombres finales de los archivos
    nombres_finales = obtener_nombres_finales(nombres_archivos_base, numeracion)
    
    # Crear el DataFrame con las equivalencias de nombres
    equivalencias_df = pd.DataFrame({'NombreOriginal': nombres_archivos_base, 'NombreFinal': nombres_finales})
    
    return equivalencias_df

# Directorio donde se encuentran los archivos Excel
directorio = 'C:/Users/Lenovo/OneDrive - Universidad de Castilla-La Mancha/JAVIER_LONDONO/RDE_Development/03.Clasificacion/Parametros Intervalos'

# Extensión de los archivos Excel
extension = '2024.xlsx'

# Numeración para agregar a los nombres finales
numeracion = [1, 2, 3, 1, 2, 3, 1, 2, 3]

# Generar el DataFrame con las equivalencias de nombres
equivalencias_df = generar_dataframe_equivalencias(directorio, extension, numeracion)

# Mostrar el DataFrame con las equivalencias de nombres
print(equivalencias_df)

# guardar datos OBD motor en un archivo CSV :
equivalencias_df.to_excel('C:/Users/Lenovo/OneDrive - Universidad de Castilla-La Mancha/JAVIER_LONDONO/RDE_Development/03.Clasificacion/Parametros Intervalos/Equivalencias_Intervalos.xlsx', index=False)


                 NombreOriginal NombreFinal
0  P_Interval_Motorway_05042024  Motorway_1
1  P_Interval_Motorway_15042024  Motorway_2
2  P_Interval_Motorway_29042024  Motorway_3
3     P_Interval_Rural_05042024     Rural_1
4     P_Interval_Rural_15042024     Rural_2
5     P_Interval_Rural_29042024     Rural_3
6     P_Interval_Urban_02042024     Urban_1
7     P_Interval_Urban_15042024     Urban_2
8     P_Interval_Urban_19042024     Urban_3


In [26]:
import plotly.graph_objects as go
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score

# Supongamos que tienes tu DataFrame Def_all_T con las columnas 'indiceXXX', 'ABS_Acel/distance' y 'ciclo'

# # Definir un diccionario que asigna formas a cada categoría
# shapes = {'Urban_1': 'circle', 'Urban_2': 'square', 'Rural_1': 'cross',
#           'Rural_2': 'x', 'Auto_1': 'triangle-down','Auto_2': 'triangle-up'}

# colors = {'Urban_1': 'gray', 'Urban_2': 'black', 'Rural_1': 'gray',
#           'Rural_2': 'black', 'Auto_1': 'gray','Auto_2': 'black'}

# Crear el gráfico de dispersión con diferentes formas y colores para cada categoría
fig = go.Figure()

# Iterar sobre cada categoría en tu lista predefinida de categorías
for categoria in df_final_T['ciclo'].unique():
    # Filtrar el DataFrame por la categoría actual
    df_categoria = df_final_T[df_final_T['ciclo'] == categoria]
    
#     # Agregar una traza para la categoría actual con la forma y color correspondientes
#     fig.add_trace(go.Scatter(
#         x=df_categoria['indiceX'],
#         y=df_categoria['ABS_Acel/distance'],
#         mode='markers',
#         name=categoria,
#         marker=dict(symbol=shapes[categoria], size=10, color=colors[categoria])
#     ))

    # Agregar una traza para la categoría actual con la forma y color correspondientes
    fig.add_trace(go.Scatter(
        x=df_categoria['RPA'],
        y=df_categoria['i'],
        mode='markers',
        name=categoria,
        marker=dict(symbol="x", size=10, color="black")
    ))
    
# Realizar la regresión lineal solo si hay más de dos muestras
if len(df_final_T) >= 2:
    X = df_final_T['RPA'].values.reshape(-1, 1)
    y = df_final_T['i'].values
    model = LinearRegression()
    model.fit(X, y)
    y_pred = model.predict(X)
    
    # Calcular el coeficiente de determinación (R2)
    r2 = r2_score(y, y_pred)
    
    # Agregar la línea de tendencia al gráfico
    fig.add_trace(go.Scatter(
        x=df_final_T['RPA'],
        y=y_pred,
        mode='lines',
        name=f'Regresión',
        line=dict(color='gray', dash='dash', width=1)
    ))

    # Agregar la ecuación de la línea de tendencia y el coeficiente de determinación al título del gráfico
    fig.update_layout(
        title_text=f'Regresión Lineal: y = {model.coef_[0]:.3f}x + {model.intercept_:.3f}, R² = {r2:.3f}',
        legend=dict(orientation="v", x=1, y=0.5),
        height=600,
        width=700,
        plot_bgcolor="white"
    )

# Mostrar el gráfico
fig.show()

In [25]:
df_final_T["i"] = (df_final_T["ABS_Acel"] / (df_final_T["n_ia"]))*((df_final_T["time_mov"]-df_final_T["t_crucero"])/100)
# df_final_T["i"] = (df_final_T["ABS_Acel"] / (df_final_T["n_ia"]))*((df_final_T["time_mov"]-df_final_T["t_crucero"])/100)

In [19]:
df_final_T

Parameter,ciclo,distance_traveled,total_time,speed_mean,speed_max,speed_mean_sup,acel_pos_mean,acel_pos_max,n_ia,RPA,...,acel_neg_max,time_ralenti,time_mov,t_crucero,ABS_Der_Acel,ABS_Der_Acel/distance,ABS_Acel,ABS_Acel/distance,indiceX,i
0,Motorway_1,33.80503,1052.0,115.57276,137.17,126.37138,0.16027,2.05301,222.0,0.04966,...,-2.64213,0.38023,99.71483,55.79848,72.88102,0.00216,148.25486,0.00439,0.02386,0.29328
1,Motorway_2,33.80646,1076.0,113.00208,132.17,122.58604,0.14493,2.59074,240.0,0.0479,...,-1.60301,0.18587,99.90706,53.99628,75.45972,0.00223,151.69931,0.00449,0.02327,0.290193
2,Motorway_3,33.87392,1119.0,108.88047,135.76,122.32023,0.36751,1.9588,437.0,0.16756,...,-2.16065,0.17873,99.91063,17.605,152.03472,0.00449,401.53056,0.01185,0.07951,0.756252
3,Rural_1,34.62031,1713.0,72.71477,89.74,81.22739,0.24588,2.03171,546.0,0.09695,...,-3.12014,0.93403,99.12434,34.26737,189.35231,0.00547,409.48657,0.01183,0.04765,0.486411
4,Rural_2,34.57223,1605.0,77.4969,89.09,83.29345,0.25495,1.88356,493.0,0.09907,...,-3.28079,0.49844,99.56386,37.94393,200.04583,0.00579,402.61968,0.01165,0.04939,0.503233
5,Rural_3,34.58639,2213.0,56.23803,67.76,61.99901,0.13206,1.03056,348.0,0.0422,...,-1.82731,0.58744,99.45775,69.27248,88.04537,0.00255,288.6912,0.00835,0.02198,0.250409
6,Urban_1,15.38732,1949.0,28.40735,59.19,43.79868,0.49459,2.32153,707.0,0.20612,...,-3.32778,15.49513,84.55618,13.64802,422.21065,0.02744,835.90579,0.05432,0.10545,0.838367
7,Urban_2,15.38433,1786.0,30.99249,60.18,45.58624,0.53238,2.53472,675.0,0.22671,...,-2.94606,13.49384,86.56215,13.60582,430.60231,0.02799,862.83287,0.05609,0.11744,0.93258
8,Urban_3,15.33228,2549.0,21.64558,42.09,31.86779,0.27224,1.94861,803.0,0.10355,...,-1.92199,14.75088,85.28835,25.02942,322.19907,0.02101,617.43981,0.04027,0.05414,0.463341


In [20]:
# guardar datos OBD motor en un archivo :
df_final_T.to_excel('C:/Users/Lenovo/OneDrive - Universidad de Castilla-La Mancha/JAVIER_LONDONO/RDE_Development/03.Clasificacion/Parametros Intervalos/Parametros_Intervalos.xlsx', index=False)