In [11]:
import pandas as pd

# Carga de datos limpios
df_ordenes = pd.read_csv('../output/historial_pedidos.csv')
df_cartera = pd.read_csv('../output/historial_cartera.csv')

# Cruce de datos para la tabla intermedia
tabla_intermedia = df_cartera[['ID', 'ORDEN ID']].copy()
tabla_intermedia.columns = ['ID_CARTERA', 'ID_ORDEN']


In [17]:
# Aseguramos que ambas columnas de ID tengan el mismo tipo para el merge
df_cartera['ORDEN_ID_LIMPIO'] = df_cartera['ORDEN_ID_LIMPIO'].astype(int)
df_ordenes['ID'] = df_ordenes['ID'].astype(int)

# Hacemos el merge: unimos la tabla de cartera con pedidos, usando el ID de la orden
tabla_intermedia = df_cartera.merge(
    df_ordenes[['ID', 'FECHA', 'TOTAL DE LA ORDEN', 'GANANCIA', 'TRANSPORTADORA']],
    left_on='ORDEN_ID_LIMPIO',
    right_on='ID',
    how='left'
)

# Renombramos la columna ID de pedidos para evitar confusión con ID de cartera
tabla_intermedia = tabla_intermedia.rename(columns={
    'ID_x': 'ID_CARTERA',
    'ID_y': 'ID_ORDEN',
    'FECHA': 'FECHA_ORDEN'
})

# Reordenamos columnas clave para el análisis
columnas_ordenadas = [
    'ID_CARTERA', 'ORDEN_ID_LIMPIO', 'ID_ORDEN', 'FECHA_ORDEN', 'FECHA', 'TIPO',
    'CATEGORIA_MOVIMIENTO', 'MOTIVO', 'MONTO', 'SALDO_POSTERIOR', 'ES_INGRESO', 'ES_EGRESO',
    'TOTAL DE LA ORDEN', 'GANANCIA', 'TRANSPORTADORA',
    'DIA', 'HORA', 'DIA_SEMANA', 'MES', 'AÑO'
]

# Filtramos solo las columnas que existen en tabla_intermedia
columnas_existentes = [col for col in columnas_ordenadas if col in tabla_intermedia.columns]
tabla_intermedia = tabla_intermedia[columnas_existentes]

# Mostramos el resultado final
print(tabla_intermedia.head())


   ID_CARTERA  ORDEN_ID_LIMPIO    ID_ORDEN     TIPO CATEGORIA_MOVIMIENTO  \
0   118531321         43058843  43058843.0   SALIDA     ASOCIADO A ORDEN   
1   118491730         43166015  43166015.0  ENTRADA     ASOCIADO A ORDEN   
2   118478071         43121642  43121642.0  ENTRADA     ASOCIADO A ORDEN   
3   118443351         43011547  43011547.0  ENTRADA     ASOCIADO A ORDEN   
4   118431787         42970302  42970302.0  ENTRADA     ASOCIADO A ORDEN   

     MOTIVO    MONTO  SALDO_POSTERIOR  ES_INGRESO  ES_EGRESO  \
0     FLETE  12049.0        1684824.7       False       True   
1  GANANCIA  36953.5        1696873.7        True      False   
2  GANANCIA  34236.5        1659920.2        True      False   
3  GANANCIA  39900.0        1625683.7        True      False   
4  GANANCIA  34236.5        1585783.7        True      False   

   TOTAL DE LA ORDEN  GANANCIA   TRANSPORTADORA         DIA      HORA  \
0           139900.0   82954.5  INTERRAPIDISIMO  2025-06-13  12:02:00   
1           

In [18]:
tabla_intermedia.to_csv('../output/tabla_intermedia.csv', index=False)
