# Escenario de Datos: "Logística Express"

In [22]:
import pandas as pd
import numpy as np

# 1. Envíos realizados por la mañana
envios_am = pd.DataFrame({
    'id_envio': ['E01', 'E02', 'E03'],
    'ciudad_destino': ['Bogota', 'Medellin', 'Cali'],
    'peso_kg': [5, 12, 8]
})

# 2. Envíos realizados por la tarde
envios_pm = pd.DataFrame({
    'id_envio': ['E04', 'E05', 'E06'],
    'ciudad_destino': ['Bogota', 'Cartagena', 'Medellin'],
    'peso_kg': [2, 15, 7]
})

# 3. Tarifario por ciudad (Nuestra tabla de referencia)
tarifas = pd.DataFrame({
    'ciudad': ['Bogota', 'Medellin', 'Cali', 'Barranquilla'],
    'precio_por_kg': [2.5, 3.0, 3.5, 4.0]
})

# Solución 1: Consolidación de Información

In [23]:
#Unir tablas
df_dia_completo = pd.concat([envios_am,envios_pm])
# Actualización de los indexes
df_dia_completo.index = range(df_dia_completo.shape[0])
print(df_dia_completo)

  id_envio ciudad_destino  peso_kg
0      E01         Bogota        5
1      E02       Medellin       12
2      E03           Cali        8
3      E04         Bogota        2
4      E05      Cartagena       15
5      E06       Medellin        7


# Solución 2: Enriquecimiento de Datos

In [24]:
# Se utilizan los parámetros 'left_on' y 'right_on' en pd.merge() porque
# las columnas clave tienen nombres diferentes en cada DataFrame.
# El parámetro 'on' solo se puede usar cuando ambas columnas tienen exactamente el mismo nombre.
df_precios =pd.merge(df_dia_completo,tarifas,left_on='ciudad_destino',right_on='ciudad',how='left')
print(df_precios)

  id_envio ciudad_destino  peso_kg    ciudad  precio_por_kg
0      E01         Bogota        5    Bogota            2.5
1      E02       Medellin       12  Medellin            3.0
2      E03           Cali        8      Cali            3.5
3      E04         Bogota        2    Bogota            2.5
4      E05      Cartagena       15       NaN            NaN
5      E06       Medellin        7  Medellin            3.0


# Solución 3:Auditoría de Cobertura

In [25]:
df_envios_ok = pd.merge(df_dia_completo,tarifas,left_on='ciudad_destino',right_on='ciudad',how='inner')
print(df_envios_ok)

#Se eliminó **Cartagena** del análisis, ya que el valor no aparece registrado en la columna **“ciudad”** de los dataframes.


  id_envio ciudad_destino  peso_kg    ciudad  precio_por_kg
0      E01         Bogota        5    Bogota            2.5
1      E02       Medellin       12  Medellin            3.0
2      E03           Cali        8      Cali            3.5
3      E04         Bogota        2    Bogota            2.5
4      E06       Medellin        7  Medellin            3.0


# Solución 4: Reporte Financiero Final

In [26]:
# Se crea df_total a partir de df_precios y se añade la columna
# 'costo_total', calculada como peso_kg * precio_por_kg.
# Los valores nulos en precio_por_kg se reemplazan por 0
df_total= df_precios.assign(
    costo_total = lambda x:x['peso_kg']* x['precio_por_kg'].fillna(0)
)

print(df_total)

  id_envio ciudad_destino  peso_kg    ciudad  precio_por_kg  costo_total
0      E01         Bogota        5    Bogota            2.5         12.5
1      E02       Medellin       12  Medellin            3.0         36.0
2      E03           Cali        8      Cali            3.5         28.0
3      E04         Bogota        2    Bogota            2.5          5.0
4      E05      Cartagena       15       NaN            NaN          0.0
5      E06       Medellin        7  Medellin            3.0         21.0
