# 📑 Ejercicios sobre **manipulación de datos** en Pandas (Parte 1)

## 🚚📦 Análisis de entregas logísticas
En este ejercicio trabajaremos con un conjunto de datos que representa **entregas de productos de una empresa de transportes** .
Analizaremos los tiempos de entrega, costes y otros aspectos usando Pandas.

In [1]:
from datetime import datetime, timedelta
import pandas as pd
import numpy as np
import random
from faker import Faker

faker = Faker()
fake = Faker('es_ES')

ciudades = ['Madrid', 'Barcelona', 'Valencia', 'Sevilla', 'Zaragoza', 'Bilbao', 'Málaga', 'Coruña']
transportes = ['Camión', 'Furgoneta Pequeña', 'Furgoneta Grande', 'Motocicleta']
estados = ['Entregado', 'Tránsito', 'Retrasado', 'Cancelado']
n = 95

# Estados con mayor probabilidad de 'Entregado'
estados_generados = random.choices(estados, weights=[0.6, 0.2, 0.15, 0.05], k=n)

# Inicializamos listas
fechas_entrada = []
fechas_entrega = []
dias_entrega = []

for estado in estados_generados:
    # Fecha de entrada siempre presente
    fecha_entrada = datetime.today() - timedelta(days=np.random.randint(10, 30))
    fechas_entrada.append(fecha_entrada.date().isoformat())

    if estado == 'Entregado':
        # Fecha de entrega posterior a la de entrada
        fecha_entrega = fecha_entrada + timedelta(days=np.random.randint(1, 10))
        fechas_entrega.append(fecha_entrega.date().isoformat())
        dias_entrega.append((fecha_entrega - fecha_entrada).days)
    else:
        fechas_entrega.append(None)
        dias_entrega.append(None)

# Crear DataFrame
data = {
    'ID_Entrega': [f'ENT{str(i).zfill(4)}' for i in range(1, n + 1)],
    'Destino': [random.choice(ciudades) for _ in range(n)],
    'Peso_kg': np.round(np.random.uniform(0.5, 50.0, n), 2),
    'Volumen_m3': np.round(np.random.uniform(0.01, 2.0, n), 3),
    'Costo_Envio': np.round(np.random.uniform(10.0, 500.0, n), 2),
    'Cliente': [fake.company()[:20] for _ in range(n)],
    'Medio_Entrega': [random.choice(transportes) for _ in range(n)],
    'Estado': estados_generados,
    'Fecha_Entrada': fechas_entrada,
    'Fecha_Entrega': fechas_entrega,
    'Tiempo_Entrega_Dias': dias_entrega
}

df = pd.DataFrame(data)


# Crear el DataFrame
df = pd.DataFrame(data)
df = df.set_index('ID_Entrega')

df.to_csv('datasets/entregas.csv', index=True)


df


Unnamed: 0_level_0,Destino,Peso_kg,Volumen_m3,Costo_Envio,Cliente,Medio_Entrega,Estado,Fecha_Entrada,Fecha_Entrega,Tiempo_Entrega_Dias
ID_Entrega,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
ENT0001,Coruña,25.66,0.727,488.92,Sanchez y Becerra S.,Camión,Entregado,2025-03-29,2025-04-02,4.0
ENT0002,Coruña,48.39,0.934,72.81,Agapito Puerta Domin,Furgoneta Pequeña,Entregado,2025-04-09,2025-04-17,8.0
ENT0003,Bilbao,35.75,1.162,352.55,Gomila y asociados S,Furgoneta Grande,Entregado,2025-03-26,2025-04-01,6.0
ENT0004,Sevilla,34.29,0.518,34.61,Arnaiz y Bayona S.L.,Furgoneta Pequeña,Entregado,2025-04-09,2025-04-16,7.0
ENT0005,Málaga,35.70,0.761,117.85,Quirós y Marcos S.L.,Furgoneta Grande,Tránsito,2025-03-30,,
...,...,...,...,...,...,...,...,...,...,...
ENT0091,Valencia,21.69,1.842,58.89,Pelayo y Vergara S.C,Camión,Retrasado,2025-04-10,,
ENT0092,Zaragoza,36.46,1.887,407.10,Inmobiliaria Nogués,Camión,Retrasado,2025-03-31,,
ENT0093,Coruña,34.05,1.245,340.55,Restauración Anglada,Furgoneta Pequeña,Entregado,2025-04-11,2025-04-19,8.0
ENT0094,Barcelona,49.34,0.166,302.73,Modesto Hoyos Segarr,Motocicleta,Entregado,2025-04-01,2025-04-07,6.0
