# Ejercicios sobre **manipulación de datos** en Pandas

## 🚚📦 Análisis de entregas logísticas
En este ejercicio trabajaremos con un conjunto de datos que representa **entregas de productos de una empresa de transportes** .
Analizaremos los tiempos de entrega, costes y otros aspectos usando Pandas.

In [1]:
from datetime import datetime, timedelta
import pandas as pd
import numpy as np
import random
from faker import Faker

faker = Faker()
fake = Faker('es_ES')

ciudades = ['Madrid', 'Barcelona', 'Valencia', 'Sevilla', 'Zaragoza', 'Bilbao', 'Málaga', 'Coruña']
transportes = ['Camión', 'Furgoneta Pequeña', 'Furgoneta Grande', 'Motocicleta']
estados = ['Entregado', 'Tránsito', 'Retrasado', 'Cancelado']
n = 95

# Estados con mayor probabilidad de 'Entregado'
estados_generados = random.choices(estados, weights=[0.6, 0.2, 0.15, 0.05], k=n)

# Inicializamos listas
fechas_entrada = []
fechas_entrega = []
dias_entrega = []

for estado in estados_generados:
    # Fecha de entrada siempre presente
    fecha_entrada = datetime.today() - timedelta(days=np.random.randint(10, 30))
    fechas_entrada.append(fecha_entrada.date().isoformat())

    if estado == 'Entregado':
        # Fecha de entrega posterior a la de entrada
        fecha_entrega = fecha_entrada + timedelta(days=np.random.randint(1, 10))
        fechas_entrega.append(fecha_entrega.date().isoformat())
        dias_entrega.append((fecha_entrega - fecha_entrada).days)
    else:
        fechas_entrega.append(None)
        dias_entrega.append(None)

# Crear DataFrame
data = {
    'ID_Entrega': [f'ENT{str(i).zfill(4)}' for i in range(1, n + 1)],
    'Destino': [random.choice(ciudades) for _ in range(n)],
    'Peso_kg': np.round(np.random.uniform(0.5, 50.0, n), 2),
    'Volumen_m3': np.round(np.random.uniform(0.01, 2.0, n), 3),
    'Costo_Envio': np.round(np.random.uniform(10.0, 500.0, n), 2),
    'Cliente': [fake.company()[:20] for _ in range(n)],
    'Medio_Entrega': [random.choice(transportes) for _ in range(n)],
    'Estado': estados_generados,
    'Fecha_Entrada': fechas_entrada,
    'Fecha_Entrega': fechas_entrega,
    'Tiempo_Entrega_Dias': dias_entrega
}

df = pd.DataFrame(data)


# Crear el DataFrame
df = pd.DataFrame(data)
df = df.set_index('ID_Entrega')

df.to_csv('datasets/entregas.csv', index=True)


df


Unnamed: 0_level_0,Destino,Peso_kg,Volumen_m3,Costo_Envio,Cliente,Medio_Entrega,Estado,Fecha_Entrada,Fecha_Entrega,Tiempo_Entrega_Dias
ID_Entrega,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
ENT0001,Málaga,27.49,0.179,280.22,Sandoval y asociados,Camión,Entregado,2025-03-29,2025-04-06,8.0
ENT0002,Sevilla,30.71,1.650,39.99,Farmaceútica Integra,Camión,Entregado,2025-03-31,2025-04-07,7.0
ENT0003,Coruña,4.63,0.161,162.65,Construcción Camacho,Camión,Entregado,2025-03-30,2025-04-05,6.0
ENT0004,Bilbao,18.61,1.771,23.38,Puga y Bayo S.Coop.,Motocicleta,Entregado,2025-04-03,2025-04-12,9.0
ENT0005,Sevilla,13.06,0.666,280.97,Alberto Lerma Manso,Camión,Entregado,2025-04-07,2025-04-08,1.0
...,...,...,...,...,...,...,...,...,...,...
ENT0091,Madrid,36.89,0.133,320.62,Farmaceútica Alsina,Furgoneta Grande,Entregado,2025-04-03,2025-04-09,6.0
ENT0092,Zaragoza,26.19,1.796,467.50,Jenaro Santiago Muri,Furgoneta Grande,Entregado,2025-04-04,2025-04-10,6.0
ENT0093,Málaga,8.30,1.852,68.85,Consultoría RQW S.L.,Camión,Entregado,2025-04-05,2025-04-08,3.0
ENT0094,Zaragoza,33.70,0.864,355.13,Hnos Beltran S.L.,Motocicleta,Entregado,2025-04-04,2025-04-08,4.0


*********************

## 🔍 Ejercicio 1: Forma (nº filas x nº columnas) del Dataframe

Descubre el número de filas y columnas de los datosMuestra los primeros y últimos 5 registros del DataFrame usando `head()` y `tail()`.

In [2]:
# Ejercicio 1. Haz el ejercicio aquí
df.shape

(95, 10)

*********************

## 🔍 Ejercicio 2. Primeros y últimos registros

Muestra los primeros 6 registros del DataFrame usando `head()`.

Muestra los últimos 11 registros del DataFrame usando `tail()`.

In [3]:
# Ejercicio 2. Primeros
df.head(6)

Unnamed: 0_level_0,Destino,Peso_kg,Volumen_m3,Costo_Envio,Cliente,Medio_Entrega,Estado,Fecha_Entrada,Fecha_Entrega,Tiempo_Entrega_Dias
ID_Entrega,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
ENT0001,Málaga,27.49,0.179,280.22,Sandoval y asociados,Camión,Entregado,2025-03-29,2025-04-06,8.0
ENT0002,Sevilla,30.71,1.65,39.99,Farmaceútica Integra,Camión,Entregado,2025-03-31,2025-04-07,7.0
ENT0003,Coruña,4.63,0.161,162.65,Construcción Camacho,Camión,Entregado,2025-03-30,2025-04-05,6.0
ENT0004,Bilbao,18.61,1.771,23.38,Puga y Bayo S.Coop.,Motocicleta,Entregado,2025-04-03,2025-04-12,9.0
ENT0005,Sevilla,13.06,0.666,280.97,Alberto Lerma Manso,Camión,Entregado,2025-04-07,2025-04-08,1.0
ENT0006,Bilbao,5.49,0.595,397.85,Hnos Arnal S.C.P,Camión,Retrasado,2025-04-09,,


In [4]:
# Ejercicio 2. Últimos
df.tail(11)

Unnamed: 0_level_0,Destino,Peso_kg,Volumen_m3,Costo_Envio,Cliente,Medio_Entrega,Estado,Fecha_Entrada,Fecha_Entrega,Tiempo_Entrega_Dias
ID_Entrega,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
ENT0085,Zaragoza,18.89,1.206,475.91,Márquez y Carro S.A.,Motocicleta,Retrasado,2025-03-21,,
ENT0086,Barcelona,44.16,1.184,368.25,Tomás y Lillo S.A.,Furgoneta Pequeña,Tránsito,2025-04-05,,
ENT0087,Barcelona,12.53,1.171,486.84,Carnero y asociados,Furgoneta Pequeña,Retrasado,2025-03-27,,
ENT0088,Zaragoza,22.61,1.718,101.95,Minería Benavente y,Furgoneta Pequeña,Entregado,2025-04-04,2025-04-07,3.0
ENT0089,Bilbao,7.85,1.474,193.07,Losa y Luque S.Coop.,Camión,Entregado,2025-04-09,2025-04-15,6.0
ENT0090,Coruña,20.81,0.197,21.8,Compañía del Levante,Furgoneta Pequeña,Entregado,2025-04-06,2025-04-15,9.0
ENT0091,Madrid,36.89,0.133,320.62,Farmaceútica Alsina,Furgoneta Grande,Entregado,2025-04-03,2025-04-09,6.0
ENT0092,Zaragoza,26.19,1.796,467.5,Jenaro Santiago Muri,Furgoneta Grande,Entregado,2025-04-04,2025-04-10,6.0
ENT0093,Málaga,8.3,1.852,68.85,Consultoría RQW S.L.,Camión,Entregado,2025-04-05,2025-04-08,3.0
ENT0094,Zaragoza,33.7,0.864,355.13,Hnos Beltran S.L.,Motocicleta,Entregado,2025-04-04,2025-04-08,4.0


*********************

## 🔍 Ejercicio 3: Tiempo de entrega: media, mínimo y máximo

Calcula el tiempo **medio**, **máximo** y **mínimo** de días entrega.

In [5]:
# Ejercicio 3. Media
df.Tiempo_Entrega_Dias.mean()

5.278688524590164

In [6]:
# Ejercicio 3. Máximo
df.Tiempo_Entrega_Dias.max()

9.0

In [7]:
# Ejercicio 3. Mínimo
df.Tiempo_Entrega_Dias.min()

1.0

*********************

## 🔍 Ejercicio 4. Coste de entregas

Calcula el **coste total** de las entregas realizadas.

In [8]:
# Ejercicio 4. Coste total
df.Costo_Envio.sum()

24864.029999999995

*********************

## 🔍 Ejercicio 5. Entrega más rápida y más lenta

Usa `idxmin()` e `idxmax()` para encontrar las entregas con el menor y mayor tiempo.

In [9]:
# Ejercicio 5. Menor tiempo
df.Tiempo_Entrega_Dias.idxmin()

'ENT0005'

In [10]:
# Ejercicio 5. Mayor tiempo
df.Tiempo_Entrega_Dias.idxmax()

'ENT0004'

*********************

## 🔍 Ejercicio 6. Entregas por ciudad y medio de transporte

Averigua cuántas entregas se hicieron en cada ciudad con `value_counts()`. Haz lo mismo con los medios de transporte.

In [11]:
# Ejercicio 6. Ciudad
df.Destino.value_counts()

Destino
Zaragoza     18
Valencia     14
Madrid       13
Coruña       12
Bilbao       11
Málaga       10
Barcelona    10
Sevilla       7
Name: count, dtype: int64

In [12]:
# Ejercicio 6. Medio de transporte
df.Medio_Entrega.value_counts()

Medio_Entrega
Furgoneta Grande     36
Furgoneta Pequeña    22
Camión               21
Motocicleta          16
Name: count, dtype: int64

*********************

## 🔍 Ejercicio 7. Resumen estadístico

Obtén un resumen estadístico con `describe()` de todos los campos numéricos.

In [13]:
# Ejercicio 7_
df.describe()

Unnamed: 0,Peso_kg,Volumen_m3,Costo_Envio,Tiempo_Entrega_Dias
count,95.0,95.0,95.0,61.0
mean,24.427158,0.984653,261.726632,5.278689
std,13.695905,0.554697,137.889981,2.556894
min,1.98,0.075,14.89,1.0
25%,11.955,0.517,173.65,3.0
50%,23.36,0.92,290.0,6.0
75%,35.415,1.452,360.975,7.0
max,48.02,1.988,493.75,9.0


## 🔍 Ejercicio 8. Análisis estadístico

Viendo los resultados, responde a  estas preguntas:

**Peso** de las entregas:

1. El 25% de las entregas pesaron menos de ___ kg.
2. La mitad (50%) de las entregas pesaron menos de ____ kg.
3. El 75% de las entregas pesaron menos de ____ kg.
4. Ninguna de las entregas superó un peso de ___ kg.


**Tiempo de entrega** en días:

1. El 25% de las entregas se hicieron en un período inferior a  ____ días.
3. La mitad (50%)  de las entregas se hicieron en un período inferior a ____ días.
4. El 75% de las entregas se hicieron en un período inferior a ____ días.
5. Las entregas (100%) se hicieron en un período inferior a ____ días.


   