# Bootcamp de Análisis de Datos & IA
## Cuaderno de Ejercicios: Análisis de Viajes NCR
### Exploración y Transformación de Datos con Pandas

---

# 📚 Introducción

En este cuaderno de ejercicios aplicarás los conocimientos adquiridos sobre **exploración y análisis de datos con Pandas** utilizando el dataset `ncr_ride_bookings.csv`.

## 📊 Sobre el Dataset

El dataset contiene **150,000 registros** de reservas de viajes en la región de NCR (National Capital Region) con las siguientes columnas:

- **Date**: Fecha del viaje
- **Time**: Hora del viaje
- **Booking ID**: Identificador único de la reserva
- **Booking Status**: Estado de la reserva (Success/Cancelled)
- **Customer ID**: Identificador del cliente
- **Vehicle Type**: Tipo de vehículo (Prime Sedan, Prime SUV, etc.)
- **Pickup Location**: Ubicación de recogida
- **Drop Location**: Ubicación de destino
- **Booking Value**: Valor de la reserva (₹)
- **Ride Distance**: Distancia del viaje (km)
- **Driver Ratings**: Calificación del conductor (1-5)
- **Customer Rating**: Calificación del cliente (1-5)
- **Payment Method**: Método de pago

## 🎯 Objetivos de Aprendizaje

1. Cargar y explorar datos con Pandas
2. Realizar limpieza y transformación de datos
3. Aplicar filtros y selección de datos
4. Usar funciones de agregación y groupby
5. Calcular estadísticas descriptivas
6. Ordenar y manipular DataFrames

---
## 🔧 Sección 1: Importación de Librerías y Carga de Datos

### Ejercicio 1.1: Importar Pandas

Importa la librería Pandas con el alias `pd`.

In [None]:
# Tu código aquí


### Ejercicio 1.2: Cargar el Dataset

Carga el archivo `ncr_ride_bookings.csv` en un DataFrame llamado `df_rides`.

In [None]:
# Tu código aquí


---
## 🔍 Sección 2: Exploración Inicial de Datos

### Ejercicio 2.1: Primeras Filas

Muestra las primeras 10 filas del DataFrame.

In [None]:
# Tu código aquí


### Ejercicio 2.2: Últimas Filas

Muestra las últimas 8 filas del DataFrame.

In [None]:
# Tu código aquí


### Ejercicio 2.3: Información General

Usa `.info()` para obtener información sobre el DataFrame (tipos de datos, valores nulos, etc.).

In [None]:
# Tu código aquí


### Ejercicio 2.4: Dimensiones del DataFrame

¿Cuántas filas y columnas tiene el DataFrame? Usa la propiedad `.shape`.

In [None]:
# Tu código aquí


### Ejercicio 2.5: Nombres de Columnas

Obtén una lista con todos los nombres de las columnas del DataFrame.

In [None]:
# Tu código aquí


### Ejercicio 2.6: Valores Únicos

¿Cuántos tipos de vehículos diferentes hay en el dataset? Usa `.nunique()` en la columna `Vehicle Type`.

In [None]:
# Tu código aquí


### Ejercicio 2.7: Listar Valores Únicos

Muestra todos los tipos de vehículos únicos usando `.unique()` en la columna `Vehicle Type`.

In [None]:
# Tu código aquí


---
## 📊 Sección 3: Estadísticas Descriptivas

### Ejercicio 3.1: Resumen Estadístico

Genera un resumen estadístico de todas las columnas numéricas usando `.describe()`.

In [None]:
# Tu código aquí


### Ejercicio 3.2: Media del Valor de Reserva

Calcula la media de la columna `Booking Value`.

In [None]:
# Tu código aquí


### Ejercicio 3.3: Mediana de la Distancia

Calcula la mediana de la columna `Ride Distance`.

In [None]:
# Tu código aquí


### Ejercicio 3.4: Desviación Estándar

Calcula la desviación estándar de la columna `Driver Ratings`.

In [None]:
# Tu código aquí


### Ejercicio 3.5: Valores Máximo y Mínimo

Encuentra el valor máximo y mínimo de la columna `Booking Value`.

In [None]:
# Tu código aquí - Máximo


In [None]:
# Tu código aquí - Mínimo


---
## 🔎 Sección 4: Selección y Filtrado de Datos

### Ejercicio 4.1: Seleccionar Columnas Específicas

Crea un nuevo DataFrame con solo las columnas: `Booking ID`, `Vehicle Type`, `Booking Value` y `Payment Method`.

In [None]:
# Tu código aquí


### Ejercicio 4.2: Filtrar por Tipo de Vehículo

Filtra el DataFrame para mostrar solo los viajes en `Prime Sedan`.

In [None]:
# Tu código aquí


### Ejercicio 4.3: Filtro por Valor

Filtra los viajes donde el `Booking Value` sea mayor a 1000.

In [None]:
# Tu código aquí


### Ejercicio 4.4: Filtros Múltiples

Filtra los viajes que cumplan AMBAS condiciones:
- `Vehicle Type` sea 'Prime SUV'
- `Booking Value` sea mayor a 800

In [None]:
# Tu código aquí


### Ejercicio 4.5: Filtrar Viajes Exitosos

Filtra solo los viajes donde el `Booking Status` sea 'Success'.

In [None]:
# Tu código aquí


### Ejercicio 4.6: Filtro por Calificación Alta

Filtra los viajes donde tanto `Driver Ratings` como `Customer Rating` sean mayores o iguales a 4.5.

In [None]:
# Tu código aquí


---
## 📈 Sección 5: Agrupación y Agregación

### Ejercicio 5.1: Contar por Tipo de Vehículo

Agrupa por `Vehicle Type` y cuenta cuántos viajes hay de cada tipo.

In [None]:
# Tu código aquí


### Ejercicio 5.2: Promedio de Valor por Tipo de Vehículo

Calcula el valor promedio de reserva (`Booking Value`) para cada tipo de vehículo.

In [None]:
# Tu código aquí


### Ejercicio 5.3: Suma Total por Método de Pago

Agrupa por `Payment Method` y suma el total de `Booking Value` para cada método.

In [None]:
# Tu código aquí


### Ejercicio 5.4: Distancia Promedio por Ubicación de Recogida

Calcula la distancia promedio (`Ride Distance`) para cada ubicación de recogida (`Pickup Location`).

In [None]:
# Tu código aquí


### Ejercicio 5.5: Agrupación Múltiple

Agrupa por `Vehicle Type` y `Payment Method`, y calcula el promedio de `Booking Value`.

In [None]:
# Tu código aquí


### Ejercicio 5.6: Agregación con múltiples funciones

Agrupa por `Vehicle Type` y calcula simultáneamente la media, suma y cuenta de `Booking Value` usando `.agg()`.

In [None]:
# Tu código aquí


---
## 🔄 Sección 6: Transformación de Datos

### Ejercicio 6.1: Renombrar Columnas

Renombra las siguientes columnas:
- `Booking Value` → `Valor_Reserva`
- `Ride Distance` → `Distancia_Viaje`
- `Vehicle Type` → `Tipo_Vehiculo`

In [None]:
# Tu código aquí


### Ejercicio 6.2: Crear Nueva Columna

Crea una nueva columna llamada `Precio_por_km` que calcule el precio por kilómetro (Booking Value / Ride Distance).

**Nota:** Maneja los casos donde la distancia sea 0 para evitar divisiones por cero.

In [None]:
# Tu código aquí


### Ejercicio 6.3: Eliminar Valores Nulos

Verifica cuántos valores nulos hay en cada columna y elimina las filas que contengan valores nulos.

In [None]:
# Tu código aquí - Contar valores nulos


In [None]:
# Tu código aquí - Eliminar valores nulos


### Ejercicio 6.4: Rellenar Valores Nulos

En lugar de eliminar, rellena los valores nulos de `Driver Ratings` con la media de esa columna.

In [None]:
# Tu código aquí


---
## 📉 Sección 7: Ordenamiento

### Ejercicio 7.1: Ordenar por Valor de Reserva

Ordena el DataFrame por `Booking Value` de mayor a menor y muestra los primeros 10 registros.

In [None]:
# Tu código aquí


### Ejercicio 7.2: Ordenar por Múltiples Columnas

Ordena el DataFrame primero por `Vehicle Type` (alfabéticamente) y luego por `Booking Value` (de mayor a menor).

In [None]:
# Tu código aquí


### Ejercicio 7.3: Top 5 Mejores Calificaciones

Ordena por `Driver Ratings` descendente y muestra los 5 viajes con las mejores calificaciones.

In [None]:
# Tu código aquí


---
## 🎯 Sección 8: Ejercicios Integrados

### Ejercicio 8.1: Análisis de Viajes Exitosos vs Cancelados

Calcula el porcentaje de viajes exitosos vs cancelados en el dataset.

In [None]:
# Tu código aquí


### Ejercicio 8.2: Tipo de Vehículo más Rentable

Determina qué tipo de vehículo genera el mayor ingreso total (suma de Booking Value).

In [None]:
# Tu código aquí


### Ejercicio 8.3: Ubicación con Mayor Demanda

Identifica las 5 ubicaciones de recogida con más viajes.

In [None]:
# Tu código aquí


### Ejercicio 8.4: Análisis de Método de Pago Preferido

Determina cuál es el método de pago más utilizado y calcula su porcentaje sobre el total.

In [None]:
# Tu código aquí


### Ejercicio 8.5: Relación Distancia-Valor

Calcula la correlación entre `Ride Distance` y `Booking Value`. ¿Están relacionadas estas variables?

In [None]:
# Tu código aquí


### Ejercicio 8.6: Filtro Complejo

Crea un DataFrame que contenga solo los viajes que cumplan TODAS estas condiciones:
- Booking Status = 'Success'
- Vehicle Type = 'Prime SUV' o 'Prime Sedan'
- Booking Value > 500
- Driver Ratings >= 4.0

Luego, calcula el promedio de `Booking Value` de este subconjunto.

In [None]:
# Tu código aquí


### Ejercicio 8.7: Resumen por Hora

Extrae la hora de la columna `Time` y crea una nueva columna llamada `Hour`. Luego agrupa por hora y calcula el número de viajes por cada hora del día.

In [None]:
# Tu código aquí


### Ejercicio 8.8: Análisis de Cancelaciones

De los viajes cancelados:
1. ¿Cuántos fueron cancelados por el cliente vs por el conductor?
2. ¿Cuál es la razón más común de cancelación por parte del cliente?
3. ¿Cuál es la razón más común de cancelación por parte del conductor?

In [None]:
# Tu código aquí - Pregunta 1


In [None]:
# Tu código aquí - Pregunta 2


In [None]:
# Tu código aquí - Pregunta 3


---
## 🏆 Sección 9: Desafíos Avanzados

### Desafío 9.1: Segmentación de Clientes

Crea una nueva columna llamada `Categoria_Cliente` que clasifique a los clientes según el valor promedio de sus reservas:
- 'Premium': Booking Value promedio > 800
- 'Estándar': Booking Value promedio entre 400 y 800
- 'Básico': Booking Value promedio < 400

Luego, cuenta cuántos clientes hay en cada categoría.

In [None]:
# Tu código aquí


### Desafío 9.2: Análisis de Rutas Populares

Crea una nueva columna llamada `Ruta` que combine `Pickup Location` y `Drop Location` (formato: "Origen → Destino"). Luego encuentra las 10 rutas más frecuentes.

In [None]:
# Tu código aquí


### Desafío 9.3: Eficiencia del Conductor

Calcula una métrica de "eficiencia" para cada tipo de vehículo:
- Eficiencia = (Promedio de Driver Ratings × Número de viajes exitosos) / Total de viajes

Ordena los tipos de vehículo por eficiencia de mayor a menor.

In [None]:
# Tu código aquí


### Desafío 9.4: Análisis Temporal Detallado

Convierte la columna `Date` a formato datetime y extrae:
1. El día de la semana
2. El mes
3. ¿Qué día de la semana tiene más viajes?
4. ¿En qué mes hay mayor valor total de reservas?

In [None]:
# Tu código aquí


### Desafío 9.5: Dashboard Resumido

Crea un resumen ejecutivo que incluya:
1. Total de viajes
2. Ingresos totales
3. Tasa de éxito (% de viajes completados)
4. Distancia promedio
5. Valor promedio por viaje
6. Calificación promedio de conductores
7. Calificación promedio de clientes
8. Tipo de vehículo más popular
9. Método de pago más usado

Presenta estos datos en un formato claro y organizado.

In [None]:
# Tu código aquí


### Desafío 9.6: Detección de Anomalías

Identifica viajes "anómalos" que cumplan alguna de estas condiciones:
- Distancia > 100 km pero Booking Value < 200
- Distancia < 2 km pero Booking Value > 500
- Driver Ratings < 2.0 y Customer Rating > 4.5

¿Cuántos casos anómalos encuentras?

In [None]:
# Tu código aquí


### Desafío 9.7: Análisis de Valor por Distancia

Crea rangos de distancia (bins) y calcula el valor promedio de reserva para cada rango:
- 0-5 km
- 5-10 km
- 10-20 km
- 20-50 km
- 50+ km

Usa `pd.cut()` para crear los rangos.

In [None]:
# Tu código aquí


### Desafío 9.8: Matriz de Correlación

Crea una matriz de correlación entre todas las variables numéricas del dataset. ¿Qué variables están más correlacionadas?

In [None]:
# Tu código aquí


---
## 💡 Sección 10: Proyecto Final Integrador

### Proyecto: Informe Completo de Análisis de Viajes

Crea un análisis completo que responda a las siguientes preguntas de negocio:

#### 1. Rendimiento General
- ¿Cuál es la tasa de éxito de las reservas?
- ¿Cuál es el ingreso total generado?
- ¿Cuál es el ticket promedio (valor promedio de reserva)?

#### 2. Análisis de Vehículos
- ¿Qué tipo de vehículo es más popular?
- ¿Qué tipo de vehículo genera más ingresos?
- ¿Qué tipo de vehículo tiene las mejores calificaciones?

#### 3. Análisis de Ubicaciones
- ¿Cuáles son las 5 ubicaciones con más recogidas?
- ¿Cuáles son las 5 ubicaciones de destino más frecuentes?
- ¿Cuál es la ruta más rentable?

#### 4. Análisis de Calidad de Servicio
- ¿Cuál es la calificación promedio de conductores?
- ¿Cuál es la calificación promedio de clientes?
- ¿Qué tipo de vehículo tiene mejores calificaciones?

#### 5. Análisis de Cancelaciones
- ¿Cuál es la tasa de cancelación?
- ¿Quién cancela más: clientes o conductores?
- ¿Cuáles son las principales razones de cancelación?

#### 6. Recomendaciones
Basándote en tu análisis, proporciona 3-5 recomendaciones para mejorar el negocio.

**Presenta tu análisis de forma clara y organizada, usando comentarios en el código y markdown para explicar tus hallazgos.**

In [None]:
# Tu código aquí - Rendimiento General


In [None]:
# Tu código aquí - Análisis de Vehículos


In [None]:
# Tu código aquí - Análisis de Ubicaciones


In [None]:
# Tu código aquí - Análisis de Calidad de Servicio


In [None]:
# Tu código aquí - Análisis de Cancelaciones


#### Mis Recomendaciones:

1. [Escribe tu recomendación aquí]

2. [Escribe tu recomendación aquí]

3. [Escribe tu recomendación aquí]

4. [Escribe tu recomendación aquí]

5. [Escribe tu recomendación aquí]

---
## 🎓 Conclusión

¡Felicidades! Has completado el cuaderno de ejercicios sobre análisis de datos con Pandas.

### Has aprendido a:
- ✅ Cargar y explorar datos con Pandas
- ✅ Realizar análisis estadísticos descriptivos
- ✅ Filtrar y seleccionar datos específicos
- ✅ Agrupar y agregar información
- ✅ Transformar y limpiar datos
- ✅ Ordenar y manipular DataFrames
- ✅ Resolver problemas de negocio reales con análisis de datos

### Próximos pasos:
- Practica con otros datasets
- Aprende visualización de datos con Matplotlib y Seaborn
- Explora técnicas avanzadas de limpieza de datos
- Profundiza en análisis estadístico

---

## ¡Sigue practicando y mejorando tus habilidades en análisis de datos! 📊🚀