# Ejercicios de Pandas

**Instrucciones:**
- Lee cada enunciado cuidadosamente
- Los ejercicios requieren combinar varias operaciones de pandas
- Intenta resolver cada problema paso a paso
- Algunos ejercicios tienen múltiples soluciones válidas

In [None]:
# Importar librerías
import pandas as pd
import numpy as np
from datetime import datetime, timedelta

In [None]:
# Cargar los datos
data = pd.read_csv("material/data.csv")
data.head(10)

---

### Ejercicio 1: Clientes VIP
Identifica a los clientes VIP basándote en los siguientes criterios:
- Han realizado al menos 3 órdenes diferentes
- Su gasto total supera los 100€
- El precio medio de sus compras es superior a 30€

Crea un DataFrame con:
- `order_customer_id`
- Número de órdenes
- Gasto total
- Gasto medio
- Una columna booleana `es_vip` que indique si cumple los 3 criterios

Ordena el resultado por gasto total descendente.

### Ejercicio 2: Análisis de Cestas de Compra
Para cada orden (`order_id`), calcula:
- Número total de productos en la orden
- Número de unidades totales compradas
- Importe total de la orden
- Número de familias de productos diferentes en la orden
- Precio medio por producto

Luego identifica:
- Las 5 órdenes con mayor diversidad de productos (más familias diferentes)
- Las 5 órdenes con mayor importe total
- ¿Hay solapamiento entre estas dos listas?

In [None]:
# Tu código aquí


### Ejercicio 3: Patrón de Compra Recurrente
Identifica qué clientes compran regularmente (tienen órdenes en al menos 3 fechas diferentes) y cuál es su familia de productos favorita (la que más compran en términos de cantidad total).

Crea un DataFrame que muestre:
- `order_customer_id`
- Número de días diferentes en que ha comprado
- Familia de productos favorita
- Cantidad total comprada de esa familia
- Porcentaje que representa esa familia sobre sus compras totales



### Ejercicio 4: Tendencia de Ventas
Convierte la columna `fecha` a datetime y realiza el siguiente análisis:

1. Calcula las ventas diarias totales (suma de `price`)
2. Añade una columna con la diferencia porcentual respecto al día anterior
3. Identifica los 3 días con mayor crecimiento porcentual
4. Identifica los 3 días con mayor caída porcentual



### Ejercicio 5: Análisis de Fin de Semana vs Entre Semana
Compara el comportamiento de compra entre fin de semana (sábado y domingo) y entre semana:

Para cada segmento calcula:
- Número de órdenes únicas
- Ticket medio (precio medio por orden)
- Productos por orden (media)
- Familia de productos más vendida
- Porcentaje de ventas de cada familia

Presenta los resultados en un formato que permita comparar fácilmente ambos segmentos.

### Ejercicio 6: Cohort Analysis Simplificado
Realiza un análisis de cohortes básico:

1. Para cada cliente, identifica la fecha de su primera compra (fecha de adquisición)
2. Agrupa a los clientes por semana de adquisición
3. Para cada cohorte, calcula:
   - Número de clientes en la cohorte
   - Gasto total de la cohorte
   - Gasto medio por cliente
   - Número medio de órdenes por cliente
   
Ordena las cohortes de más antigua a más reciente.


### Ejercicio 7: Elasticidad de Cantidad
Analiza cómo varía la cantidad comprada según el precio unitario:

1. Crea rangos de precio unitario (bins): 0-20, 20-40, 40-60, 60+
2. Para cada rango y cada familia de productos, calcula:
   - Cantidad media comprada
   - Número de transacciones
   - Precio unitario medio
3. Crea una tabla pivote que muestre la cantidad media comprada con:
   - Filas: familias de productos
   - Columnas: rangos de precio
4. ¿Qué familia de productos es menos sensible al precio (mantiene cantidades altas incluso a precios altos)?

### Ejercicio 8: Análisis de Margen de Contribución
Simula el coste del producto (como mucho 40% del `unit_price`). Calcula para cada familia de productos:

1. Margen unitario promedio (unit_price - coste)
2. Margen total (suma de todos los márgenes de las ventas)
3. Contribución al margen total del negocio (porcentaje)

Ordena por contribución al margen descendente. ¿Cuál es la familia más rentable?



### Ejercicio 9: Segmentación RFM (Recency, Frequency, Monetary)
Crea una segmentación RFM de clientes:

1. **Recency**: Días desde la última compra (usa la fecha más reciente del dataset como referencia)
2. **Frequency**: Número de órdenes del cliente
3. **Monetary**: Gasto total del cliente

Para cada métrica:
- Asigna un score de 1 a 4 usando cuartiles (1=peor, 4=mejor)
- Para Recency, invierte la lógica (menor recency = mejor = score más alto)

Crea una columna `RFM_Score` concatenando los tres scores (ej: "444" = cliente excelente).

Finalmente, clasifica a los clientes en segmentos de tu ínteres.

¿Cuántos clientes hay en cada segmento?

### Ejercicio 10: Análisis de Pareto (80/20)
Realiza un análisis de Pareto para identificar:

1. **A nivel de clientes**: ¿Qué porcentaje de clientes genera el 80% de los ingresos?
2. **A nivel de productos**: ¿Qué porcentaje de familias de productos genera el 80% de los ingresos?
3. **A nivel de órdenes**: ¿Qué porcentaje de órdenes representa el 80% de los ingresos?

Para cada análisis:
- Ordena por ingresos descendente
- Calcula el porcentaje acumulado de ingresos
- Identifica el punto donde se alcanza el 80%
- Calcula qué porcentaje del total representa ese punto

### Ejercicio 11: Análisis de Días Anómalos
Identifica días con comportamiento de ventas anómalo:

1. Calcula las ventas diarias totales
2. Calcula la media y desviación estándar de las ventas diarias
3. Identifica días "anómalos":
   - Días con ventas > media + 1.5*desviación_estándar (picos)
   - Días con ventas < media - 1.5*desviación_estándar (caídas)

4. Para los días anómalos, analiza:
   - ¿Qué día de la semana son?
   - ¿Qué porcentaje de ventas aportaron cada familia en esos días?


### Ejercicio 12: Predicción de Próxima Compra
Para cada cliente que haya comprado más de una vez:

1. Calcula el tiempo medio entre compras (en días)
2. Calcula la desviación estándar del tiempo entre compras
3. Identifica la fecha de la última compra
4. Predice cuándo hará su próxima compra: última_compra + tiempo_medio
5. Calcula un "intervalo de confianza" simple: próxima_compra ± desviación_estándar

Clasifica a los clientes en:
- "Debería comprar pronto": próxima compra predicha ya pasó
- "Compra inminente": próxima compra en los próximos 7 días
- "No urgente": próxima compra en más de 7 días

### Ejercicio 13: Reporte Ejecutivo Automatizado
Crea una función que genere un reporte ejecutivo automático:

La función debe:
1. Recibir el DataFrame y un rango de fechas
2. Filtrar los datos por ese rango
3. Calcular y retornar un diccionario con:
   - Resumen de ventas (total, media diaria, tendencia)
   - Top 5 clientes
   - Top 3 productos
   - Alertas (días con caídas >20%, clientes con comportamiento inusual, etc.)
   - Recomendaciones automáticas basadas en los datos

Prueba la función con diferentes rangos de fechas.

In [None]:
# Tu código aquí
def generar_reporte_ejecutivo(df, fecha_inicio, fecha_fin):
    """
    Genera un reporte ejecutivo automático para un rango de fechas.
    
    Parameters:
    -----------
    df : DataFrame
        DataFrame con los datos de ventas
    fecha_inicio : str
        Fecha de inicio en formato 'YYYY-MM-DD'
    fecha_fin : str
        Fecha de fin en formato 'YYYY-MM-DD'
    
    Returns:
    --------
    dict : Diccionario con el reporte completo
    """
    reporte = {}
    
    # Tu código aquí
    
    return reporte

# Probar la función


---
## Ejercicios Extra 

### Sistema de Recomendación Simple
Basándote en el historial de compras, crea un sistema de recomendación:

1. Para cada cliente, identifica qué familias de productos ha comprado
2. Para cada familia que ha comprado, encuentra qué otras familias compran frecuentemente los clientes que también compraron esa familia
3. Recomienda al cliente las familias que no ha comprado aún pero que son populares entre clientes similares
4. Calcula un "score de confianza" basado en la frecuencia de co-ocurrencia

Prueba el sistema con 5 clientes diferentes.

### Análisis de Supervivencia de Clientes
Realiza un análisis básico de supervivencia (retención) de clientes:

1. Para cada cliente, calcula:
   - Fecha de primera compra (cohorte)
   - Fecha de última compra
   - "Tiempo de vida" en días
   - Si está "activo" (compró en los últimos 30 días) o "churned"

2. Agrupa por cohorte (semana de primera compra) y calcula:
   - Tamaño de la cohorte
   - Tiempo medio de vida
   - Tasa de retención (% de activos)
   - Valor medio generado por cliente

3. ¿Qué cohorte tiene mejor retención? 