# Ejercicio 1: Análisis de Datos Interactivo con Pandas

## Objetivos
- Complementar los conceptos básicos de Python con análisis de datos práctico
- Aplicar funciones, estructuras de datos y manejo de archivos en contexto real
- Introducir visualización de datos de manera progresiva

## Contexto
Este ejercicio extiende los conceptos del repositorio base aplicándolos a un caso práctico de análisis de datos de ventas.

## Parte 1: Configuración y Datos de Ejemplo

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime, timedelta
import numpy as np

# Crear datos de ejemplo (simulando ventas de productos)
np.random.seed(42)

productos = ['Laptop', 'Mouse', 'Teclado', 'Monitor', 'Auriculares']
categorias = ['Electrónica', 'Accesorios', 'Accesorios', 'Electrónica', 'Audio']
fechas = [datetime(2024, 1, 1) + timedelta(days=i) for i in range(365)]

# Generar datos de ventas
datos_ventas = []
for _ in range(1000):
    producto = np.random.choice(productos)
    categoria = categorias[productos.index(producto)]
    fecha = np.random.choice(fechas)
    precio_base = {'Laptop': 800, 'Mouse': 25, 'Teclado': 50, 'Monitor': 300, 'Auriculares': 80}
    precio = precio_base[producto] * np.random.uniform(0.8, 1.2)
    cantidad = np.random.randint(1, 6)
    
    datos_ventas.append({
        'producto': producto,
        'categoria': categoria,
        'fecha': fecha,
        'precio_unitario': round(precio, 2),
        'cantidad': cantidad,
        'total': round(precio * cantidad, 2)
    })

df_ventas = pd.DataFrame(datos_ventas)
print("Datos de ejemplo creados:")
print(df_ventas.head())
print(f"\nTotal de registros: {len(df_ventas)}")

## Parte 2: Análisis Básico (Aplicando conceptos del repositorio)

In [None]:
# Ejercicio 2.1: Usar funciones (concepto del repositorio)
def analizar_ventas_producto(df, producto):
    """
    Función que analiza las ventas de un producto específico
    Aplica conceptos de funciones y parámetros del repositorio
    """
    ventas_producto = df[df['producto'] == producto]
    
    resumen = {
        'producto': producto,
        'total_ventas': ventas_producto['total'].sum(),
        'cantidad_vendida': ventas_producto['cantidad'].sum(),
        'precio_promedio': ventas_producto['precio_unitario'].mean(),
        'ventas_por_mes': ventas_producto.groupby(ventas_producto['fecha'].dt.month)['total'].sum().to_dict()
    }
    
    return resumen

# Aplicar la función a cada producto
productos_unicos = df_ventas['producto'].unique()
for producto in productos_unicos:
    analisis = analizar_ventas_producto(df_ventas, producto)
    print(f"\n--- Análisis de {producto} ---")
    print(f"Total de ventas: ${analisis['total_ventas']:.2f}")
    print(f"Cantidad vendida: {analisis['cantidad_vendida']} unidades")
    print(f"Precio promedio: ${analisis['precio_promedio']:.2f}")

## Parte 3: Uso de Expresiones Lambda y Funciones de Orden Superior

In [None]:
# Ejercicio 3.1: Aplicar lambdas (concepto del repositorio)
# Crear categorías de precio usando lambda
df_ventas['categoria_precio'] = df_ventas['precio_unitario'].apply(
    lambda x: 'Económico' if x < 50 else 'Medio' if x < 200 else 'Premium'
)

# Usar filter y map con lambdas
ventas_premium = list(filter(lambda x: x['categoria_precio'] == 'Premium', 
                            df_ventas.to_dict('records')))

# Mapear para obtener solo los totales de ventas premium
totales_premium = list(map(lambda x: x['total'], ventas_premium))

print(f"Ventas premium encontradas: {len(ventas_premium)}")
print(f"Promedio de ventas premium: ${np.mean(totales_premium):.2f}")

# Análisis por categoría de precio
resumen_categorias = df_ventas.groupby('categoria_precio').agg({
    'total': ['sum', 'mean', 'count'],
    'cantidad': 'sum'
})

print("\nResumen por categoría de precio:")
print(resumen_categorias)

## Parte 4: Visualización de Datos

In [None]:
# Ejercicio 4.1: Crear visualizaciones interactivas
plt.figure(figsize=(15, 10))

# Gráfico 1: Ventas por producto
plt.subplot(2, 2, 1)
ventas_por_producto = df_ventas.groupby('producto')['total'].sum().sort_values(ascending=False)
plt.bar(ventas_por_producto.index, ventas_por_producto.values, color='skyblue')
plt.title('Ventas Totales por Producto')
plt.xlabel('Producto')
plt.ylabel('Ventas ($)')
plt.xticks(rotation=45)

# Gráfico 2: Distribución de categorías de precio
plt.subplot(2, 2, 2)
categoria_counts = df_ventas['categoria_precio'].value_counts()
plt.pie(categoria_counts.values, labels=categoria_counts.index, autopct='%1.1f%%')
plt.title('Distribución de Categorías de Precio')

# Gráfico 3: Ventas por mes
plt.subplot(2, 2, 3)
df_ventas['mes'] = df_ventas['fecha'].dt.month
ventas_por_mes = df_ventas.groupby('mes')['total'].sum()
plt.plot(ventas_por_mes.index, ventas_por_mes.values, marker='o', color='green')
plt.title('Tendencia de Ventas por Mes')
plt.xlabel('Mes')
plt.ylabel('Ventas ($)')
plt.grid(True)

# Gráfico 4: Correlación precio-cantidad
plt.subplot(2, 2, 4)
plt.scatter(df_ventas['precio_unitario'], df_ventas['cantidad'], alpha=0.5)
plt.title('Relación Precio vs Cantidad')
plt.xlabel('Precio Unitario ($)')
plt.ylabel('Cantidad')

plt.tight_layout()
plt.show()

# Estadísticas adicionales
print("\n=== ESTADÍSTICAS FINALES ===")
print(f"Total de ventas: ${df_ventas['total'].sum():.2f}")
print(f"Promedio de venta: ${df_ventas['total'].mean():.2f}")
print(f"Producto más vendido: {df_ventas.groupby('producto')['cantidad'].sum().idxmax()}")
print(f"Mes con mayores ventas: {ventas_por_mes.idxmax()}")

## Parte 5: Ejercicios Prácticos

### Ejercicio 5.1: Análisis Personalizado
Crea una función que:
1. Reciba un DataFrame y un rango de fechas
2. Filtre las ventas en ese período
3. Retorne un diccionario con estadísticas del período

### Ejercicio 5.2: Funciones Lambda Avanzadas
Usa expresiones lambda para:
1. Crear una nueva columna 'rentabilidad' (asumiendo 40% de margen)
2. Clasificar ventas como 'Alta', 'Media' o 'Baja' según el total
3. Filtrar registros con condiciones múltiples

### Ejercicio 5.3: Integración con Archivos
1. Exporta los resultados a un archivo CSV
2. Crea un reporte en formato JSON
3. Implementa una función que lea archivos de ventas externos

In [None]:
# Espacio para soluciones de los ejercicios
# Los estudiantes pueden implementar aquí sus respuestas

# Ejercicio 5.1: Análisis Personalizado
def analisis_periodo(df, fecha_inicio, fecha_fin):
    # TODO: Implementar análisis por período
    pass

# Ejercicio 5.2: Funciones Lambda Avanzadas
# TODO: Implementar clasificaciones con lambda

# Ejercicio 5.3: Integración con Archivos
def exportar_reporte(df, formato='csv'):
    # TODO: Implementar exportación
    pass

print("¡Completa los ejercicios anteriores!")