In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configuraci√≥n est√©tica para los gr√°ficos
# 'whitegrid' ayuda a leer mejor los valores con l√≠neas de fondo
sns.set_style("whitegrid")
# Definimos un tama√±o de gr√°fico est√°ndar para todo el notebook
plt.rcParams['figure.figsize'] = (10, 6)

def cargar_datos():
    """
    Tarea 1: Carga y Limpieza de Datos.
    
    Esta funci√≥n lee los archivos CSV necesarios para el an√°lisis.
    Tambi√©n realiza un chequeo r√°pido de valores nulos para asegurar la calidad de los datos.
    
    Returns:
        tuple: Contiene los 4 DataFrames (clientes, detalle, productos, ventas).
    """
    try:
        # Carga de archivos CSV
        df_cli = pd.read_csv('clientes.xlsx - clientes.csv.csv')
        df_det = pd.read_csv('detalle_ventas.xlsx - detalle_ventas.csv.csv')
        df_prod = pd.read_csv('productos.xlsx - productos.csv.csv')
        df_ven = pd.read_csv('ventas.xlsx - ventas.csv.csv')
        
        print("‚úÖ Fase 1: Datos cargados exitosamente.\n")
        
        # Verificaci√≥n de integridad de datos (B√∫squeda de nulos)
        print("--- Reporte de Valores Nulos ---")
        datasets = {'Clientes': df_cli, 'Detalle': df_det, 'Productos': df_prod, 'Ventas': df_ven}
        for nombre, df in datasets.items():
            nulos = df.isnull().sum().sum()
            estado = "Sin nulos" if nulos == 0 else f"‚ö†Ô∏è {nulos} nulos detectados"
            print(f"{nombre}: {estado}")
            
        return df_cli, df_det, df_prod, df_ven
    except FileNotFoundError as e:
        print(f"‚ùå Error cr√≠tico: No se encontr√≥ el archivo. {e}")
        return None, None, None, None
    
    def crear_dataset_maestro(df_ven, df_det, df_prod, df_cli):
    """
    Tarea 2: Fusi√≥n de Datos (Data Merging).
    
    Crea una √∫nica tabla 'Maestra' que consolida toda la informaci√≥n dispersa.
    La l√≥gica de uni√≥n es:
    1. Ventas + Detalle (Uni√≥n 1 a N): Una venta tiene muchos productos.
    2. + Productos: Para saber el nombre y categor√≠a de lo vendido.
    3. + Clientes: Para saber qui√©n compr√≥ y de d√≥nde es.
    
    Args:
        df_ven, df_det, df_prod, df_cli: DataFrames individuales cargados previamente.
        
    Returns:
        pd.DataFrame: DataFrame consolidado y listo para an√°lisis.
    """
    # Paso 1: Unir cabecera de factura con detalle de items
    print("\nüîÑ Procesando fusi√≥n de tablas...")
    master = pd.merge(df_ven, df_det, on='id_venta', how='inner')
    
    # Paso 2: Enriquecer con datos del producto
    master = pd.merge(master, df_prod, on='id_producto', how='left')
    
    # Paso 3: Enriquecer con datos del cliente
    # Usamos suffixes para evitar conflictos si hay columnas con el mismo nombre (ej. email)
    master = pd.merge(master, df_cli, on='id_cliente', how='left', suffixes=('', '_cliente'))
    
    # Conversi√≥n de tipos: La fecha debe ser objeto datetime para an√°lisis temporal
    master['fecha'] = pd.to_datetime(master['fecha'])
    
    print(f" Fase 2 Completada. Dimensiones del Dataset Maestro: {master.shape}")
    return master

def analizar_productos(df):
    """
    Tarea 3: An√°lisis de Productos (Top 5 Cantidad e Ingresos).
    
    Genera visualizaciones para identificar los productos estrella del negocio.
    Se analiza tanto el volumen de movimiento (cantidad) como el impacto financiero (importe).
    """
    print("\nüìä Iniciando An√°lisis de Productos...")
    
    # Agregaci√≥n de datos por producto
    prod_stats = df.groupby('nombre_producto').agg({
        'cantidad': 'sum',
        'importe': 'sum'
    })

    # Top 5 por Cantidad
    top_cant = prod_stats.sort_values('cantidad', ascending=False).head(5)
    # Top 5 por Ingresos (Dinero generado)
    top_ing = prod_stats.sort_values('importe', ascending=False).head(5)
    
    # Creaci√≥n de gr√°ficos comparativos
    fig, axes = plt.subplots(1, 2, figsize=(16, 6))
    
    # Gr√°fico 1: Cantidad
    sns.barplot(x=top_cant['cantidad'], y=top_cant.index, ax=axes[0], palette='viridis', hue=top_cant.index, legend=False)
    axes[0].set_title('Top 5 Productos m√°s Vendidos (Unidades)', fontsize=14)
    axes[0].set_xlabel('Unidades Vendidas')
    axes[0].set_ylabel('')

    # Gr√°fico 2: Ingresos
    sns.barplot(x=top_ing['importe'], y=top_ing.index, ax=axes[1], palette='magma', hue=top_ing.index, legend=False)
    axes[1].set_title('Top 5 Productos con Mayores Ingresos ($)', fontsize=14)
    axes[1].set_xlabel('Total Generado ($)')
    axes[1].set_ylabel('')
    
    plt.tight_layout()
    plt.show()

    def analizar_tendencia_temporal(df):
    """
    Tarea 4: An√°lisis de Ventas por Tiempo.
    
    Visualiza c√≥mo evolucionan las ventas mes a mes para detectar estacionalidad
    o tendencias de crecimiento/decrecimiento.
    """
    print("\nüìà Iniciando An√°lisis Temporal...")
    
    # Extraer el per√≠odo (A√±o-Mes)
    df['mes_a√±o'] = df['fecha'].dt.to_period('M')
    
    # Agrupar y sumar ventas por mes
    ventas_mes = df.groupby('mes_a√±o')['importe'].sum()
    
    # Convertir √≠ndice a string para que matplotlib lo grafique ordenadamente
    x_labels = ventas_mes.index.astype(str)

    plt.figure(figsize=(12, 6))
    sns.lineplot(x=x_labels, y=ventas_mes.values, marker='o', linewidth=3, color='#2ecc71')
    
    # Etiquetas y formato
    plt.title('Tendencia de Ingresos Mensuales', fontsize=16)
    plt.ylabel('Ventas Totales ($)', fontsize=12)
    plt.xlabel('Mes', fontsize=12)
    plt.xticks(rotation=45)
    plt.grid(True, alpha=0.3) # Rejilla suave
    
    # A√±adir etiquetas de valor sobre los puntos
    for x, y in zip(x_labels, ventas_mes.values):
        plt.text(x, y, f"${y:,.0f}", ha='center', va='bottom', fontsize=9)
        
    plt.show()

    