In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
# --- CONFIGURACI√ìN EST√âTICA PROFESIONAL ---
sns.set_style("whitegrid")
plt.rcParams['figure.figsize'] = (12, 7)
plt.rcParams['font.size'] = 11

# --- 1. PREPARACI√ìN DE DATOS (ETL) ---
def obtener_dataset_maestro():
    """
    Carga y fusiona las tablas aplicando correcciones de duplicados
    para habilitar el an√°lisis multidimensional.
    """
    try:
        # Carga
        df_cli = pd.read_csv('clientes.xlsx - clientes.csv.csv')
        df_det = pd.read_csv('detalle_ventas.xlsx - detalle_ventas.csv.csv')
        df_prod = pd.read_csv('productos.xlsx - productos.csv.csv')
        df_ven = pd.read_csv('ventas.xlsx - ventas.csv.csv')
        
        # Conversi√≥n de fechas
        df_ven['fecha'] = pd.to_datetime(df_ven['fecha'])
        
        # Fusi√≥n Estrat√©gica
        # 1. Detalle + Ventas (Trae fecha, medio_pago, cliente)
        df = pd.merge(df_det, df_ven, on='id_venta', how='inner')
        # 2. + Productos (Trae categoria) - Usamos suffix para evitar colisi√≥n de nombres
        df = pd.merge(df, df_prod, on='id_producto', how='left', suffixes=('', '_prod_dup'))
        # 3. + Clientes (Trae ciudad)
        df = pd.merge(df, df_cli, on='id_cliente', how='left', suffixes=('', '_cli_dup'))
        
        return df
    except Exception as e:
        print(f"‚ùå Error en la preparaci√≥n de datos: {e}")
        return None
# --- 2. NUEVAS TAREAS DE AN√ÅLISIS ---

def tarea_analisis_categorias(df):
    """
    Tarea: Visualizar el rendimiento por Categor√≠a de Producto.
    Responde: ¬øQu√© rubro aporta m√°s facturaci√≥n a la empresa?
    """
    print("\nüì¶ Ejecutando An√°lisis por Categor√≠a...")
    
    # Agrupaci√≥n
    ventas_cat = df.groupby('categoria')['importe'].sum().sort_values(ascending=False)
    
    # Visualizaci√≥n
    plt.figure(figsize=(10, 6))
    ax = sns.barplot(x=ventas_cat.index, y=ventas_cat.values, palette='viridis', hue=ventas_cat.index, legend=False)
    
    plt.title('Ingresos Totales por Categor√≠a de Producto', fontsize=16, fontweight='bold')
    plt.ylabel('Facturaci√≥n ($)')
    plt.xlabel('Categor√≠a')
    
    # A√±adir etiquetas de datos encima de las barras
    for i, v in enumerate(ventas_cat.values):
        ax.text(i, v + (v*0.01), f"${v:,.0f}", ha='center', fontweight='bold')
        
    plt.show()

