In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configuraci√≥n est√©tica para los gr√°ficos
# 'whitegrid' ayuda a leer mejor los valores con l√≠neas de fondo
sns.set_style("whitegrid")
# Definimos un tama√±o de gr√°fico est√°ndar para todo el notebook
plt.rcParams['figure.figsize'] = (10, 6)

def cargar_datos():
    """
    Tarea 1: Carga y Limpieza de Datos.
    
    Esta funci√≥n lee los archivos CSV necesarios para el an√°lisis.
    Tambi√©n realiza un chequeo r√°pido de valores nulos para asegurar la calidad de los datos.
    
    Returns:
        tuple: Contiene los 4 DataFrames (clientes, detalle, productos, ventas).
    """
    try:
        # Carga de archivos CSV
        df_cli = pd.read_csv('clientes.xlsx - clientes.csv.csv')
        df_det = pd.read_csv('detalle_ventas.xlsx - detalle_ventas.csv.csv')
        df_prod = pd.read_csv('productos.xlsx - productos.csv.csv')
        df_ven = pd.read_csv('ventas.xlsx - ventas.csv.csv')
        
        print("‚úÖ Fase 1: Datos cargados exitosamente.\n")
        
        # Verificaci√≥n de integridad de datos (B√∫squeda de nulos)
        print("--- Reporte de Valores Nulos ---")
        datasets = {'Clientes': df_cli, 'Detalle': df_det, 'Productos': df_prod, 'Ventas': df_ven}
        for nombre, df in datasets.items():
            nulos = df.isnull().sum().sum()
            estado = "Sin nulos" if nulos == 0 else f"‚ö†Ô∏è {nulos} nulos detectados"
            print(f"{nombre}: {estado}")
            
        return df_cli, df_det, df_prod, df_ven
    except FileNotFoundError as e:
        print(f"‚ùå Error cr√≠tico: No se encontr√≥ el archivo. {e}")
        return None, None, None, None
    
    def crear_dataset_maestro(df_ven, df_det, df_prod, df_cli):
    """
    Tarea 2: Fusi√≥n de Datos (Data Merging).
    
    Crea una √∫nica tabla 'Maestra' que consolida toda la informaci√≥n dispersa.
    La l√≥gica de uni√≥n es:
    1. Ventas + Detalle (Uni√≥n 1 a N): Una venta tiene muchos productos.
    2. + Productos: Para saber el nombre y categor√≠a de lo vendido.
    3. + Clientes: Para saber qui√©n compr√≥ y de d√≥nde es.
    
    Args:
        df_ven, df_det, df_prod, df_cli: DataFrames individuales cargados previamente.
        
    Returns:
        pd.DataFrame: DataFrame consolidado y listo para an√°lisis.
    """
    # Paso 1: Unir cabecera de factura con detalle de items
    print("\nüîÑ Procesando fusi√≥n de tablas...")
    master = pd.merge(df_ven, df_det, on='id_venta', how='inner')
    
    # Paso 2: Enriquecer con datos del producto
    master = pd.merge(master, df_prod, on='id_producto', how='left')
    
    # Paso 3: Enriquecer con datos del cliente
    # Usamos suffixes para evitar conflictos si hay columnas con el mismo nombre (ej. email)
    master = pd.merge(master, df_cli, on='id_cliente', how='left', suffixes=('', '_cliente'))
    
    # Conversi√≥n de tipos: La fecha debe ser objeto datetime para an√°lisis temporal
    master['fecha'] = pd.to_datetime(master['fecha'])
    
    print(f" Fase 2 Completada. Dimensiones del Dataset Maestro: {master.shape}")
    return master