### üß™ An√°lisis de Datos - Sistema de Ventas Tienda Aurelion
### ETL + Visualizaciones + An√°lisis para Machine Learning
### **Base de datos:** MariaDB (XAMPP)  
### **Herramientas:** Polars (ETL), Plotly (Visualizaciones), Scikit-learn (ML Prep)

### 1. Importamos las librerias

In [24]:
import polars as pl
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import mysql.connector
from mysql.connector import Error
import warnings
warnings.filterwarnings('ignore')

# Configuraci√≥n para visualizaciones
import plotly.io as pio
pio.templates.default = "plotly_white"

### 2. Conexion a la base de datos AurelionDB

In [25]:
def conectar_bd():
    """Establece conexi√≥n con la base de datos MariaDB en XAMPP"""
    try:
        conexion = mysql.connector.connect(
            host='localhost',
            user='root',  # Usuario por defecto de XAMPP
            password='',  # Password por defecto (vac√≠o en XAMPP)
            database='AurelionDB',
            port=3306  # Puerto por defecto de MySQL en XAMPP
        )
        
        if conexion.is_connected():
            print('‚úÖ Conexi√≥n exitosa a la base de datos')
            return conexion
            
    except Error as e:
        print(f'‚ùå Error al conectar: {e}')
        return None

### 2.1 Probar conexi√≥n

In [26]:
conexion = conectar_bd()

‚úÖ Conexi√≥n exitosa a la base de datos


### 3. Extracci√≥n de datos - POLARS


In [27]:
def extraer_datos_polars(conexion):
    """Extrae todos los datos de la base de datos usando Polars"""
    
    # Consultas SQL para extraer datos
    consultas = {
        'clientes': 'SELECT * FROM Clientes',
        'productos': 'SELECT * FROM Productos', 
        'ventas': 'SELECT * FROM Ventas',
        'detalles_ventas': 'SELECT * FROM Detalles_Ventas'
    }
    
    datos = {}
    
    for nombre, consulta in consultas.items():
        try:
            # Usar Pandas temporalmente para la conexi√≥n y luego convertir a Polars
            import pandas as pd
            df_pandas = pd.read_sql(consulta, conexion)
            datos[nombre] = pl.from_pandas(df_pandas)
            print(f'‚úÖ {nombre.capitalize()} extra√≠dos: {len(datos[nombre])} registros')
            
        except Exception as e:
            print(f'‚ùå Error extrayendo {nombre}: {e}')
    
    return datos


### 3.1 Extraer datos

In [28]:
datos = extraer_datos_polars(conexion)

‚úÖ Clientes extra√≠dos: 100 registros
‚úÖ Productos extra√≠dos: 100 registros
‚úÖ Ventas extra√≠dos: 120 registros
‚úÖ Detalles_ventas extra√≠dos: 343 registros


### 4. Mostrar resumen de datos

In [29]:
for nombre, df in datos.items():
    print(f"{nombre.upper()}: {len(df)} registros, {len(df.columns)} columnas")

CLIENTES: 100 registros, 5 columnas
PRODUCTOS: 100 registros, 4 columnas
VENTAS: 120 registros, 6 columnas
DETALLES_VENTAS: 343 registros, 7 columnas


### 5. Transformaci√≥n de Datos - POLARS

In [None]:
def transformar_datos_robusta(datos):
    """Transformaci√≥n de datos con manejo de errores"""
    
    print("üîÑ Iniciando transformaciones...")
    
    # Crear copias
    clientes = datos['clientes'].clone()
    productos = datos['productos'].clone()
    ventas = datos['ventas'].clone()
    detalles = datos['detalles_ventas'].clone()
    
    # 1. Conversiones b√°sicas de tipos
    try:
        detalles = detalles.with_columns([
            pl.col('cantidad').cast(pl.Float64),
            pl.col('importe').cast(pl.Float64),
            pl.col('precio_unitario').cast(pl.Float64)
        ])
        print("‚úÖ Tipos de detalles convertidos")
    except Exception as e:
        print(f"‚ö†Ô∏è  Error en detalles: {e}")
    
    try:
        productos = productos.with_columns([
            pl.col('precio_unitario').cast(pl.Float64)
        ])
        print("‚úÖ Tipos de productos convertidos")
    except Exception as e:
        print(f"‚ö†Ô∏è  Error en productos: {e}")
    
    # 2. Joins b√°sicos
    try:
        # Join detalles con ventas
        ventas_detalladas = detalles.join(ventas, on='id_venta', how='left')
        # Join con productos
        ventas_detalladas = ventas_detalladas.join(productos, on='id_producto', how='left')
        # Join con clientes
        ventas_detalladas = ventas_detalladas.join(clientes, on='id_cliente', how='left')
        print("‚úÖ Joins completados")
    except Exception as e:
        print(f"‚ùå Error en joins: {e}")
        ventas_detalladas = detalles  # Usar solo detalles como fallback
    
    # 3. M√©tricas b√°sicas (si tenemos fecha)
    if 'fecha' in ventas_detalladas.columns:
        try:
            ventas_detalladas = ventas_detalladas.with_columns([
                pl.col('importe').alias('ingreso_total'),
                (pl.col('importe') / pl.col('cantidad')).alias('precio_promedio')
            ])
            print("‚úÖ M√©tricas b√°sicas calculadas")
        except Exception as e:
            print(f"‚ö†Ô∏è  Error en m√©tricas: {e}")
    
    return {
        'ventas_detalladas': ventas_detalladas,
        'datos_originales': datos
    }

# Aplicar transformaci√≥n
datos_transformados = transformar_datos_robusta(datos)
print(f"üìä Datos transformados: {len(datos_transformados['ventas_detalladas'])} registros")

üîÑ Iniciando transformaciones...
‚úÖ Tipos de detalles convertidos
‚úÖ Tipos de productos convertidos
‚úÖ Joins completados
‚úÖ M√©tricas b√°sicas calculadas
üìä Datos transformados: 343 registros


### 6. VERIFICACI√ìN DE DATOS TRANSFORMADOS

In [None]:
print("üîç VERIFICACI√ìN DE DATOS TRANSFORMADOS:")

vd = datos_transformados['ventas_detalladas']
print(f"Columnas disponibles: {vd.columns}")
print(f"N√∫mero de registros: {len(vd)}")
print("\nPrimeras 3 filas:")
print(vd.head(3))

print("\nEstad√≠sticas b√°sicas:")
print(vd.select(['cantidad', 'importe']).describe())

üîç VERIFICACI√ìN DE DATOS TRANSFORMADOS:
Columnas disponibles: ['id_detalle', 'id_venta', 'id_producto', 'nombre_producto', 'cantidad', 'precio_unitario', 'importe', 'fecha', 'id_cliente', 'nombre_cliente', 'email', 'medio_pago', 'nombre_producto_right', 'categoria', 'precio_unitario_right', 'nombre_cliente_right', 'email_right', 'ciudad', 'fecha_alta', 'ingreso_total', 'precio_promedio']
N√∫mero de registros: 343

Primeras 3 filas:
shape: (3, 21)
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ id_detalle ‚îÜ id_venta ‚îÜ id_product ‚îÜ nombre_pro ‚îÜ ‚Ä¶ ‚îÜ ciudad ‚îÜ fecha_alt ‚îÜ ingreso_t ‚îÜ precio_pr ‚îÇ
‚îÇ ---        ‚îÜ ---      ‚îÜ o          ‚îÜ ducto      ‚îÜ   ‚îÜ ---    ‚îÜ a         ‚îÜ otal      ‚îÜ omedio    ‚îÇ
‚

### 7. VISUALIZACI√ìN 1 - DISTRIBUCI√ìN DE VENTAS

In [None]:
print("üìà GENERANDO VISUALIZACI√ìN 1...")

vd_pandas = datos_transformados['ventas_detalladas'].to_pandas()

# Histograma de importes
fig1 = px.histogram(vd_pandas, x='importe', 
                   title='Distribuci√≥n de Importes de Ventas',
                   nbins=30,
                   color_discrete_sequence=['blue'])
fig1.show()

# Boxplot de importes
fig2 = px.box(vd_pandas, y='importe', 
             title='Distribuci√≥n de Importes (Boxplot)')
fig2.show()

üìà GENERANDO VISUALIZACI√ìN 1...


### 8. VISUALIZACI√ìN 2 - AN√ÅLISIS POR PRODUCTO

In [None]:
print("üìà GENERANDO VISUALIZACI√ìN 2...")

# Top 10 productos por ingresos
top_productos = datos_transformados['ventas_detalladas'].group_by('nombre_producto').agg([
    pl.sum('importe').alias('ingresos_totales'),
    pl.sum('cantidad').alias('unidades_vendidas'),
    pl.mean('importe').alias('ticket_promedio')
]).sort('ingresos_totales', descending=True).head(10)

print("üèÜ TOP 10 PRODUCTOS:")
print(top_productos)

# Gr√°fico de barras
fig3 = px.bar(top_productos.to_pandas(), 
             x='nombre_producto', y='ingresos_totales',
             title='Top 10 Productos por Ingresos',
             color='unidades_vendidas',
             labels={'nombre_producto': 'Producto', 'ingresos_totales': 'Ingresos Totales'})
fig3.show()

üìà GENERANDO VISUALIZACI√ìN 2...
üèÜ TOP 10 PRODUCTOS:
shape: (10, 4)
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ nombre_producto            ‚îÜ ingresos_totales ‚îÜ unidades_vendidas ‚îÜ ticket_promedio ‚îÇ
‚îÇ ---                        ‚îÜ ---              ‚îÜ ---               ‚îÜ ---             ‚îÇ
‚îÇ str                        ‚îÜ f64              ‚îÜ f64               ‚îÜ f64             ‚îÇ
‚ïû‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï°
‚îÇ Desodorante Aerosol        ‚îÜ 93800.0          ‚îÜ 20.0              ‚îÜ 13400.0         ‚îÇ
‚îÇ Queso R

### 9. VISUALIZACI√ìN 3 - AN√ÅLISIS TEMPORAL

In [None]:
print("üìà GENERANDO VISUALIZACI√ìN 3...")

if 'fecha' in datos_transformados['ventas_detalladas'].columns:
    # Agrupar por mes
    ventas_mensuales = datos_transformados['ventas_detalladas'].with_columns([
        pl.col('fecha').dt.strftime('%Y-%m').alias('mes')
    ]).group_by('mes').agg([
        pl.sum('importe').alias('ingresos_mensuales'),
        pl.count().alias('ventas_totales')
    ]).sort('mes')
    
    fig4 = px.line(ventas_mensuales.to_pandas(), 
                  x='mes', y='ingresos_mensuales',
                  title='Evoluci√≥n Mensual de Ingresos',
                  markers=True)
    fig4.show()
else:
    print("‚ÑπÔ∏è  No hay datos de fecha para an√°lisis temporal")

üìà GENERANDO VISUALIZACI√ìN 3...


### 10. VISUALIZACI√ìN 4 - AN√ÅLISIS POR CATEGOR√çA

In [None]:
print("üìà GENERANDO VISUALIZACI√ìN 4...")

if 'categoria' in datos_transformados['ventas_detalladas'].columns:
    ventas_categoria = datos_transformados['ventas_detalladas'].group_by('categoria').agg([
        pl.sum('importe').alias('ingresos_totales'),
        pl.sum('cantidad').alias('unidades_vendidas'),
        pl.mean('importe').alias('ticket_promedio')
    ])
    
    # Gr√°fico de torta
    fig5 = px.pie(ventas_categoria.to_pandas(), 
                 values='ingresos_totales', names='categoria',
                 title='Distribuci√≥n de Ingresos por Categor√≠a')
    fig5.show()
    
    # Gr√°fico de barras
    fig6 = px.bar(ventas_categoria.to_pandas(),
                 x='categoria', y='ingresos_totales',
                 title='Ingresos por Categor√≠a',
                 color='unidades_vendidas')
    fig6.show()

üìà GENERANDO VISUALIZACI√ìN 4...


### 11. AN√ÅLISIS DE CLIENTES

In [42]:
print("üë• ANALIZANDO CLIENTES...")

if 'nombre_cliente' in datos_transformados['ventas_detalladas'].columns:
    analisis_clientes = datos_transformados['ventas_detalladas'].group_by('id_cliente', 'nombre_cliente', 'ciudad').agg([
        pl.sum('importe').alias('gasto_total'),
        pl.count().alias('compras_totales'),
        pl.mean('importe').alias('ticket_promedio')
    ]).sort('gasto_total', descending=True)
    
    print("üèÜ TOP 10 CLIENTES:")
    print(analisis_clientes.head(10))
    
    # Gr√°fico de clientes top
    top_clientes = analisis_clientes.head(10)
    fig7 = px.bar(top_clientes.to_pandas(),
                 x='nombre_cliente', y='gasto_total',
                 title='Top 10 Clientes por Gasto Total',
                 color='compras_totales',
                 labels={'nombre_cliente': 'Cliente', 'gasto_total': 'Gasto Total'})
    fig7.show()

üë• ANALIZANDO CLIENTES...
üèÜ TOP 10 CLIENTES:
shape: (10, 6)
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ id_cliente ‚îÜ nombre_cliente     ‚îÜ ciudad      ‚îÜ gasto_total ‚îÜ compras_totales ‚îÜ ticket_promedio ‚îÇ
‚îÇ ---        ‚îÜ ---                ‚îÜ ---         ‚îÜ ---         ‚îÜ ---             ‚îÜ ---             ‚îÇ
‚îÇ f64        ‚îÜ str                ‚îÜ str         ‚îÜ f64         ‚îÜ u32             ‚îÜ f64             ‚îÇ
‚ïû‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚

### 12. AN√ÅLISIS DE M√âTODOS DE PAGO

In [43]:
print("üí≥ ANALIZANDO M√âTODOS DE PAGO...")

if 'medio_pago' in datos_transformados['ventas_detalladas'].columns:
    analisis_pago = datos_transformados['ventas_detalladas'].group_by('medio_pago').agg([
        pl.sum('importe').alias('ingresos_totales'),
        pl.count().alias('transacciones'),
        pl.mean('importe').alias('ticket_promedio')
    ])
    
    print("üìã M√âTODOS DE PAGO:")
    print(analisis_pago)
    
    fig8 = px.bar(analisis_pago.to_pandas(),
                 x='medio_pago', y='ingresos_totales',
                 title='Ingresos por M√©todo de Pago',
                 color='transacciones')
    fig8.show()

üí≥ ANALIZANDO M√âTODOS DE PAGO...
üìã M√âTODOS DE PAGO:
shape: (4, 4)
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ medio_pago    ‚îÜ ingresos_totales ‚îÜ transacciones ‚îÜ ticket_promedio ‚îÇ
‚îÇ ---           ‚îÜ ---              ‚îÜ ---           ‚îÜ ---             ‚îÇ
‚îÇ str           ‚îÜ f64              ‚îÜ u32           ‚îÜ f64             ‚îÇ
‚ïû‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï°
‚îÇ tarjeta       ‚îÜ 460099.0         ‚îÜ 69            ‚îÜ 6668.101449     ‚îÇ
‚îÇ qr            ‚îÜ 714280.0         ‚îÜ 91            ‚îÜ 7849.230769     ‚îÇ
‚îÇ efectivo      ‚îÜ 934819.0         ‚îÜ 111           ‚îÜ 8421.792793     ‚îÇ
‚îÇ transferencia ‚

### 13. PREPARACI√ìN PARA MACHINE LEARNING

In [44]:
print("ü§ñ PREPARANDO DATOS PARA ML...")

# Crear caracter√≠sticas b√°sicas
datos_ml = datos_transformados['ventas_detalladas'].select([
    'id_venta', 'id_producto', 'id_cliente', 'cantidad', 'importe'
])

# Agregar caracter√≠sticas si est√°n disponibles
if 'categoria' in datos_transformados['ventas_detalladas'].columns:
    datos_ml = datos_ml.with_columns(
        datos_transformados['ventas_detalladas']['categoria']
    )

if 'medio_pago' in datos_transformados['ventas_detalladas'].columns:
    datos_ml = datos_ml.with_columns(
        datos_transformados['ventas_detalladas']['medio_pago']
    )

print("üìä DATOS PARA ML:")
print(f"Forma: {datos_ml.shape}")
print("Columnas:", datos_ml.columns)
print("\nMuestra:")
print(datos_ml.head(5))

ü§ñ PREPARANDO DATOS PARA ML...
üìä DATOS PARA ML:
Forma: (343, 7)
Columnas: ['id_venta', 'id_producto', 'id_cliente', 'cantidad', 'importe', 'categoria', 'medio_pago']

Muestra:
shape: (5, 7)
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ id_venta ‚îÜ id_producto ‚îÜ id_cliente ‚îÜ cantidad ‚îÜ importe ‚îÜ categoria ‚îÜ medio_pago ‚îÇ
‚îÇ ---      ‚îÜ ---         ‚îÜ ---        ‚îÜ ---      ‚îÜ ---     ‚îÜ ---       ‚îÜ ---        ‚îÇ
‚îÇ f64      ‚îÜ f64         ‚îÜ f64        ‚îÜ f64      ‚îÜ f64     ‚îÜ str       ‚îÜ str        ‚îÇ
‚ïû‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê

### 14. EXPORTACI√ìN DE DATOS

In [None]:
print("üíæ EXPORTANDO DATOS...")

import os
os.makedirs('datos_exportados', exist_ok=True)

# Exportar datos procesados
datos_transformados['ventas_detalladas'].write_csv('datos_exportados/ventas_procesadas.csv')

# Exportar an√°lisis espec√≠ficos
if 'analisis_clientes' in datos_transformados:
    datos_transformados['analisis_clientes'].write_csv('datos_exportados/analisis_clientes.csv')

print("‚úÖ Datos exportados en la carpeta 'datos_exportados/'")

üíæ EXPORTANDO DATOS...
‚úÖ Datos exportados en la carpeta 'datos_exportados/'


### 15. RESUMEN FINAL

In [None]:
print("\n" + "="*60)
print("üéâ AN√ÅLISIS COMPLETADO EXITOSAMENTE")
print("="*60)

vd = datos_transformados['ventas_detalladas']
print(f"üìä Total registros procesados: {len(vd)}")
print(f"üí∞ Ingreso total: {vd['importe'].sum():,.2f}")
print(f"üì¶ Transacciones √∫nicas: {vd['id_venta'].n_unique()}")

if 'nombre_cliente' in vd.columns:
    print(f"üë• Clientes √∫nicos: {vd['id_cliente'].n_unique()}")

if 'nombre_producto' in vd.columns:
    print(f"üè™ Productos √∫nicos: {vd['id_producto'].n_unique()}")

print("üìà Visualizaciones generadas: 7+ gr√°ficos interactivos")
print("üíæ Datos exportados para an√°lisis futuros")
print("ü§ñ Datos preparados para Machine Learning")
print("="*60)

# Cerrar conexi√≥n
if conexion and conexion.is_connected():
    conexion.close()
    print("‚úÖ Conexi√≥n a BD cerrada")


üéâ AN√ÅLISIS COMPLETADO EXITOSAMENTE
üìä Total registros procesados: 343
üí∞ Ingreso total: 2,651,417.00
üì¶ Transacciones √∫nicas: 120
üë• Clientes √∫nicos: 67
üè™ Productos √∫nicos: 95
üìà Visualizaciones generadas: 7+ gr√°ficos interactivos
üíæ Datos exportados para an√°lisis futuros
ü§ñ Datos preparados para Machine Learning
‚úÖ Conexi√≥n a BD cerrada


# Anexos

In [47]:
# =============================================================================
# 16. FUNCI√ìN PARA CONSULTAS R√ÅPIDAS (OPCIONAL)
# =============================================================================
def consulta_rapida(sql_query):
    """Funci√≥n para ejecutar consultas SQL r√°pidas"""
    conexion = conectar_bd()
    if conexion:
        import pandas as pd
        resultado = pd.read_sql(sql_query, conexion)
        conexion.close()
        return pl.from_pandas(resultado)
    return None

# Ejemplo de uso:
resultado = consulta_rapida("SELECT * FROM Ventas LIMIT 5")
print(resultado)

‚úÖ Conexi√≥n exitosa a la base de datos
shape: (5, 6)
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ id_venta ‚îÜ fecha        ‚îÜ id_cliente ‚îÜ nombre_cliente   ‚îÜ email                  ‚îÜ medio_pago    ‚îÇ
‚îÇ ---      ‚îÜ ---          ‚îÜ ---        ‚îÜ ---              ‚îÜ ---                    ‚îÜ ---           ‚îÇ
‚îÇ f64      ‚îÜ datetime[ns] ‚îÜ f64        ‚îÜ str              ‚îÜ str                    ‚îÜ str           ‚îÇ
‚ïû‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï™‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï