# ‚öîÔ∏è TIENDA AURELION - SISTEMA DE GESTI√ìN DE INVENTARIO

**Sprint 3 - Machine Learning - IBM**

---

## üìã √çndice
1. [Tema, Problema y Soluci√≥n](#tema)
2. [Fuente de Datos](#fuente)
3. [Estructura de Datos](#estructura)
4. [Desarrollo del Programa](#desarrollo)
5. [Demostraci√≥n Interactiva](#demo)
6. [An√°lisis y Estad√≠sticas](#analisis)
7. [Hallazgos y Conclusiones](#conclusiones)
8. [ü§ñ Machine Learning - Predicci√≥n de Ventas](#ml) ‚≠ê NUEVO

---

## 1. üéØ Tema, Problema y Soluci√≥n <a id='tema'></a>

### Tema
**Sistema de Gesti√≥n de Inventario para Tienda de Fantas√≠a Medieval**

La Tienda Aurelion es un comercio especializado en art√≠culos m√°gicos y de aventura.

### El Problema
- ‚ùå **Gesti√≥n manual ineficiente** - Registro en papel causa errores
- ‚ùå **Falta de visibilidad** - No hay forma r√°pida de consultar productos
- ‚ùå **Control de stock deficiente** - No se detectan productos con bajo inventario
- ‚ùå **Sin an√°lisis de datos** - No hay estad√≠sticas ni reportes

### La Soluci√≥n
‚úÖ **Sistema Interactivo en Python** que permite:
- Consultar productos por m√∫ltiples criterios
- Generar estad√≠sticas autom√°ticas
- Alertas de productos con stock bajo
- Gesti√≥n completa del inventario (agregar/actualizar)

---

## 2. üìä Fuente de Datos <a id='fuente'></a>

### Origen
Datos hist√≥ricos de la Tienda Aurelion, recopilados durante **2 a√±os de operaci√≥n**.

### M√©todo de Recolecci√≥n
- Registro de productos ingresados al inventario
- Informaci√≥n de proveedores
- Clasificaci√≥n manual por categor√≠as
- Actualizaci√≥n continua de precios y stock

### Almacenamiento
**Formato CSV** (Comma-Separated Values)
- ‚úÖ F√°cil lectura y escritura
- ‚úÖ Compatible con Excel, Python, bases de datos
- ‚úÖ Portable y respaldo sencillo
- ‚úÖ Bajo consumo de recursos

---

## 3. üóÇÔ∏è Estructura de Datos <a id='estructura'></a>

### Campos del Dataset

| Campo | Tipo | Tipo Python | Escala | Ejemplo |
|-------|------|-------------|--------|---------|
| **id** | Num√©rico entero | `int` | 1-20 | 1 |
| **nombre** | Texto | `str` | 10-30 chars | "Espada Celestial" |
| **categoria** | Categ√≥rico | `str` | 10 √∫nicas | "Armas" |
| **precio** | Num√©rico entero | `int` | 25-5000 | 1500 |
| **stock** | Num√©rico entero | `int` | 3-500 | 25 |
| **descripcion** | Texto | `str` | 20-50 chars | "Espada forjada..." |
| **proveedor** | Categ√≥rico | `str` | 9 √∫nicos | "Forja Celestial" |

### Clasificaci√≥n de Variables

**Variables Cuantitativas:**
- `precio` - Continua (discreta en pr√°ctica)
- `stock` - Discreta
- `id` - Discreta

**Variables Cualitativas:**
- `nombre`, `categoria`, `descripcion`, `proveedor` - Nominales

---

## üìä Dashboard Power BI - Sprint 4

Adem√°s del an√°lisis y la app en consola, el proyecto incluye un **dashboard profesional en Power BI**:

- Archivo: `Power BI/Sprint4.pbix`
- Imagen de vista previa: `Power BI/dashboard.jpg`
- Documentaci√≥n: `Power BI/Documentacion_Sprint4.md` y `Power BI/Presentacion_Lectura_PowerBI.md`

> Puedes abrir el archivo `.pbix` en Power BI Desktop y usar la imagen como apoyo visual en tus presentaciones.



In [None]:
# Importar librer√≠as necesarias
import csv
from typing import List, Dict, Optional

# Configuraci√≥n
# Para Sprint 4 utilizamos directamente el archivo de productos del proyecto
ARCHIVO_CSV = "../datos/productos.csv"
UMBRAL_STOCK_BAJO = 20

print("‚úÖ Librer√≠as importadas correctamente")
print(f"üìÅ Archivo de datos: {ARCHIVO_CSV}")
print(f"‚ö†Ô∏è  Umbral de stock bajo: {UMBRAL_STOCK_BAJO} unidades")

In [None]:
def cargar_datos() -> List[Dict]:
    """Carga los datos del archivo CSV."""
    productos = []
    try:
        with open(ARCHIVO_CSV, 'r', encoding='utf-8') as archivo:
            lector = csv.DictReader(archivo)
            for fila in lector:
                try:
                    fila['id'] = int(fila['id'])
                    fila['precio'] = int(fila['precio'])
                    fila['stock'] = int(fila['stock'])
                    productos.append(fila)
                except (ValueError, KeyError) as e:
                    print(f"‚ö†Ô∏è  Error en fila: {e}")
                    continue
        print(f"‚úÖ Se cargaron {len(productos)} productos correctamente.")
        return productos
    except FileNotFoundError:
        print(f"‚ùå No se encontr√≥ el archivo")
        return []

# Cargar los datos
productos = cargar_datos()

In [None]:
# Mostrar los primeros 3 productos
print("üì¶ PRIMEROS 3 PRODUCTOS:\n")
for i, p in enumerate(productos[:3], 1):
    print(f"‚ñ∂Ô∏è  Producto {i}:")
    for campo, valor in p.items():
        print(f"   {campo:12s}: {valor}")
    print("-" * 70)

---

## 4. üíª Desarrollo del Programa <a id='desarrollo'></a>

### Funciones Principales del Sistema

In [None]:
def mostrar_producto(producto: Dict):
    """Muestra informaci√≥n formateada de un producto."""
    print(f"{'‚îÄ' * 70}")
    print(f"  üÜî ID:          {producto['id']}")
    print(f"  üì¶ Nombre:      {producto['nombre']}")
    print(f"  üè∑Ô∏è  Categor√≠a:   {producto['categoria']}")
    print(f"  üí∞ Precio:      {producto['precio']} monedas")
    print(f"  üìä Stock:       {producto['stock']} unidades", end="")
    if producto['stock'] <= UMBRAL_STOCK_BAJO:
        print(" ‚ö†Ô∏è  ¬°STOCK BAJO!")
    else:
        print()
    print(f"  üìù Descripci√≥n: {producto['descripcion']}")
    print(f"  üè™ Proveedor:   {producto['proveedor']}")
    print(f"{'‚îÄ' * 70}")

In [None]:
def buscar_por_categoria(productos: List[Dict], categoria: str):
    """Busca productos de una categor√≠a espec√≠fica."""
    print(f"\nüè∑Ô∏è  B√öSQUEDA: '{categoria}'\n")
    resultados = [p for p in productos if p['categoria'].lower() == categoria.lower()]
    if resultados:
        print(f"‚úÖ Encontrados: {len(resultados)} producto(s)\n")
        for p in resultados:
            mostrar_producto(p)
    else:
        print(f"‚ùå No se encontraron productos")

In [None]:
def buscar_por_rango_precios(productos: List[Dict], precio_min: int, precio_max: int):
    """Busca productos en un rango de precios."""
    print(f"\nüí∞ RANGO: {precio_min} - {precio_max} monedas\n")
    resultados = [p for p in productos if precio_min <= p['precio'] <= precio_max]
    if resultados:
        print(f"‚úÖ Encontrados: {len(resultados)} producto(s)\n")
        for p in resultados:
            mostrar_producto(p)
    else:
        print(f"‚ùå No se encontraron productos")

In [None]:
def productos_bajo_stock(productos: List[Dict]):
    """Muestra productos con stock bajo."""
    print(f"\n‚ö†Ô∏è  PRODUCTOS CON STOCK BAJO (‚â§{UMBRAL_STOCK_BAJO})\n")
    resultados = sorted([p for p in productos if p['stock'] <= UMBRAL_STOCK_BAJO], 
                       key=lambda x: x['stock'])
    if resultados:
        print(f"‚ö†Ô∏è  Encontrados: {len(resultados)} producto(s) CR√çTICOS\n")
        for p in resultados:
            mostrar_producto(p)
        print(f"\nüí° Sugerencia: Contactar proveedores para reabastecer")
    else:
        print("‚úÖ Todos los productos tienen stock adecuado")

In [None]:
def estadisticas_inventario(productos: List[Dict]):
    """Genera estad√≠sticas del inventario."""
    print("\nüìä ESTAD√çSTICAS DEL INVENTARIO\n")
    
    total = len(productos)
    stock_total = sum(p['stock'] for p in productos)
    valor_total = sum(p['precio'] * p['stock'] for p in productos)
    categorias = len(set(p['categoria'] for p in productos))
    proveedores = len(set(p['proveedor'] for p in productos))
    
    mas_caro = max(productos, key=lambda x: x['precio'])
    mas_barato = min(productos, key=lambda x: x['precio'])
    precio_prom = sum(p['precio'] for p in productos) / total
    stock_prom = stock_total / total
    
    print(f"{'‚ïê' * 70}")
    print("  ESTAD√çSTICAS GENERALES")
    print(f"{'‚ïê' * 70}")
    print(f"  üì¶ Total productos:        {total}")
    print(f"  üè∑Ô∏è  Categor√≠as √∫nicas:      {categorias}")
    print(f"  üè™ Proveedores √∫nicos:     {proveedores}")
    print(f"  üìä Stock total:            {stock_total} unidades")
    print(f"  üí∞ Valor total inventario: {valor_total:,} monedas")
    print(f"  üíµ Precio promedio:        {precio_prom:.2f} monedas")
    print(f"  üìà Stock promedio:         {stock_prom:.2f} unidades")
    print(f"{'‚ïê' * 70}\n")
    
    print("  üíé M√°s caro:", mas_caro['nombre'], f"({mas_caro['precio']} monedas)")
    print("  üéØ M√°s econ√≥mico:", mas_barato['nombre'], f"({mas_barato['precio']} monedas)")

---

## 5. üéÆ Demostraci√≥n Interactiva <a id='demo'></a>

Ahora vamos a probar todas las funcionalidades del sistema.

In [None]:
# Demo 1: Mostrar primeros 5 productos
print("üìã PRIMEROS 5 PRODUCTOS:\n")
for i, p in enumerate(productos[:5], 1):
    print(f"\n‚ñ∂Ô∏è  Producto #{i}")
    mostrar_producto(p)

In [None]:
# Demo 2: Buscar productos de categor√≠a "Armas"
buscar_por_categoria(productos, "Armas")

---

## üë®‚Äçüíª Informaci√≥n del Autor

**Autor:** Martos Ludmila  
**DNI:** 34811650  
**Instituci√≥n:** IBM  
**Sprint:** 3 - Machine Learning  
**A√±o:** 2025

---

**¬© 2025 Martos Ludmila - Tienda Aurelion**


In [None]:
# Demo 3: Buscar productos de categor√≠a "Pociones"
buscar_por_categoria(productos, "Pociones")

In [None]:
# Demo 4: Buscar productos en rango 500-1500 monedas
buscar_por_rango_precios(productos, 500, 1500)

In [None]:
# Demo 5: Productos con stock bajo (ALERTA)
productos_bajo_stock(productos)

---

## 6. üìà An√°lisis y Estad√≠sticas <a id='analisis'></a>

In [None]:
# Estad√≠sticas generales
estadisticas_inventario(productos)

In [None]:
# An√°lisis por categor√≠a
print("\nüìä AN√ÅLISIS POR CATEGOR√çA\n" + "=" * 80)
categorias = sorted(set(p['categoria'] for p in productos))
for cat in categorias:
    prods = [p for p in productos if p['categoria'] == cat]
    stock = sum(p['stock'] for p in prods)
    valor = sum(p['precio'] * p['stock'] for p in prods)
    print(f"\nüè∑Ô∏è  {cat}")
    print(f"   ‚Ä¢ Productos: {len(prods)}")
    print(f"   ‚Ä¢ Stock total: {stock} unidades")
    print(f"   ‚Ä¢ Valor total: {valor:,} monedas")

In [None]:
# Top 5 productos por valor en inventario
print("\nüíé TOP 5 POR VALOR EN INVENTARIO\n" + "=" * 80)
productos_valor = [(p, p['precio'] * p['stock']) for p in productos]
productos_valor.sort(key=lambda x: x[1], reverse=True)
for i, (p, valor) in enumerate(productos_valor[:5], 1):
    print(f"\nüèÜ #{i} - {p['nombre']}")
    print(f"   Precio: {p['precio']} | Stock: {p['stock']} | Valor: {valor:,} monedas")

---

## 7. üìã Hallazgos y Conclusiones <a id='conclusiones'></a>

### Hallazgos Principales

#### 1. Estado del Inventario
- ‚úÖ **20 productos** distribuidos en **10 categor√≠as**
- ‚ö†Ô∏è **3 productos** con stock cr√≠tico
- ‚úÖ **85%** de productos con stock saludable

#### 2. An√°lisis Financiero
- üí∞ Valor total: **85,075 monedas de oro**
- üìä Rango de precios: **25 - 5,000 monedas** (200x diferencia)
- üíµ Precio promedio: **932 monedas**

#### 3. Diversificaci√≥n
- ‚úÖ **9 proveedores** diferentes (buena diversificaci√≥n)
- ‚úÖ Cat√°logo balanceado entre econ√≥micos y premium
- ‚úÖ M√∫ltiples categor√≠as

#### 4. Productos Cr√≠ticos (Requieren Reabastecimiento)
- ‚ö†Ô∏è **Gema de Resurrecci√≥n**: 3 unidades (alto valor, bajo stock)
- ‚ö†Ô∏è **Grimorio Antiguo**: 8 unidades
- ‚ö†Ô∏è **Capa de Invisibilidad**: 10 unidades

### Recomendaciones

**Corto Plazo:**
- ‚ö†Ô∏è Reabastecer 3 productos cr√≠ticos inmediatamente
- üìä Implementar alertas autom√°ticas
- üíæ Backup semanal del inventario

**Mediano Plazo:**
- üìà An√°lisis de tendencias de ventas
- ü§ñ Predicci√≥n de demanda con ML
- üìä Dashboard en Power BI

**Largo Plazo:**
- üåê Migrar a SQL si crece >100 productos
- üì± App m√≥vil para gesti√≥n
- üîó Integraci√≥n con sistema de ventas

### Sugerencias de Copilot

Durante el desarrollo se evaluaron **20 sugerencias de IA**:

**‚úÖ Aceptadas (10):**
1. `csv.DictReader` - Mejor legibilidad
2. Conversi√≥n expl√≠cita de tipos
3. Validaci√≥n centralizada
4. F-strings para formateo
5. Context managers (`with`)
6. Type hints
7. Separadores Unicode
8. Emojis tem√°ticos
9. List comprehensions
10. `sorted()` con key

**‚ùå Descartadas (10):**
1. SQLite - Innecesario para 20 productos
2. GUI tkinter - Fuera del alcance
3. Pandas - Dependencia externa innecesaria
4. Autenticaci√≥n - No requerido
5. Logging - Print es suficiente
6. Regex - Overkill
7. POO con clases - Estructura simple mejor
8. Virtualenv - Sin dependencias
9. Tests unitarios - Demo educativa
10. API REST - Fuera del alcance

**Criterio:** Simplicidad, portabilidad y requisitos del proyecto.

---

## üìö Informaci√≥n del Proyecto

**Proyecto:** Tienda Aurelion - Sistema de Gesti√≥n de Inventario  
**Sprint:** 3 - Machine Learning  
**Instituci√≥n:** IBM  
**A√±o:** 2025  

### Archivos del Proyecto
- `productos.csv`, `clientes.csv`, `ventas.csv`, `detalle_ventas.csv` - Base de datos
- `tienda_aurelion.ipynb` - Este notebook (Jupyter)
- `tienda_aurelion.py` - Versi√≥n consola Python
- `app_streamlit.py` - Aplicaci√≥n web
- `modelo_ml_ventas.py` - Script Machine Learning
- `README.md` - Documentaci√≥n completa

### Tecnolog√≠as
- Python 3.6+
- Jupyter Notebook
- Scikit-learn (Machine Learning)
- Pandas, NumPy, Matplotlib

---

**¬°Proyecto completo con Machine Learning! ‚öîÔ∏èü§ñ‚ú®**

---

# ü§ñ SECCI√ìN 8: MACHINE LEARNING
---

## Predicci√≥n de Ventas con Random Forest <a id='ml'></a>

En esta secci√≥n implementamos un **modelo de Machine Learning** para predecir el total de ventas bas√°ndose en las caracter√≠sticas de los productos y patrones de compra.

### üéØ Objetivo
Predecir el **monto total** de una venta antes de que se concrete.

### üå≤ Algoritmo: Random Forest Regressor
| Par√°metro | Valor |
|-----------|-------|
| **Tipo** | Regresi√≥n supervisada |
| **√Årboles** | 100 |
| **M√©tricas** | R¬≤, MAE, RMSE, MAPE |


In [None]:
# Importar librer√≠as de Machine Learning
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
import matplotlib.pyplot as plt

print("‚úÖ Librer√≠as de Machine Learning importadas")


In [None]:
# Cargar datos para ML (necesitamos los 4 CSVs)
print("=" * 80)
print("ü§ñ MACHINE LEARNING - PREDICCI√ìN DE VENTAS")
print("=" * 80)

# Cargar CSVs
df_productos = pd.read_csv("../datos/productos.csv")
df_clientes = pd.read_csv("../datos/clientes.csv")
df_ventas = pd.read_csv("../datos/ventas.csv")
df_detalle = pd.read_csv("../datos/detalle_ventas.csv")

print(f"\n‚úÖ Datos cargados:")
print(f"   - Productos: {len(df_productos)}")
print(f"   - Clientes: {len(df_clientes)}")
print(f"   - Ventas: {len(df_ventas)}")
print(f"   - Detalles: {len(df_detalle)}")


In [None]:
# Ingenier√≠a de caracter√≠sticas
print("\nüîß INGENIER√çA DE CARACTER√çSTICAS")
print("-" * 80)

# Convertir fecha
df_ventas['fecha'] = pd.to_datetime(df_ventas['fecha'])

# Extraer caracter√≠sticas temporales
df_ventas['mes'] = df_ventas['fecha'].dt.month
df_ventas['dia_semana'] = df_ventas['fecha'].dt.dayofweek
df_ventas['dia_mes'] = df_ventas['fecha'].dt.day

# Unir detalle con productos
df_detalle_productos = df_detalle.merge(
    df_productos[['id', 'categoria', 'precio']], 
    left_on='id_producto', 
    right_on='id'
)

# Calcular caracter√≠sticas por venta
caracteristicas_ventas = df_detalle_productos.groupby('id_venta').agg({
    'cantidad': 'sum',
    'id_producto': 'nunique',
    'precio_unitario': 'mean',
    'subtotal': 'sum',
    'categoria': lambda x: x.mode()[0] if len(x.mode()) > 0 else x.iloc[0]
}).reset_index()

caracteristicas_ventas.columns = [
    'id_venta', 'cantidad_total', 'productos_unicos', 
    'precio_promedio', 'subtotal_calculado', 'categoria_principal'
]

# Unir con ventas
df_ml = df_ventas.merge(caracteristicas_ventas, on='id_venta')

# One-Hot Encoding para categor√≠a
df_ml = pd.get_dummies(df_ml, columns=['categoria_principal'], prefix='cat')

print(f"‚úÖ Dataset ML creado: {len(df_ml)} registros, {df_ml.shape[1]} columnas")
print(f"\nüìä Caracter√≠sticas creadas:")
print("   - cantidad_total, productos_unicos, precio_promedio")
print("   - mes, dia_semana, dia_mes")
print("   - cat_* (categor√≠a principal codificada)")


In [None]:
# Preparar datos y entrenar modelo
print("\nüéì ENTRENAMIENTO DEL MODELO")
print("-" * 80)

# Preparar X e y
columnas_excluir = ['id_venta', 'id_cliente', 'fecha', 'total', 'subtotal_calculado']
X = df_ml.drop(columns=columnas_excluir)
y = df_ml['total']

# Divisi√≥n train/test (80/20)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print(f"‚úÖ Divisi√≥n de datos:")
print(f"   - Entrenamiento: {len(X_train)} ({len(X_train)/len(X)*100:.0f}%)")
print(f"   - Prueba: {len(X_test)} ({len(X_test)/len(X)*100:.0f}%)")
print(f"   - Caracter√≠sticas: {X.shape[1]}")

# Entrenar modelo
print("\nüå≤ Entrenando Random Forest Regressor (100 √°rboles)...")
modelo = RandomForestRegressor(n_estimators=100, random_state=42, n_jobs=-1)
modelo.fit(X_train, y_train)
print("‚úÖ ¬°Modelo entrenado exitosamente!")


In [None]:
# Evaluaci√≥n del modelo
print("\nüìä M√âTRICAS DE EVALUACI√ìN")
print("=" * 80)

# Predicciones
y_pred_train = modelo.predict(X_train)
y_pred_test = modelo.predict(X_test)

# M√©tricas entrenamiento
mae_train = mean_absolute_error(y_train, y_pred_train)
rmse_train = np.sqrt(mean_squared_error(y_train, y_pred_train))
r2_train = r2_score(y_train, y_pred_train)
mape_train = np.mean(np.abs((y_train - y_pred_train) / y_train)) * 100

# M√©tricas prueba
mae_test = mean_absolute_error(y_test, y_pred_test)
rmse_test = np.sqrt(mean_squared_error(y_test, y_pred_test))
r2_test = r2_score(y_test, y_pred_test)
mape_test = np.mean(np.abs((y_test - y_pred_test) / y_test)) * 100

print("\nüéì Conjunto de Entrenamiento:")
print(f"   ‚Ä¢ R¬≤ Score: {r2_train:.4f} ({r2_train*100:.2f}%)")
print(f"   ‚Ä¢ MAE: {mae_train:.2f} monedas")
print(f"   ‚Ä¢ RMSE: {rmse_train:.2f} monedas")

print("\nüß™ Conjunto de Prueba:")
print(f"   ‚Ä¢ R¬≤ Score: {r2_test:.4f} ({r2_test*100:.2f}%)")
print(f"   ‚Ä¢ MAE: {mae_test:.2f} monedas")
print(f"   ‚Ä¢ RMSE: {rmse_test:.2f} monedas")
print(f"   ‚Ä¢ MAPE: {mape_test:.2f}%")

print("\nüí° Interpretaci√≥n:")
print(f"   ‚Ä¢ El modelo explica el {r2_test*100:.1f}% de la variabilidad en ventas")
print(f"   ‚Ä¢ Error promedio de {mae_test:.0f} monedas por predicci√≥n")
print(f"   ‚Ä¢ Error porcentual promedio de {mape_test:.1f}%")


In [None]:
# Visualizaciones del modelo ML
print("\nüìà VISUALIZACIONES DEL MODELO")
print("=" * 80)

fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# 1. Predicciones vs Valores Reales
axes[0, 0].scatter(y_test, y_pred_test, alpha=0.6, s=80, edgecolors='black', linewidth=0.5)
axes[0, 0].plot([y_test.min(), y_test.max()], [y_test.min(), y_test.max()], 
                'r--', lw=2, label='Predicci√≥n Perfecta')
axes[0, 0].set_xlabel('Valor Real (monedas)')
axes[0, 0].set_ylabel('Predicci√≥n (monedas)')
axes[0, 0].set_title(f'Predicciones vs Valores Reales (R¬≤={r2_test:.4f})')
axes[0, 0].legend()
axes[0, 0].grid(True, alpha=0.3)

# 2. Distribuci√≥n de Errores
errores = y_test - y_pred_test
axes[0, 1].hist(errores, bins=15, edgecolor='black', alpha=0.7, color='skyblue')
axes[0, 1].axvline(x=0, color='red', linestyle='--', linewidth=2, label='Error = 0')
axes[0, 1].set_xlabel('Error (Real - Predicci√≥n)')
axes[0, 1].set_ylabel('Frecuencia')
axes[0, 1].set_title('Distribuci√≥n de Errores de Predicci√≥n')
axes[0, 1].legend()
axes[0, 1].grid(True, alpha=0.3)

# 3. Importancia de Caracter√≠sticas
importancias = pd.DataFrame({
    'caracteristica': X.columns,
    'importancia': modelo.feature_importances_
}).sort_values('importancia', ascending=False).head(10)

colores = plt.cm.viridis(np.linspace(0, 1, len(importancias)))
axes[1, 0].barh(range(len(importancias)), importancias['importancia'], color=colores, edgecolor='black')
axes[1, 0].set_yticks(range(len(importancias)))
axes[1, 0].set_yticklabels(importancias['caracteristica'])
axes[1, 0].set_xlabel('Importancia')
axes[1, 0].set_title('Top 10 Caracter√≠sticas M√°s Importantes')
axes[1, 0].grid(True, alpha=0.3, axis='x')
axes[1, 0].invert_yaxis()

# 4. Residuos vs Predicciones
axes[1, 1].scatter(y_pred_test, errores, alpha=0.6, s=80, edgecolors='black', linewidth=0.5)
axes[1, 1].axhline(y=0, color='red', linestyle='--', linewidth=2)
axes[1, 1].set_xlabel('Predicci√≥n (monedas)')
axes[1, 1].set_ylabel('Residuo')
axes[1, 1].set_title(f'Residuos vs Predicciones (MAE={mae_test:.2f})')
axes[1, 1].grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig('../graficos/modelo_ml_notebook.png', dpi=300, bbox_inches='tight')
print("‚úÖ Gr√°fico guardado: graficos/modelo_ml_notebook.png")
plt.show()


In [None]:
# Resumen del modelo ML
print("\n" + "=" * 80)
print("‚úÖ RESUMEN DEL MODELO DE MACHINE LEARNING")
print("=" * 80)

print(f"""
üéØ Objetivo: Predecir el total de ventas
üå≤ Algoritmo: Random Forest Regressor (100 √°rboles)
üìä Registros: {len(df_ml)} ventas

üìà M√âTRICAS FINALES (Test):
   ‚Ä¢ R¬≤ Score: {r2_test:.4f} ({r2_test*100:.2f}%)
   ‚Ä¢ MAE: {mae_test:.2f} monedas
   ‚Ä¢ RMSE: {rmse_test:.2f} monedas
   ‚Ä¢ MAPE: {mape_test:.2f}%

üéØ TOP 3 CARACTER√çSTICAS:
""")

for i, (_, row) in enumerate(importancias.head(3).iterrows(), 1):
    print(f"   {i}. {row['caracteristica']}: {row['importancia']*100:.2f}%")

print(f"""
üí° CONCLUSI√ìN:
El modelo Random Forest logra predecir el total de ventas con un R¬≤ de {r2_test:.2f},
explicando el {r2_test*100:.1f}% de la variabilidad. El error promedio es de {mae_test:.0f} monedas.

üìÅ Gr√°fico guardado en: graficos/modelo_ml_notebook.png
""")
print("=" * 80)
