# Librerias

In [33]:
# 📦 Importación de librerías necesarias
import pandas as pd
import matplotlib.pyplot as plt

# Carga del archivo

In [34]:
# 📁 1. Cargar el archivo Excel
ruta_archivo = 'data/tombola.xlsx'
try:
    df = pd.read_excel(ruta_archivo)
    print("✅ Archivo cargado correctamente.")
except FileNotFoundError:
    print("❌ Error: El archivo 'tombola.xlsx' no se encontró en la carpeta 'data'.")
    exit()

# 👁 2. Vista previa del DataFrame
print("\n🔍 Primeras filas del archivo:")
print(df.head())

✅ Archivo cargado correctamente.

🔍 Primeras filas del archivo:
       Fecha  Posicion  Numero
0 2025-07-21         1      25
1 2025-07-21         2       5
2 2025-07-21         3      88
3 2025-07-21         4      91
4 2025-07-21         5      76


### 🔹 Nivel 1 - Estadística Básica

#### ✅ Análisis de Frecuencia


**Descripción**: Contar cuántas veces apareció cada número y seleccionar los 10 más frecuentes.


In [35]:
# Ejecutar el script desde Scripts
!python Scripts/analisis_frecuencia_tombola.py

[40, 28, 17, 81, 37, 5, 25, 79, 2, 29]


### 🔹 Nivel 2 - Modelos Intermedios con ML

#### 1. Clasificación Binaria (Random Forest / XGBoost / LightGBM)

**Descripción**: Crear un dataset donde por cada día indiques si un número apareció (1) o no (0), y uses features como día de la semana, frecuencia pasada, etc.

#### Random Forest:

In [36]:
!python Scripts/modelo_rf_binario_tombola.py

✅ Archivo cargado correctamente.

📋 Reporte de Clasificación:
              precision    recall  f1-score   support

           0       0.91      0.96      0.93       236
           1       0.17      0.08      0.11        24

    accuracy                           0.88       260
   macro avg       0.54      0.52      0.52       260
weighted avg       0.84      0.88      0.86       260

🎯 Precisión general: 87.69 %

📈 Importancia de las features:
- numero: 83.19%
- dia_semana: 11.12%
- frecuencia_pasada: 5.69%

🔟 Números con mayor probabilidad de salir en el próximo sorteo:
[12, 86, 97, 39, 41, 54, 45, 29, 7, 81]


#### XGBoost:

In [37]:
!python Scripts/modelo_xgb_binario_tombola.py

✅ Archivo cargado correctamente.

📋 Reporte de Clasificación:
              precision    recall  f1-score   support

           0       0.91      0.99      0.95       236
           1       0.00      0.00      0.00        24

    accuracy                           0.90       260
   macro avg       0.45      0.49      0.47       260
weighted avg       0.82      0.90      0.86       260

🎯 Precisión general: 89.62 %

📈 Importancia de las features:
- numero: 31.450000762939453%
- dia_semana: 34.790000915527344%
- frecuencia_pasada: 33.77000045776367%

🔟 Números con mayor probabilidad de salir en el próximo sorteo:
[34, 39, 41, 6, 97, 11, 7, 44, 12, 43]


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


#### LightGBM:

In [38]:
!python Scripts/modelo_lgb_binario_tombola.py

✅ Archivo cargado correctamente.
[LightGBM] [Info] Number of positive: 99, number of negative: 941
[LightGBM] [Info] Auto-choosing col-wise multi-threading, the overhead of testing was 0.000116 seconds.
You can set `force_col_wise=true` to remove the overhead.
[LightGBM] [Info] Total Bins 111
[LightGBM] [Info] Number of data points in the train set: 1040, number of used features: 3
[LightGBM] [Info] [binary:BoostFromScore]: pavg=0.095192 -> initscore=-2.251823
[LightGBM] [Info] Start training from score -2.251823

📋 Reporte de Clasificación:
              precision    recall  f1-score   support

           0       0.91      0.98      0.94       236
           1       0.29      0.08      0.13        24

    accuracy                           0.90       260
   macro avg       0.60      0.53      0.54       260
weighted avg       0.86      0.90      0.87       260

🎯 Precisión general: 89.62 %

📈 Importancia de las features:
- numero: 72.03%
- dia_semana: 19.63%
- frecuencia_pasada: 8.33%

### 2. Modelos de Series Temporales (Prophet / ARIMA)

**Descripción**: Tratar cada número (del 00 al 99) como una serie temporal binaria (1 si apareció, 0 si no) y modelar su aparición en el tiempo.

#### Prophet:

In [39]:
!python Scripts/modelo_prophet_tombola.py

📅 Predicción de aparición para los próximos días con Prophet:
[10, 17, 25, 28, 29, 32, 37, 55, 76]


Importing plotly failed. Interactive plots will not work.
20:18:27 - cmdstanpy - INFO - Chain [1] start processing
20:18:27 - cmdstanpy - INFO - Chain [1] done processing
20:18:27 - cmdstanpy - INFO - Chain [1] start processing
20:18:27 - cmdstanpy - INFO - Chain [1] done processing
20:18:27 - cmdstanpy - INFO - Chain [1] start processing
20:18:27 - cmdstanpy - INFO - Chain [1] done processing
20:18:27 - cmdstanpy - INFO - Chain [1] start processing
20:18:27 - cmdstanpy - INFO - Chain [1] done processing
20:18:27 - cmdstanpy - INFO - Chain [1] start processing
20:18:27 - cmdstanpy - INFO - Chain [1] done processing
20:18:27 - cmdstanpy - INFO - Chain [1] start processing
20:18:28 - cmdstanpy - INFO - Chain [1] done processing
20:18:28 - cmdstanpy - INFO - Chain [1] start processing
20:18:28 - cmdstanpy - INFO - Chain [1] done processing
20:18:28 - cmdstanpy - INFO - Chain [1] start processing
20:18:28 - cmdstanpy - INFO - Chain [1] done processing
20:18:28 - cmdstanpy - INFO - Chain [1

#### ARIMA:

In [40]:
!python Scripts/modelo_arima_binario_tombola.py

📊 Predicción de aparición para los próximos días con ARIMA:
[]
