# Librerias

In [10]:
# 📦 Importación de librerías necesarias
import pandas as pd
import matplotlib.pyplot as plt

# Carga del archivo

In [11]:
# 📁 1. Cargar el archivo Excel
ruta_archivo = 'data/tombola.xlsx'
try:
    df = pd.read_excel(ruta_archivo)
    print("✅ Archivo cargado correctamente.")
except FileNotFoundError:
    print("❌ Error: El archivo 'tombola.xlsx' no se encontró en la carpeta 'data'.")
    exit()

# 👁 2. Vista previa del DataFrame
print("\n🔍 Primeras filas del archivo:")
print(df.head())

✅ Archivo cargado correctamente.

🔍 Primeras filas del archivo:
       Fecha  Posicion  Numero
0 2025-07-21         1      25
1 2025-07-21         2       5
2 2025-07-21         3      88
3 2025-07-21         4      91
4 2025-07-21         5      76


### 🔹 Nivel 1 - Estadística Básica

#### ✅ Análisis de Frecuencia


**Descripción**: Contar cuántas veces apareció cada número y seleccionar los 10 más frecuentes.


In [12]:
# Ejecutar el script desde Scripts
!python Scripts/analisis_frecuencia_tombola.py

[28, 81, 37, 25, 22, 6, 40, 76, 17, 29]


### 🔹 Nivel 2 - Modelos Intermedios con ML

#### 1. Clasificación Binaria (Random Forest / XGBoost / LightGBM)

**Descripción**: Crear un dataset donde por cada día indiques si un número apareció (1) o no (0), y uses features como día de la semana, frecuencia pasada, etc.

#### Random Forest:

In [13]:
!python Scripts/modelo_rf_binario_tombola.py

✅ Archivo cargado correctamente.

📋 Reporte de Clasificación:
              precision    recall  f1-score   support

           0       0.93      0.96      0.94       335
           1       0.06      0.04      0.05        25

    accuracy                           0.89       360
   macro avg       0.50      0.50      0.50       360
weighted avg       0.87      0.89      0.88       360

🎯 Precisión general: 89.17 %

📈 Importancia de las features:
- numero: 81.41%
- dia_semana: 11.3%
- frecuencia_pasada: 7.29%

🔟 Números con mayor probabilidad de salir en el próximo sorteo:
[41, 39, 45, 33, 44, 76, 0, 32, 29, 34]


#### XGBoost:

In [14]:
!python Scripts/modelo_xgb_binario_tombola.py

✅ Archivo cargado correctamente.

📋 Reporte de Clasificación:
              precision    recall  f1-score   support

           0       0.93      1.00      0.96       335
           1       0.00      0.00      0.00        25

    accuracy                           0.93       360
   macro avg       0.47      0.50      0.48       360
weighted avg       0.87      0.93      0.90       360

🎯 Precisión general: 92.78 %

📈 Importancia de las features:
- numero: 36.060001373291016%
- dia_semana: 30.010000228881836%
- frecuencia_pasada: 33.93000030517578%

🔟 Números con mayor probabilidad de salir en el próximo sorteo:
[26, 39, 30, 53, 54, 45, 31, 23, 24, 1]


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


#### LightGBM:

In [15]:
!python Scripts/modelo_lgb_binario_tombola.py

✅ Archivo cargado correctamente.
[LightGBM] [Info] Number of positive: 140, number of negative: 1300
[LightGBM] [Info] Auto-choosing row-wise multi-threading, the overhead of testing was 0.000033 seconds.
You can set `force_row_wise=true` to remove the overhead.
And if memory is not enough, you can set `force_col_wise=true`.
[LightGBM] [Info] Total Bins 112
[LightGBM] [Info] Number of data points in the train set: 1440, number of used features: 3
[LightGBM] [Info] [binary:BoostFromScore]: pavg=0.097222 -> initscore=-2.228477
[LightGBM] [Info] Start training from score -2.228477

📋 Reporte de Clasificación:
              precision    recall  f1-score   support

           0       0.93      0.98      0.96       335
           1       0.14      0.04      0.06        25

    accuracy                           0.92       360
   macro avg       0.54      0.51      0.51       360
weighted avg       0.88      0.92      0.89       360

🎯 Precisión general: 91.67 %

📈 Importancia de las features

### 2. Modelos de Series Temporales (Prophet / ARIMA)

**Descripción**: Tratar cada número (del 00 al 99) como una serie temporal binaria (1 si apareció, 0 si no) y modelar su aparición en el tiempo.

#### Prophet:

In [23]:
!python Scripts/modelo_prophet_tombola.py

📅 Predicción de aparición para los próximos días con Prophet:
[90, 38, 6, 94, 22, 44, 25, 14, 91, 55]


Importing plotly failed. Interactive plots will not work.
19:00:00 - cmdstanpy - INFO - Chain [1] start processing
19:00:00 - cmdstanpy - INFO - Chain [1] done processing
19:00:01 - cmdstanpy - INFO - Chain [1] start processing
19:00:01 - cmdstanpy - INFO - Chain [1] done processing
19:00:01 - cmdstanpy - INFO - Chain [1] start processing
19:00:01 - cmdstanpy - INFO - Chain [1] done processing
19:00:01 - cmdstanpy - INFO - Chain [1] start processing
19:00:01 - cmdstanpy - INFO - Chain [1] done processing
19:00:01 - cmdstanpy - INFO - Chain [1] start processing
19:00:02 - cmdstanpy - INFO - Chain [1] done processing
19:00:02 - cmdstanpy - INFO - Chain [1] start processing
19:00:02 - cmdstanpy - INFO - Chain [1] done processing
19:00:02 - cmdstanpy - INFO - Chain [1] start processing
19:00:02 - cmdstanpy - INFO - Chain [1] done processing
19:00:02 - cmdstanpy - INFO - Chain [1] start processing
19:00:03 - cmdstanpy - INFO - Chain [1] done processing
19:00:03 - cmdstanpy - INFO - Chain [1

#### ARIMA:

In [17]:
!python Scripts/modelo_arima_binario_tombola.py

📊 Predicción de aparición para los próximos días con ARIMA:
[]


Si la lista de predicciones te está dando vacía ([]), puede deberse a varios motivos en la lógica o en los datos.


### 🔹 Nivel 3 - Modelos Avanzados

#### 1. LSTM / Transformers

**Descripción**: Modelar la secuencia completa de sorteos como una serie de secuencias (por día) y predecir la siguiente secuencia.

In [27]:
!python Scripts/modelo_lstm_tombola.py


🔮 Predicción de los próximos 10 números con LSTM:
[6, 90, 38, 9, 6, 90, 38, 9, 6, 90]


2025-08-04 19:06:20.485725: I tensorflow/core/util/port.cc:153] oneDNN custom operations are on. You may see slightly different numerical results due to floating-point round-off errors from different computation orders. To turn them off, set the environment variable `TF_ENABLE_ONEDNN_OPTS=0`.
2025-08-04 19:06:22.478124: I tensorflow/core/util/port.cc:153] oneDNN custom operations are on. You may see slightly different numerical results due to floating-point round-off errors from different computation orders. To turn them off, set the environment variable `TF_ENABLE_ONEDNN_OPTS=0`.
2025-08-04 19:06:24.102818: I tensorflow/core/platform/cpu_feature_guard.cc:210] This TensorFlow binary is optimized to use available CPU instructions in performance-critical operations.
To enable the following instructions: SSE3 SSE4.1 SSE4.2 AVX AVX2 FMA, in other operations, rebuild TensorFlow with the appropriate compiler flags.


#### 2. Cadenas de Markov

**Descripción**: Modelar la probabilidad de aparición de un número en función de apariciones anteriores.

In [28]:
!python Scripts/modelo_markov_tombola.py

🔗 Predicción con Cadenas de Markov (desde el último número sorteado):
[35, 81, 28, 37, 40, 17, 6, 29, 14, 76]


#### 3. Regresión de Conteo (Poisson / Binomial Negativa)

**Descripción**: Modelar el conteo de aparición de cada número como una variable dependiente.

#### Poisson

In [29]:
!python Scripts/modelo_poisson_conteo_tombola.py

📈 Predicción de aparición por Regresión de Poisson:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### Binomial Negativa

In [31]:
!python Scripts/modelo_binomial_negativa_conteo_tombola.py

Traceback (most recent call last):
  File [35m"c:\Users\londe\OneDrive\Programacion\6 - Otros\Prediccion-Bingo-Municipal\Scripts\modelo_binomial_negativa_conteo_tombola.py"[0m, line [35m33[0m, in [35m<module>[0m
    modelo = sm.GLM(y, X, family=sm.families.NegativeBinomial())
  File [35m"c:\Users\londe\OneDrive\Programacion\6 - Otros\Prediccion-Bingo-Municipal\venv\Lib\site-packages\statsmodels\genmod\generalized_linear_model.py"[0m, line [35m326[0m, in [35m__init__[0m
    [31msuper().__init__[0m[1;31m(endog, exog, missing=missing,[0m
    [31m~~~~~~~~~~~~~~~~[0m[1;31m^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^[0m
                              [1;31moffset=offset, exposure=exposure,[0m
                              [1;31m^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^[0m
                              [1;31mfreq_weights=freq_weights,[0m
                              [1;31m^^^^^^^^^^^^^^^^^^^^^^^^^^[0m
                              [1;31mvar_weights=var_weights, **kwargs)[0m
          