### üé∞ Calculadora de Probabilidades de N√∫meros de Loter√≠a

Este script permite **consultar un n√∫mero de loter√≠a y analizar sus probabilidades hist√≥ricas y te√≥ricas**, bas√°ndose en el conjunto de datos procesado (`loteria_datos.pkl`).  
El an√°lisis incluye **frecuencia hist√≥rica, probabilidad te√≥rica, probabilidades de aproximaciones (centena, decena y reintegro)** y un **factor de frecuencia comparado con la media**.

---


In [1]:
import pandas as pd

# Cargar los datos
df = pd.read_pickle('loteria_datos.pkl')

In [2]:
def calcular_probabilidad(numero_input):
    """
    Calcula la probabilidad de que toque un n√∫mero espec√≠fico
    
    Args:
        numero_input: N√∫mero de loter√≠a (string de 5 d√≠gitos, ej: "00219")
    
    Returns:
        dict con las probabilidades calculadas
    """
    # Asegurar formato correcto (5 d√≠gitos con ceros a la izquierda)
    numero = str(numero_input).zfill(5)
    
    # Datos del an√°lisis
    total_sorteos = len(df)
    numeros_unicos = df['numero'].nunique()
    veces_salido = (df['numero'] == numero).sum()
    
    # Extraer partes del n√∫mero
    centena = numero[-3:]  # √öltimos 3 d√≠gitos
    decena = numero[-2:]   # √öltimos 2 d√≠gitos
    unidad = numero[-1:]   # √öltimo d√≠gito
    
    # Filtrar por tipo de sorteo si se especifica
    df_filtrado = df[df['tipo'] != 'normal']
    
    # Conteos EXCLUYENDO premios mayores (para evitar doble conteo)
    veces_numero_exacto = (df_filtrado['numero'] == numero).sum()
    
    # Centena: todos los que terminan en centena EXCEPTO el n√∫mero exacto
    veces_centena_total = df_filtrado['numero'].str[-3:].eq(centena).sum()
    veces_centena = veces_centena_total - veces_numero_exacto
    
    # Decena: todos los que terminan en decena EXCEPTO n√∫mero exacto y centena
    veces_decena_total = df_filtrado['numero'].str[-2:].eq(decena).sum()
    veces_decena = veces_decena_total - veces_centena_total
    
    # Reintegro: todos los que terminan en unidad EXCEPTO n√∫mero exacto, centena y decena
    veces_unidad_total = df_filtrado['numero'].str[-1:].eq(unidad).sum()
    veces_unidad = veces_unidad_total - veces_decena_total
    
    # 1. Probabilidad te√≥rica (todos los n√∫meros posibles: 00000-99999)
    prob_teorica = 1 / 100000
    prob_teorica_porcentaje = prob_teorica * 100
    
    # 2. Probabilidad basada en datos hist√≥ricos
    prob_historica = veces_salido / total_sorteos if total_sorteos > 0 else 0
    prob_historica_porcentaje = prob_historica * 100
    
    # 3. Probabilidad basada en n√∫meros √∫nicos que han salido
    prob_numeros_existentes = veces_salido / numeros_unicos if numeros_unicos > 0 else 0
    prob_numeros_existentes_porcentaje = prob_numeros_existentes * 100
    
    # 4. Frecuencia relativa (comparado con la media)
    frecuencia_media = total_sorteos / numeros_unicos if numeros_unicos > 0 else 0
    factor_frecuencia = veces_salido / frecuencia_media if frecuencia_media > 0 else 0
    
    # 5. Probabilidades de aproximaciones (solo para especiales)
    total_filtrado = len(df_filtrado)
    
    prob_centena = veces_centena / total_filtrado if total_filtrado > 0 else 0
    prob_centena_porcentaje = prob_centena * 100
    
    prob_decena = veces_decena / total_filtrado if total_filtrado > 0 else 0
    prob_decena_porcentaje = prob_decena * 100
    
    prob_unidad = veces_unidad / total_filtrado if total_filtrado > 0 else 0
    prob_unidad_porcentaje = prob_unidad * 100
    
    # Probabilidad te√≥rica de aproximaciones
    prob_teorica_centena = 1 / 1000  # √öltimos 3 d√≠gitos
    prob_teorica_decena = 1 / 100    # √öltimos 2 d√≠gitos
    prob_teorica_unidad = 1 / 10     # √öltimo d√≠gito
    
    return {
        'numero': numero,
        'veces_salido': veces_salido,
        'total_sorteos': total_sorteos,
        'numeros_unicos': numeros_unicos,
        'prob_teorica': prob_teorica,
        'prob_teorica_porcentaje': prob_teorica_porcentaje,
        'prob_historica': prob_historica,
        'prob_historica_porcentaje': prob_historica_porcentaje,
        'prob_numeros_existentes': prob_numeros_existentes,
        'prob_numeros_existentes_porcentaje': prob_numeros_existentes_porcentaje,
        'frecuencia_media': frecuencia_media,
        'factor_frecuencia': factor_frecuencia,
        'centena': centena,
        'decena': decena,
        'unidad': unidad,
        'veces_centena': veces_centena,
        'veces_decena': veces_decena,
        'veces_unidad': veces_unidad,
        'prob_centena': prob_centena,
        'prob_centena_porcentaje': prob_centena_porcentaje,
        'prob_decena': prob_decena,
        'prob_decena_porcentaje': prob_decena_porcentaje,
        'prob_unidad': prob_unidad,
        'prob_unidad_porcentaje': prob_unidad_porcentaje,
        'prob_teorica_centena': prob_teorica_centena,
        'prob_teorica_decena': prob_teorica_decena,
        'prob_teorica_unidad': prob_teorica_unidad
    }

In [None]:
def mostrar_resultados(numero_input):
    """Muestra los resultados de forma legible"""
    resultado = calcular_probabilidad(numero_input)
    
    print("=" * 70)
    print(f"AN√ÅLISIS DE PROBABILIDAD PARA EL N√öMERO: {resultado['numero']}")
    print("=" * 70)
    
    print(f"\nüìä DATOS HIST√ìRICOS:")
    print(f"   ‚Ä¢ El n√∫mero {resultado['numero']} ha salido: {resultado['veces_salido']} veces")
    print(f"   ‚Ä¢ Total de sorteos analizados: {resultado['total_sorteos']}")
    print(f"   ‚Ä¢ N√∫meros √∫nicos premiados: {resultado['numeros_unicos']}")
    
    print(f"\nüé≤ PROBABILIDADES:")
    print(f"\n   1. Probabilidad TE√ìRICA (real entre todos los espa√±oles):")
    print(f"      ‚Üí 1 entre 100,000 n√∫meros posibles")
    print(f"      ‚Üí {resultado['prob_teorica_porcentaje']:.5f}%")
    print(f"      ‚Üí Odds: 1:{100000:,}")
    
    print(f"\n   2. Probabilidad HIST√ìRICA (basada en los datos recogidos):")
    print(f"      ‚Üí Basada en {resultado['total_sorteos']} sorteos")
    print(f"      ‚Üí {resultado['prob_historica_porcentaje']:.5f}%")
    if resultado['veces_salido'] > 0:
        print(f"      ‚Üí Sale aproximadamente 1 cada {resultado['total_sorteos']//resultado['veces_salido']} sorteos")
    
    print(f"\n   3. Probabilidad entre N√öMEROS QUE HAN SALIDO:")
    print(f"      ‚Üí Solo considerando los {resultado['numeros_unicos']} n√∫meros que han sido premiados")
    print(f"      ‚Üí {resultado['prob_numeros_existentes_porcentaje']:.5f}%")

    print(f"\n   üìç CENTENA (terminados en {resultado['centena']}):")
    print(f"      ‚Ä¢ Ha salido: {resultado['veces_centena']} veces")
    print(f"      ‚Ä¢ Probabilidad te√≥rica: {resultado['prob_teorica_centena']*100:.3f}% (1 en 1,000)")
    print(f"      ‚Ä¢ Probabilidad hist√≥rica: {resultado['prob_centena_porcentaje']:.3f}%")
        
    print(f"\n   üìç DECENA (terminados en {resultado['decena']}):")
    print(f"      ‚Ä¢ Ha salido: {resultado['veces_decena']} veces")
    print(f"      ‚Ä¢ Probabilidad te√≥rica: {resultado['prob_teorica_decena']*100:.2f}% (1 en 100)")
    print(f"      ‚Ä¢ Probabilidad hist√≥rica: {resultado['prob_decena_porcentaje']:.3f}%")
        
    print(f"\n   üìç REINTEGRO (terminados en {resultado['unidad']}):")
    print(f"      ‚Ä¢ Ha salido: {resultado['veces_unidad']} veces")
    print(f"      ‚Ä¢ Probabilidad te√≥rica: {resultado['prob_teorica_unidad']*100:.1f}% (1 en 10)")
    print(f"      ‚Ä¢ Probabilidad hist√≥rica: {resultado['prob_unidad_porcentaje']:.3f}%")
    
    print(f"\nüìà AN√ÅLISIS DE FRECUENCIA:")
    print(f"   ‚Ä¢ Frecuencia media por n√∫mero: {resultado['frecuencia_media']:.2f} veces")
    print(f"   ‚Ä¢ Factor de frecuencia de tu n√∫mero: {resultado['factor_frecuencia']:.2f}x")
    
    if resultado['factor_frecuencia'] > 1.5:
        print(f"   ‚ö†Ô∏è  Este n√∫mero sale M√ÅS que la media ({resultado['factor_frecuencia']:.1f}x m√°s frecuente)")
    elif resultado['factor_frecuencia'] < 0.5 and resultado['veces_salido'] > 0:
        print(f"   ‚ö†Ô∏è  Este n√∫mero sale MENOS que la media")
    elif resultado['veces_salido'] == 0:
        print(f"   ‚ö†Ô∏è  Este n√∫mero NUNCA ha salido en los datos analizados")
    else:
        print(f"   ‚úì  Este n√∫mero tiene una frecuencia normal")
    
    print("\n" + "=" * 70)
    print("‚ö†Ô∏è  NOTA: La loter√≠a es aleatoria. Los datos hist√≥ricos NO predicen el futuro.")
    print("=" * 70)
    
    return resultado

# Programa principal
if __name__ == "__main__":
    print("\nüé∞ CALCULADORA DE PROBABILIDAD DE LOTER√çA üé∞\n")
    
    while True:
        numero_input = input("\nIntroduce un n√∫mero de loter√≠a (5 d√≠gitos, o 'salir' para terminar): ")
        
        if numero_input.lower() in ['salir', 'exit', 'q']:
            print("\n¬°Hasta luego! üçÄ")
            break
        
        # Validar input
        try:
            numero_validado = str(int(numero_input)).zfill(5)
            if int(numero_input) < 0 or int(numero_input) > 99999:
                print("‚ùå Error: El n√∫mero debe estar entre 00000 y 99999")
                continue
        except ValueError:
            print("‚ùå Error: Introduce un n√∫mero v√°lido")
            continue
        
        # Calcular y mostrar resultados
        mostrar_resultados(numero_validado)
        
        # Preguntar si quiere analizar otro
        continuar = input("\n¬øQuieres analizar otro n√∫mero? (s/n): ")
        if continuar.lower() not in ['s', 'si', 's√≠', 'y', 'yes']:
            print("\n¬°Hasta luego! üçÄ")
            break


üé∞ CALCULADORA DE PROBABILIDAD DE LOTER√çA üé∞




Introduce un n√∫mero de loter√≠a (5 d√≠gitos, o 'salir' para terminar):  76214


AN√ÅLISIS DE PROBABILIDAD PARA EL N√öMERO: 76214

üìä DATOS HIST√ìRICOS:
   ‚Ä¢ El n√∫mero 76214 ha salido: 0 veces
   ‚Ä¢ Total de sorteos analizados: 21684
   ‚Ä¢ N√∫meros √∫nicos premiados: 19647

üé≤ PROBABILIDADES:

   1. Probabilidad TE√ìRICA (real entre todos los espa√±oles):
      ‚Üí 1 entre 100,000 n√∫meros posibles
      ‚Üí 0.00100%
      ‚Üí Odds: 1:100,000

   2. Probabilidad HIST√ìRICA (basada en los datos recogidos):
      ‚Üí Basada en 21684 sorteos
      ‚Üí 0.00000%

   3. Probabilidad entre N√öMEROS QUE HAN SALIDO:
      ‚Üí Solo considerando los 19647 n√∫meros que han sido premiados
      ‚Üí 0.00000%

   üìç CENTENA (terminados en 214):
      ‚Ä¢ Ha salido: 0 veces
      ‚Ä¢ Probabilidad te√≥rica: 0.100% (1 en 1,000)
      ‚Ä¢ Probabilidad hist√≥rica: 0.000%

   üìç DECENA (terminados en 14):
      ‚Ä¢ Ha salido: 2 veces
      ‚Ä¢ Probabilidad te√≥rica: 1.00% (1 en 100)
      ‚Ä¢ Probabilidad hist√≥rica: 1.282%

   üìç REINTEGRO (terminados en 4):
      ‚Ä¢ H