<a href="https://colab.research.google.com/github/86HenriqueSilva/_Analise_loteria_federal/blob/main/An%C3%A1lise_Loteria_Federal_%22A%22_%22I%22_%22F%22.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


 **Edson Henrique**


 Análise e Desenvolvimento de Sistemas - UNINABUCO

Links:

[Linkedin](https://linkedin.com/in/henriquesilvatech) | [GitHub](https://github.com/86HenriqueSilva) | [Perfil na DIO](https://dio.me/users/edson_henrique)

Descrição: Profissional em constante aprimoramento técnico e acadêmico na área de Tecnologia da Informação e Desenvolvimento de Sistemas. Experiência consolidada em diversas tecnologias e metodologias, incluindo Python, Java, AWS, Docker, e Análise de Dados. Capacitado em liderança, gestão de projetos e implementações de soluções complexas em ambientes de TI.

Busco continuamente integrar novos conhecimentos e habilidades para enfrentar desafios emergentes no mercado digital e de nuvem.

Detalhes adicionais:

       Habilidades e Interesses:

    Proficiência em linguagens como Python, Java e Kotlin para desenvolvimento backend e análise de dados.
    Interesse crescente em inteligência artificial, machine learning e suas aplicações práticas.
    Familiaridade com metodologias ágeis, DevOps e práticas de desenvolvimento moderno.


# Análise dos Resultados da Loteria Federal

## Objetivo

Este projeto tem como objetivo analisar os resultados da Loteria Federal para ajudar a identificar padrões e tendências que possam ser úteis na previsão de resultados futuros. Utilizamos um arquivo Excel contendo dados de sorteios anteriores para realizar diversas análises.

### Funcionalidades do Código

1. **Calcular Frequências dos Números**:
   - Calcula quantas vezes cada número aparece em cada prêmio, ajudando a entender quais números são mais comuns.

2. **Classificar Números**:
   - Classifica os números em três categorias:
     - **Atrasados**: Números que aparecem menos frequentemente.
     - **Intermediários**: Números com frequência média.
     - **Frequentes**: Números que aparecem com maior frequência.

3. **Gerar Combinações de Números**:
   - Gera combinações de números baseadas nas categorias de classificação, oferecendo diferentes estratégias de escolha para os prêmios.

4. **Exibir Resultados**:
   - Mostra tabelas de frequência e classificações dos números, além de exibir as combinações geradas.

### Como Usar

1. **Baixar e Carregar os Dados**:
   - O código começa baixando o arquivo de dados da Loteria Federal e carregando-o em um DataFrame.

2. **Selecionar um Prêmio**:
   - No menu interativo, você pode escolher o prêmio que deseja analisar (1º, 2º, 3º, 4º, 5º) ou optar por analisar todos os prêmios de uma vez.

3. **Visualizar Análises**:
   - O código calculará a frequência dos números, classificará os números nas categorias definidas e exibirá combinações de números baseadas nas classificações.

### Benefícios

- **Identificação de Padrões**: Ajuda a identificar quais números tendem a aparecer com mais ou menos frequência.
- **Estratégias de Escolha**: Oferece diferentes combinações de números para possíveis estratégias de jogo.
- **Visão Geral Clara**: Fornece uma análise detalhada e visualização dos resultados dos sorteios.

Siga as instruções no menu interativo para explorar os resultados e ver as combinações sugeridas!


In [None]:
import pandas as pd
from gdown import download as gdown_download
import itertools
import os
import random

# URL do arquivo no Google Drive
url = 'https://drive.google.com/uc?id=10IcF31FnO4oWh2dYrq8qJWYR7Q8tTJkP'
output = 'Base_2024_Casa_Decimal.xlsx'

def baixar_arquivo(url, output):
    """
    Baixa o arquivo do Google Drive.
    """
    try:
        gdown_download(url, output, quiet=False)
        print(f"Arquivo {output} baixado com sucesso.")
    except Exception as e:
        print(f"Erro ao baixar o arquivo: {e}")
        raise

def carregar_dataframe(output):
    """
    Carrega o DataFrame a partir do arquivo Excel.
    """
    try:
        df = pd.read_excel(output)
        print("DataFrame carregado com sucesso.")
        return df
    except Exception as e:
        print(f"Erro ao carregar o DataFrame: {e}")
        raise

def calcular_frequencias(df, colunas):
    """
    Calcula a frequência dos números para as colunas especificadas.
    """
    frequencias = {coluna: df[coluna].value_counts().sort_index() for coluna in colunas}
    return pd.DataFrame(frequencias).fillna(0).astype(int)

def classificar_numeros(frequencias):
    """
    Classifica os números em Atrasados, Intermediários e Frequentes.
    """
    classificacao = {}
    for coluna in frequencias.columns:
        valores = frequencias[coluna].sort_values()
        tercil = len(valores) // 3
        classificacao[coluna] = {
            'Atrasados (A)': valores.iloc[:tercil].index.tolist(),
            'Intermediários (I)': valores.iloc[tercil:2*tercil].index.tolist(),
            'Frequentes (F)': valores.iloc[2*tercil:].index.tolist()
        }
    return classificacao

def exibir_resultados(frequencias, classificacao):
    """
    Exibe a tabela de frequências e as classificações dos números.
    """
    print("Tabela de Frequência:\n")
    print(frequencias)
    print("\nClassificações por Coluna:\n")
    for coluna, classes in classificacao.items():
        print(f"Classificação para {coluna}:")
        for categoria, numeros in classes.items():
            print(f"{categoria}: {numeros}")
        print()

def exibir_combinacoes(combinacoes):
    """
    Exibe as combinações geradas.
    """
    combinacoes_lista = list(combinacoes)
    total_combinacoes = len(combinacoes_lista)
    print(f"\nTotal de combinações geradas: {total_combinacoes}")

    for i in range(0, total_combinacoes, 10):
        milhar_linha = ' - '.join([''.join(map(str, comb)) for comb in combinacoes_lista[i:i + 10]])
        print(milhar_linha)

def gerar_combinacoes(classificacao, premio, tipo):
    """
    Gera combinações de números classificados em Atrasados, Intermediários ou Frequentes.
    """
    colunas = premios_colunas[premio]
    classificacoes = [classificacao[coluna][tipo] for coluna in colunas]
    return set(itertools.product(*classificacoes))

def gerar_combinacoes_misturadas(classificacao, premio, num_combinacoes=100):
    """
    Gera combinações aleatórias misturando números classificados.
    """
    colunas = premios_colunas[premio]
    numeros = [classificacao[coluna]['Atrasados (A)'] + classificacao[coluna]['Intermediários (I)'] + classificacao[coluna]['Frequentes (F)'] for coluna in colunas]
    combinacoes_misturadas = set()

    for _ in range(num_combinacoes):
        escolha = [random.choice(numeros[coluna]) for coluna in range(len(numeros))]
        combinacoes_misturadas.add(tuple(escolha))

    return combinacoes_misturadas

def analisa_premio(premio):
    """
    Analisa o prêmio selecionado e exibe os resultados.
    """
    df = carregar_dataframe(output)
    colunas = premios_colunas[premio]
    frequencias = calcular_frequencias(df, colunas)
    classificacao = classificar_numeros(frequencias)
    exibir_resultados(frequencias, classificacao)

    for tipo in ['Atrasados (A)', 'Intermediários (I)', 'Frequentes (F)']:
        print(f"\nCombinacões de {tipo} para o {premio}º Prêmio:")
        combinacoes = gerar_combinacoes(classificacao, premio, tipo)
        if combinacoes:
            exibir_combinacoes(combinacoes)

    # Gerar e exibir combinações misturadas
    print(f"\nCombinacões Misturadas para o {premio}º Prêmio:")
    combinacoes_misturadas = gerar_combinacoes_misturadas(classificacao, premio)
    if combinacoes_misturadas:
        exibir_combinacoes(combinacoes_misturadas)

def menu_interativo():
    """
    Exibe um menu interativo para o usuário selecionar o prêmio a ser analisado.
    """
    while True:
        premio = selecionar_premio()
        if premio == 7:
            print("Saindo do programa.")
            break
        elif premio == 6:
            for p in premios_colunas.keys():
                analisa_premio(p)
        else:
            analisa_premio(premio)

# Mapeia os prêmios às suas respectivas colunas
premios_colunas = {
    1: ['M 1º', 'C 1º', 'D 1º', 'U 1º'],
    2: ['M 2º', 'C 2º', 'D 2º', 'U 2º'],
    3: ['M 3º', 'C 3º', 'D 3º', 'U 3º'],
    4: ['M 4º', 'C 4º', 'D 4º', 'U 4º'],
    5: ['M 5º', 'C 5º', 'D 5º', 'U 5º']
}

def selecionar_premio():
    """
    Exibe um menu para o usuário selecionar o prêmio a ser analisado.
    """
    print("Selecione o prêmio que deseja analisar:")
    for premio in premios_colunas.keys():
        print(f"{premio}º Prêmio")
    print("6 - Analisar Todos os Prêmios")
    print("7 - Sair")
    try:
        premio_selecionado = int(input("Digite o número do prêmio (1-7): "))
        if premio_selecionado in premios_colunas or premio_selecionado in [6, 7]:
            return premio_selecionado
        else:
            print("Seleção inválida. Tente novamente.")
            return selecionar_premio()
    except ValueError:
        print("Entrada inválida. Por favor, digite um número inteiro entre 1 e 7.")
        return selecionar_premio()

# Baixando e carregando o arquivo
baixar_arquivo(url, output)

# Rodando o menu interativo
menu_interativo()


# Gerando os Gráficos


In [None]:
import pandas as pd
import gdown
import matplotlib.pyplot as plt
import seaborn as sns
import os

# URL do arquivo no Google Drive
url = 'https://drive.google.com/uc?id=10IcF31FnO4oWh2dYrq8qJWYR7Q8tTJkP'
output = 'Base_2024_Casa_Decimal.xlsx'

# Mapeia os prêmios às suas respectivas colunas
premios_colunas = {
    1: ['M 1º', 'C 1º', 'D 1º', 'U 1º'],
    2: ['M 2º', 'C 2º', 'D 2º', 'U 2º'],
    3: ['M 3º', 'C 3º', 'D 3º', 'U 3º'],
    4: ['M 4º', 'C 4º', 'D 4º', 'U 4º'],
    5: ['M 5º', 'C 5º', 'D 5º', 'U 5º']
}

def baixar_arquivo(url, output):
    """Baixa o arquivo do Google Drive e verifica se foi baixado corretamente."""
    try:
        gdown.download(url, output, quiet=False)
        print(f"Arquivo {output} baixado com sucesso.")
    except Exception as e:
        print(f"Erro ao baixar o arquivo: {e}")
        raise

def carregar_dataframe(output):
    """Carrega o DataFrame do arquivo Excel."""
    try:
        df = pd.read_excel(output)
        print("DataFrame carregado com sucesso.")
        return df
    except Exception as e:
        print(f"Erro ao carregar o DataFrame: {e}")
        raise

def calcula_frequencias(df, colunas):
    """Calcula a frequência dos números de 0 a 9 para as colunas especificadas."""
    frequencias = {coluna: df[coluna].value_counts().sort_index() for coluna in colunas}
    return pd.DataFrame(frequencias).fillna(0).astype(int)

def classifica_numeros(frequencias):
    """Classifica os números em Atrasados (A), Intermediários (I) e Frequentes (F) com base nas frequências."""
    classificacao = {}
    for coluna in frequencias.columns:
        valores = frequencias[coluna].sort_values()
        tercil = len(valores) // 3
        classificacao[coluna] = {
            'Atrasados (A)': valores.iloc[:tercil].index.tolist(),
            'Intermediários (I)': valores.iloc[tercil:2*tercil].index.tolist(),
            'Frequentes (F)': valores.iloc[2*tercil:].index.tolist()
        }
    return classificacao

def salvar_grafico(frequencias, classificacao, premio):
    """Plota gráficos de frequências dos números para cada coluna e salva no diretório especificado."""
    pasta = 'DOWNLOAD_DE_IMAGENS'
    if not os.path.exists(pasta):
        os.makedirs(pasta)

    plt.figure(figsize=(14, 8))
    cores = {
        'Atrasados (A)': 'red',
        'Intermediários (I)': 'orange',
        'Frequentes (F)': 'purple'
    }
    for i, coluna in enumerate(frequencias.columns):
        plt.subplot(2, 2, i+1)
        valores = frequencias[coluna]

        sns.barplot(x=valores.index, y=valores, color='lightgrey', ci=None)

        for categoria, cor in cores.items():
            numeros_categoria = classificacao[coluna][categoria]
            categoria_frequencias = valores[valores.index.isin(numeros_categoria)]
            sns.barplot(x=categoria_frequencias.index, y=categoria_frequencias, color=cor, ci=None, label=categoria)

        plt.title(f'Frequências de {coluna}')
        plt.xlabel('Número')
        plt.ylabel('Frequência')
        plt.legend(title='Classificação', loc='lower center')
        plt.xticks(rotation=45)

    plt.tight_layout()
    caminho_arquivo = f'{pasta}/analise_premio_{premio}.png'
    plt.savefig(caminho_arquivo)
    plt.close()
    print(f"Gráfico do prêmio {premio} salvo como '{caminho_arquivo}'.")

def analisar_premio(df, premio):
    """Analisa o prêmio selecionado e gera os gráficos correspondentes."""
    colunas_selecionadas = premios_colunas[premio]
    frequencias = calcula_frequencias(df, colunas_selecionadas)
    classificacao = classifica_numeros(frequencias)
    salvar_grafico(frequencias, classificacao, premio)

def menu_interativo():
    """Exibe o menu interativo e realiza a análise do prêmio selecionado."""
    while True:
        print("Escolha uma opção:")
        print("1. Analisar um prêmio específico")
        print("2. Analisar todos os prêmios")
        opcao = input("Digite o número da opção (1 ou 2): ").strip()

        if opcao == '1':
            premio_selecionado = int(input("Digite o número do prêmio (1-5): "))
            if premio_selecionado in premios_colunas:
                analisar_premio(df, premio_selecionado)
            else:
                print("Número do prêmio inválido.")
        elif opcao == '2':
            for premio in premios_colunas.keys():
                analisar_premio(df, premio)
        else:
            print("Opção inválida. Tente novamente.")
            continue

        continuar = input("\nDeseja realizar outra análise? (s/n): ").strip().lower()
        if continuar != 's':
            print("Encerrando o programa.")
            break

# Executa o código principal
if __name__ == "__main__":
    baixar_arquivo(url, output)
    df = carregar_dataframe(output)
    menu_interativo()
