<a href="https://colab.research.google.com/github/86HenriqueSilva/_An-lise_loteria_federal/blob/main/An%C3%A1lise_Loteria_Federal.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


 **Edson Henrique**


 Análise e Desenvolvimento de Sistemas - UNINABUCO

Links:

[Linkedin](https://linkedin.com/in/henriquesilvatech) | [GitHub](https://github.com/86HenriqueSilva) | [Perfil na DIO](https://dio.me/users/edson_henrique)

Descrição: Profissional em constante aprimoramento técnico e acadêmico na área de Tecnologia da Informação e Desenvolvimento de Sistemas. Experiência consolidada em diversas tecnologias e metodologias, incluindo Python, Java, AWS, Docker, e Análise de Dados. Capacitado em liderança, gestão de projetos e implementações de soluções complexas em ambientes de TI.

Busco continuamente integrar novos conhecimentos e habilidades para enfrentar desafios emergentes no mercado digital e de nuvem.

Detalhes adicionais:

       Habilidades e Interesses:

    Proficiência em linguagens como Python, Java e Kotlin para desenvolvimento backend e análise de dados.
    Interesse crescente em inteligência artificial, machine learning e suas aplicações práticas.
    Familiaridade com metodologias ágeis, DevOps e práticas de desenvolvimento moderno.





# Projeto de Análise de Dados: 6 Módulos
` *Com base em dados da Loteria Federal*`

> Olá! Bem-vindo à minha apresentação de projeto, onde você encontrará um exemplo empolgante da minha expertise em análise de dados e tratamento de informações. Vamos explorar como cada um dos seis módulos contribui para a construção de um sistema robusto e eficiente.

> Módulo 1: Configuração e Inicialização

Objetivo: Preparar o ambiente para o processamento de dados.

Iniciamos instalando e importando bibliotecas essenciais, como pandas e gdown, garantindo que o sistema tenha todas as ferramentas necessárias para manipulação e análise de dados. Este módulo estabelece as bases para o trabalho com arquivos CSV e a leitura de dados.

> Módulo 2: Resumo de Dezenas

Objetivo: Analisar e resumir o histórico de dezenas sorteadas.

Aqui, desenvolvemos uma função que gera um resumo detalhado das dezenas sorteadas em concursos. Utilizamos pandas para processar os dados e calculamos os atrasos das dezenas, oferecendo insights valiosos sobre a frequência dos números e suas aparições ao longo do tempo. A análise inclui detalhamento por dia da semana e por sorteio, permitindo uma compreensão mais profunda dos padrões de sorteio.

> Módulo 3: Menu Interativo para Análise

Objetivo: Facilitar a interação do usuário com o sistema.

Implementamos um menu interativo que permite ao usuário escolher o tipo de análise (simples ou completa) e o tipo de sorteio (dezenas ou dezenas de milhar). Essa abordagem torna a ferramenta mais acessível e adaptável às necessidades dos usuários, proporcionando uma experiência mais intuitiva e amigável.

> Módulo 4: Análise de Percentual de Paridade

Objetivo: Avaliar a distribuição de números pares e ímpares.

Neste módulo, focamos na análise de arquivos Excel, calculando o percentual de números pares e ímpares para diferentes prêmios. Utilizamos a biblioteca tabulate para apresentar os resultados de forma clara e visualmente atraente, facilitando a interpretação dos dados e destacando padrões importantes.

> Módulo 5: Conversão e Análise de Grupos

Objetivo: Converter números em grupos e calcular percentuais de paridade.

Transformamos os números sorteados em grupos específicos e analisamos a paridade dos números em cada grupo. Esta etapa envolve a aplicação de funções customizadas para converter números e calcular percentuais, oferecendo uma visão mais detalhada e agrupada dos dados.

> Módulo 6: Consolidação e Exibição de Resultados

Objetivo: Exibir os resultados de forma estruturada e atraente.

Finalizamos o projeto consolidando todas as análises realizadas e exibindo os resultados de forma tabular. Utilizamos o tabulate para apresentar os dados com clareza e precisão, destacando as porcentagens de números pares e ímpares e proporcionando uma visão geral das análises realizadas.

# Módulo 01
Análise de Atraso por casa Decimal dos Números de 0 a 9

In [None]:
import pandas as pd
import gdown
from tabulate import tabulate

# Função para carregar os dados da planilha do Google Drive
def carregar_dados(planilha_url):
    try:
        gdown.download(planilha_url, 'dados.xlsx', quiet=False)
        dados = pd.read_excel('dados.xlsx')
        return dados
    except Exception as e:
        print(f"Erro ao carregar os dados da planilha: {e}")
        return None

# Função para analisar os números ausentes e calcular atrasos para um prêmio específico
def analisar_premio(dados, premio, num_concursos):
    premio_str = f"{premio}º"
    colunas_premio = [f"{letra} {premio_str}" for letra in ['M', 'C', 'D', 'U']]

    if not all(coluna in dados.columns for coluna in colunas_premio):
        print(f"Prêmio {premio_str} não encontrado nos dados.")
        return None

    ultimos_concursos = dados.tail(num_concursos).iloc[::-1]
    resultados = {}

    for coluna in colunas_premio:
        numeros_presentes = set(ultimos_concursos[coluna].astype(str))
        numeros_ausentes = set([str(i) for i in range(10)]) - numeros_presentes

        atrasos = []
        for num in sorted(numeros_ausentes):
            indices_ausencia = dados[dados[coluna].astype(str).apply(lambda x: num in x)].index.tolist()
            if indices_ausencia:
                atraso = len(dados) - max(indices_ausencia) - 1
                atrasos.append((num, max(indices_ausencia), atraso))
            else:
                atrasos.append((num, -1, len(dados)))

        atrasos.sort(key=lambda x: x[2], reverse=True)
        resultados[coluna] = atrasos

    return resultados

# Função para calcular a frequência dos números de 0 a 9 para um prêmio específico
def calcular_frequencia_numeros(dados, premio):
    premio_str = f"{premio}º"
    colunas_premio = [f"{letra} {premio_str}" for letra in ['M', 'C', 'D', 'U']]

    frequencia = {coluna: dados[coluna].astype(str).value_counts().sort_index() for coluna in colunas_premio}
    return frequencia

# Função para calcular a frequência dos números de 0 a 9 nos últimos 50 concursos para um prêmio específico
def calcular_frequencia_ultimos_50(dados, premio):
    premio_str = f"{premio}º"
    colunas_premio = [f"{letra} {premio_str}" for letra in ['M', 'C', 'D', 'U']]
    ultimos_50 = dados.tail(50)

    frequencia_50 = {coluna: ultimos_50[coluna].astype(str).value_counts().sort_index() for coluna in colunas_premio}
    return frequencia_50

# Função para exibir os resultados de forma organizada com tabulação
def exibir_resultados(resultados_completos, frequencia_geral, frequencia_50):
    for premio, resultados in resultados_completos.items():
        print(f"\nPrêmio {premio}º:\n")

        for coluna, atrasos in resultados.items():
            print(f"{coluna}:")
            print(tabulate(atrasos, headers=["Número", "Última aparição", "Atraso"]))
            print("")

    print("\nFrequência Geral dos Números de 0 a 9:")
    for premio, freq in frequencia_geral.items():
        print(f"\nPrêmio {premio}º:")
        df_geral = pd.DataFrame(freq).fillna(0).astype(int)
        df_geral.columns = [col.replace(' ', '') for col in df_geral.columns]
        print(tabulate(df_geral, headers="keys", tablefmt="pretty"))

    print("\nFrequência dos Números de 0 a 9 nos Últimos 50 Concursos:")
    for premio, freq in frequencia_50.items():
        print(f"\nPrêmio {premio}º:")
        df_50 = pd.DataFrame(freq).fillna(0).astype(int)
        df_50.columns = [col.replace(' ', '') for col in df_50.columns]
        print(tabulate(df_50, headers="keys", tablefmt="pretty"))

# Função para exibir o menu de seleção de prêmios
def exibir_menu_premios():
    print("Escolha o prêmio que deseja analisar:")
    print("1 - 1º Prêmio")
    print("2 - 2º Prêmio")
    print("3 - 3º Prêmio")
    print("4 - 4º Prêmio")
    print("5 - 5º Prêmio")
    print("6 - Análisar todos os prêmios")
    print("0 - Sair")

# Função para exibir o menu de seleção de número de concursos
def obter_numero_concursos():
    while True:
        try:
            num_concursos = int(input("Digite quantos concursos deseja analisar (5 a 15): "))
            if num_concursos < 5 or num_concursos > 15:
                raise ValueError("Número de concursos fora do intervalo permitido.")
            return num_concursos
        except ValueError as e:
            print(f"Erro: {e}. Por favor, digite um número válido entre 5 e 15.")

# Menu principal interativo
def menu_principal():
    planilha_url = "https://drive.google.com/uc?export=download&id=10IcF31FnO4oWh2dYrq8qJWYR7Q8tTJkP"
    dados = carregar_dados(planilha_url)

    if dados is None:
        return

    while True:
        exibir_menu_premios()
        opcao = input("Digite o número da opção desejada: ")

        if opcao == '0':
            print("Saindo do programa.")
            break

        if opcao not in ['1', '2', '3', '4', '5', '6']:
            print("Opção inválida. Por favor, escolha uma opção válida.")
            continue

        premio = int(opcao)
        num_concursos = obter_numero_concursos()

        resultados_completos = {}
        frequencia_geral = {}
        frequencia_50 = {}

        if opcao == '6':
            for premio in range(1, 6):
                resultados = analisar_premio(dados, premio, num_concursos)
                if resultados:
                    resultados_completos[premio] = resultados
                    frequencia_geral[premio] = calcular_frequencia_numeros(dados, premio)
                    frequencia_50[premio] = calcular_frequencia_ultimos_50(dados, premio)
        else:
            resultados = analisar_premio(dados, premio, num_concursos)
            if resultados:
                resultados_completos[premio] = resultados
                frequencia_geral[premio] = calcular_frequencia_numeros(dados, premio)
                frequencia_50[premio] = calcular_frequencia_ultimos_50(dados, premio)

        exibir_resultados(resultados_completos, frequencia_geral, frequencia_50)

# Executa o menu principal se o script for executado diretamente
if __name__ == "__main__":
    menu_principal()

Downloading...
From: https://drive.google.com/uc?export=download&id=10IcF31FnO4oWh2dYrq8qJWYR7Q8tTJkP
To: /content/dados.xlsx
100%|██████████| 510k/510k [00:00<00:00, 15.2MB/s]


Escolha o prêmio que deseja analisar:
1 - 1º Prêmio
2 - 2º Prêmio
3 - 3º Prêmio
4 - 4º Prêmio
5 - 5º Prêmio
6 - Análisar todos os prêmios
0 - Sair
Digite o número da opção desejada: 5
Digite quantos concursos deseja analisar (5 a 15): 9

Prêmio 5º:

M 5º:
  Número    Última aparição    Atraso
--------  -----------------  --------
       1               5868        14
       0               5870        12
       3               5871        11
       9               5873         9

C 5º:
  Número    Última aparição    Atraso
--------  -----------------  --------
       0               5836        46
       5               5866        16
       1               5868        14
       4               5871        11

D 5º:
  Número    Última aparição    Atraso
--------  -----------------  --------
       2               5863        19
       6               5867        15
       7               5871        11

U 5º:
  Número    Última aparição    Atraso
--------  -----------------  --------
 

# Módulo 02
Análise de **Frequência** dos números por **Casa decimal**.

In [None]:
import gdown
import pandas as pd

def download_file(url, output):
    """
    Função para baixar um arquivo da URL especificada.

    Parameters:
    url (str): URL do arquivo para download.
    output (str): Caminho onde o arquivo será salvo localmente.
    """
    try:
        gdown.download(url, output, quiet=False)
        print(f"Arquivo baixado com sucesso: {output}")
    except Exception as e:
        print(f"Erro ao baixar o arquivo: {e}")

def load_and_process_data(file_name):
    """
    Carrega e processa os dados do arquivo Excel.

    Parameters:
    file_name (str): Nome do arquivo Excel.

    Returns:
    df (DataFrame): DataFrame com os dados processados.
    """
    try:
        df = pd.read_excel(file_name)
        df['Data'] = pd.to_datetime(df['Data'], format='%Y-%m-%d')

        for i in range(1, 6):
            df[f'Número {i}º'] = (df[f'M {i}º'].astype(str) +
                                  df[f'C {i}º'].astype(str) +
                                  df[f'D {i}º'].astype(str) +
                                  df[f'U {i}º'].astype(str)).astype(int)

        print("Dados carregados e processados com sucesso.")
        return df
    except Exception as e:
        print(f"Erro ao carregar ou processar os dados: {e}")
        return None

def create_separate_dataframes(df):
    """
    Cria DataFrames separados para sorteios realizados na quarta-feira e no sábado.

    Parameters:
    df (DataFrame): DataFrame original com todos os dados.

    Returns:
    Geral (DataFrame), Quartas (DataFrame), Sabados (DataFrame)
    """
    try:
        Geral = df.copy()
        Quartas = df[df['D/SEMAN'] == 'quarta-feira'].copy()
        Sabados = df[df['D/SEMAN'] == 'sábado'].copy()

        print("DataFrames separados criados com sucesso.")
        return Geral, Quartas, Sabados
    except Exception as e:
        print(f"Erro ao criar DataFrames separados: {e}")
        return None, None, None

def process_lottery_data(url, file_name):
    """
    Baixa, carrega e processa os dados da loteria a partir de uma URL.

    Parameters:
    url (str): URL do arquivo para download.
    file_name (str): Nome do arquivo a ser salvo localmente.

    Returns:
    Geral (DataFrame), Quartas (DataFrame), Sabados (DataFrame)
    """
    # Baixar o arquivo
    download_file(url, file_name)

    # Carregar e processar os dados
    df = load_and_process_data(file_name)

    if df is not None:
        # Criar DataFrames separados
        Geral, Quartas, Sabados = create_separate_dataframes(df)
        return Geral, Quartas, Sabados
    else:
        return None, None, None

def count_digit_appearances(df, premio):
    """
    Conta as aparições dos números de 0 a 9 para um prêmio específico em um DataFrame.

    Parameters:
    df (DataFrame): DataFrame contendo os dados da loteria.
    premio (int): Número do prêmio de 1 a 5.

    Returns:
    resultados (dict): Dicionário com os resultados das contagens para cada coluna ('M', 'C', 'D', 'U'),
                      com os valores ordenados de menor para maior.
    """
    resultados = {}

    # Definir as colunas correspondentes ao prêmio escolhido
    colunas = [f'{letra} {premio}º' for letra in ['M', 'C', 'D', 'U']]

    # Inicializar o dicionário de resultados com contagens zeradas
    for coluna in colunas:
        resultados[coluna] = {str(digito): 0 for digito in range(10)}

    # Iterar sobre as linhas do DataFrame e contar as aparições
    for index, row in df.iterrows():
        for coluna in colunas:
            numero = str(row[coluna])
            for digito in numero:
                resultados[coluna][digito] += 1

    # Ordenar os resultados de menor para maior valor
    for coluna, contagem in resultados.items():
        resultados[coluna] = {k: v for k, v in sorted(contagem.items(), key=lambda item: item[1])}

    return resultados

def main():
    """
    Função principal para executar o programa de análise da loteria.
    """
    url = 'https://docs.google.com/spreadsheets/d/10IcF31FnO4oWh2dYrq8qJWYR7Q8tTJkP/export?format=xlsx'
    file_name = 'lottery_results.xlsx'

    # Processar os dados da loteria
    Geral, Quartas, Sabados = process_lottery_data(url, file_name)

    if Geral is not None and Quartas is not None and Sabados is not None:
        print("\nDataFrames foram carregados com sucesso.")

        while True:
            # Exibir menu para escolha do DataFrame
            print("\nQual Periodo Deseja Analisar?:")
            print("1. Geral")
            print("2. Quartas")
            print("3. Sabados")
            print("4. Todos")
            print("Digite o número correspondente ao Periodo ou 'sair' para encerrar: ")
            escolha_df = input().strip().lower()

            if escolha_df == 'sair':
                break

            try:
                escolha_df = int(escolha_df)
                if escolha_df < 1 or escolha_df > 4:
                    print("Opção inválida. Escolha um número entre 1 e 4.")
                    continue
            except ValueError:
                print("Entrada inválida. Digite um número entre 1 e 4.")
                continue

            # Exibir menu para escolha do prêmio
            print("\nEscolha o prêmio para analisar:")
            print("1. 1º Prêmio")
            print("2. 2º Prêmio")
            print("3. 3º Prêmio")
            print("4. 4º Prêmio")
            print("5. 5º Prêmio")
            print("Digite o número correspondente ao prêmio ou 'sair' para encerrar: ")
            escolha_premio = input().strip().lower()

            if escolha_premio == 'sair':
                continue

            try:
                escolha_premio = int(escolha_premio)
                if escolha_premio < 1 or escolha_premio > 5:
                    print("Opção inválida. Escolha um número entre 1 e 5.")
                    continue
            except ValueError:
                print("Entrada inválida. Digite um número entre 1 e 5.")
                continue

            # Processar a escolha do usuário
            if escolha_df == 1:
                df = Geral
                nome_df = 'Geral'
            elif escolha_df == 2:
                df = Quartas
                nome_df = 'Quartas'
            elif escolha_df == 3:
                df = Sabados
                nome_df = 'Sabados'
            elif escolha_df == 4:
                dataframes = {'Geral': Geral, 'Quartas': Quartas, 'Sabados': Sabados}
                for nome_df, df in dataframes.items():
                    print(f"\nResultados das contagens com destaque para baixas frequências em {nome_df} - {escolha_premio}º Prêmio:")
                    resultados = count_digit_appearances(df, escolha_premio)
                    for coluna, contagem in resultados.items():
                        print(f"{coluna}: {', '.join([f'{k}: {v}' for k, v in contagem.items()])}")
                    print("\n")
                continue

            # Exibir os resultados com destaque para baixas frequências
            print(f"\nResultados das contagens com destaque para baixas frequências em {nome_df} - {escolha_premio}º Prêmio:")
            resultados = count_digit_appearances(df, escolha_premio)
            for coluna, contagem in resultados.items():
                print(f"{coluna}: {', '.join([f'{k}: {v}' for k, v in contagem.items()])}")

    else:
        print("Erro ao carregar os DataFrames. Encerrando o programa.")

# Executar o programa
if __name__ == "__main__":
    main()

# Módulo 03
Análise de **Frequência** de **Dezenas** de **Milhar** e **Dezenas**

In [None]:
import pandas as pd
import gdown

# Passo 1: Instalar a biblioteca gdown
!pip install gdown

# Passo 2: Importar a biblioteca e baixar o arquivo
import gdown

# URL do arquivo no Google Drive
url = 'https://drive.google.com/uc?id=1ArehTx9jnEiJPUSRvNInmlrOk8Uv8730'

# Caminho onde o arquivo será salvo
output = 'Base_2024.csv'  # Nome do arquivo e extensão

# Baixar o arquivo
gdown.download(url, output, quiet=False)

# Passo 3: Ler o arquivo CSV
import pandas as pd

# Carregar apenas as colunas necessárias para as análises
columns_to_load = ['MC 1º', 'D 1º', 'MC 2º', 'D 2º', 'MC 3º', 'D 3º', 'MC 4º', 'D 4º', 'MC 5º', 'D 5º']
df = pd.read_csv(output, usecols=columns_to_load)

# Passo 4: Criar um menu para selecionar as colunas "MC" e "D" específicas e contar a frequência dos números

def menu():
    print("\nMenu de Análise Exploratória de Dezenas MC|DU")
    print("1. Analisar o 1º Prêmio")
    print("2. Analisar o 2º Prêmio")
    print("3. Analisar o 3º Prêmio")
    print("4. Analisar o 4º Prêmio")
    print("5. Analisar o 5º Prêmio")
    print("6. Analisar Todos os Prêmios")
    print("0. Sair")

def contar_frequencia(coluna):
    # Inicializar um dicionário para contagem de 00 a 99
    frequencia = {str(i).zfill(2): 0 for i in range(100)}

    # Contar a frequência dos valores na coluna especificada
    for valor in df[coluna]:
        valor_str = str(valor).zfill(2)
        if valor_str in frequencia:
            frequencia[valor_str] += 1

    # Ordenar a frequência dos números de forma crescente
    frequencia_ordenada = sorted(frequencia.items(), key=lambda item: item[1])

    return frequencia_ordenada

def exibir_frequencia(frequencia_ordenada, titulo):
    print(f"\n{titulo}")
    # Exibir a frequência dos números, 10 por linha
    for i in range(0, 100, 10):
        linha = frequencia_ordenada[i:i+10]
        # Modificação para incluir o "X" após cada número
        linha_formatada = [f"{numero}: {contagem}X" for numero, contagem in linha]
        print(" | ".join(linha_formatada))

def analisar_todos_premios():
    for i in range(1, 6):
        coluna_mc = f'MC {i}º'
        coluna_d = f'D {i}º'

        print(f"\nAnalisando a coluna [MILHAR|CENTENA] '{coluna_mc}'...")
        frequencia_mc = contar_frequencia(coluna_mc)
        exibir_frequencia(frequencia_mc, f"Frequência dos números na coluna [MILHAR|CENTENA] '{coluna_mc}'")

        print(f"\nAnalisando a coluna [DEZENA|UNIDADE] '{coluna_d}'...")
        frequencia_d = contar_frequencia(coluna_d)
        exibir_frequencia(frequencia_d, f"Frequência dos números na coluna [DEZENA|UNIDADE] '{coluna_d}'")

# Mapear as opções do menu para as colunas do DataFrame
opcoes_colunas = {
    '1': ('MC 1º', 'D 1º'),
    '2': ('MC 2º', 'D 2º'),
    '3': ('MC 3º', 'D 3º'),
    '4': ('MC 4º', 'D 4º'),
    '5': ('MC 5º', 'D 5º')
}

while True:
    menu()
    escolha = input("Escolha uma opção: ")

    if escolha in opcoes_colunas:
        coluna_mc, coluna_d = opcoes_colunas[escolha]
        print(f"\nAnalisando a coluna [MILHAR|CENTENA] '{coluna_mc}'...")
        frequencia_mc = contar_frequencia(coluna_mc)
        exibir_frequencia(frequencia_mc, f"Frequência dos números na coluna [MILHAR|CENTENA] '{coluna_mc}'")

        print(f"\nAnalisando a coluna [DEZENA|UNIDADE] '{coluna_d}'...")
        frequencia_d = contar_frequencia(coluna_d)
        exibir_frequencia(frequencia_d, f"Frequência dos números na coluna [DEZENA|UNIDADE] '{coluna_d}'")

    elif escolha == '6':
        analisar_todos_premios()

    elif escolha == '0':
        print("Saindo do programa.")
        break
    else:
        print("Opção inválida. Por favor, escolha uma opção válida.")

# Módulo 04
> Análise de **Atraso** de **Dezenas** de **MIlhar** e **Dezena** [MC-DU]

In [None]:
# Passo 1: Instalar bibliotecas (se necessário)
!pip install pandas
!pip install gdown

# Passo 2: Importar as bibliotecas
import pandas as pd
from datetime import datetime
import gdown

# Passo 3: Baixar o arquivo do Google Drive
url = 'https://drive.google.com/uc?id=1ArehTx9jnEiJPUSRvNInmlrOk8Uv8730'
output = 'Base_2024.csv'
gdown.download(url, output, quiet=False)

def resumo_dezenas(arquivo_entrada, prefixo_sorteio):
    """
    Função para gerar um resumo das dezenas sorteadas em concursos.

    Parâmetros:
        arquivo_entrada (str): O caminho para o arquivo CSV de entrada.
        prefixo_sorteio (str): O prefixo do sorteio (por exemplo, 'D ' ou 'MC ').

    Retorna:
        dict: Um dicionário com as dezenas como chaves e DataFrames com os resultados como valores.
    """
    df = pd.read_csv(arquivo_entrada)
    resultados_por_dezena = {str(dezena).zfill(2): [] for dezena in range(100)}
    dias_da_semana = ['Segunda-feira', 'Terça-feira', 'Quarta-feira', 'Quinta-feira', 'Sexta-feira', 'Sábado', 'Domingo']

    for index, row in df.iterrows():
        concurso = row['Concurso']
        data = row['Data']
        sorteios = [row[f'{prefixo_sorteio}{i}º'] for i in range(1, 6)]

        for i, sorteio in enumerate(sorteios, 1):
            dezena = str(sorteio).zfill(2)
            if dezena in resultados_por_dezena:
                atraso = concurso - resultados_por_dezena[dezena][-1]['Concurso'] if resultados_por_dezena[dezena] else 0
                resultados_por_dezena[dezena].append({
                    'Concurso': concurso,
                    'Data': data,
                    'Dia da Semana': dias_da_semana[datetime.strptime(data, '%Y-%m-%d').weekday()],
                    'Sorteio': f'{prefixo_sorteio}{i}º',
                    'Atraso': atraso
                })

    resumo_por_dezena = {}
    for dezena, resultados in resultados_por_dezena.items():
        if resultados:
            df_resultados = pd.DataFrame(resultados)
            df_resultados.sort_values(by='Concurso', ascending=False, inplace=True)
            resumo_por_dezena[dezena] = df_resultados

    return resumo_por_dezena

def menu_escolha():
    """
    Exibe um menu para o usuário escolher o tipo de análise.

    Retorna:
        str: O prefixo do sorteio escolhido ('D ' ou 'MC ').
    """
    while True:
        print("Escolha o tipo de análise que deseja realizar:")
        print("1. Análise de Dezenas")
        print("2. Análise de Dezenas de Milhar")
        escolha = input("Digite o número da sua escolha (1 ou 2): ")
        if escolha == '1':
            return 'D '
        elif escolha == '2':
            return 'MC '
        else:
            print("Escolha inválida! Por favor, escolha 1 ou 2.")

def menu_saida():
    """
    Exibe um menu para o usuário escolher o tipo de saída.

    Retorna:
        str: O tipo de saída escolhido ('simples' ou 'completa').
    """
    while True:
        print("Escolha o tipo de saída que deseja:")
        print("1. Saída Simples")
        print("2. Saída Completa")
        escolha = input("Digite o número da sua escolha (1 ou 2): ")
        if escolha == '1':
            return 'simples'
        elif escolha == '2':
            return 'completa'
        else:
            print("Escolha inválida! Por favor, escolha 1 ou 2.")

# Passo 7: Executar o menu e processar a escolha do usuário
prefixo_sorteio = menu_escolha()
tipo_saida = menu_saida()

# Processar o arquivo baixado e ajustar a lógica para exibir os atrasos relevantes
arquivo_entrada = "Base_2024.csv"
resumo = resumo_dezenas(arquivo_entrada, prefixo_sorteio)

# Encontrar o último concurso para cada dezena
ultimos_concursos = {dezena: df_resumo.iloc[0]['Concurso'] if not df_resumo.empty else 0 for dezena, df_resumo in resumo.items()}

# Encontrar o último concurso global
ultimo_concurso_global = max(ultimos_concursos.values())

# Atualizar atrasos para o último concurso global
for dezena, resultados in resumo.items():
    for index, row in resultados.iterrows():
        atraso = ultimo_concurso_global - row['Concurso']
        resultados.at[index, 'Atraso'] = atraso if atraso != 0 else 0

# Identificar e exibir atrasos relevantes para cada coluna
for sorteio in [f'{prefixo_sorteio}{i}º' for i in range(1, 6)]:
    print(f"--- Análise de atrasos para {sorteio} ---")
    atrasos_relevantes = []

    for dezena, resultados in resumo.items():
        sorteio_atual = resultados[resultados['Sorteio'] == sorteio]
        if not sorteio_atual.empty:
            ultimo_sorteio = sorteio_atual.iloc[0]
            if ultimo_sorteio['Atraso'] > 200:
                atrasos_relevantes.append((dezena, ultimo_sorteio))

    atrasos_relevantes.sort(key=lambda x: x[1]['Atraso'], reverse=True)

    for dezena, ultimo_sorteio in atrasos_relevantes:
        if tipo_saida == 'simples':
            print(f"Dezena: {dezena}, Atraso: {ultimo_sorteio['Atraso']}")
        else:
            print(f"Dezena: {dezena}, Atraso: {ultimo_sorteio['Atraso']}, Última Aparição: Concurso {ultimo_sorteio['Concurso']}, Data {ultimo_sorteio['Data']}, Dia da Semana {ultimo_sorteio['Dia da Semana']}")

    print()



Downloading...
From: https://drive.google.com/uc?id=1ArehTx9jnEiJPUSRvNInmlrOk8Uv8730
To: /content/Base_2024.csv
100%|██████████| 2.09M/2.09M [00:00<00:00, 17.8MB/s]


Escolha o tipo de análise que deseja realizar:
1. Análise de Dezenas
2. Análise de Dezenas de Milhar
Digite o número da sua escolha (1 ou 2): 1
Escolha o tipo de saída que deseja:
1. Saída Simples
2. Saída Completa
Digite o número da sua escolha (1 ou 2): 1
--- Análise de atrasos para D 1º ---
Dezena: 06, Atraso: 368
Dezena: 67, Atraso: 365
Dezena: 08, Atraso: 300
Dezena: 35, Atraso: 266
Dezena: 46, Atraso: 253
Dezena: 76, Atraso: 248
Dezena: 15, Atraso: 247
Dezena: 51, Atraso: 246
Dezena: 44, Atraso: 212
Dezena: 92, Atraso: 208
Dezena: 36, Atraso: 205

--- Análise de atrasos para D 2º ---
Dezena: 17, Atraso: 343
Dezena: 80, Atraso: 319
Dezena: 83, Atraso: 297
Dezena: 25, Atraso: 278
Dezena: 09, Atraso: 264
Dezena: 69, Atraso: 256
Dezena: 82, Atraso: 234
Dezena: 16, Atraso: 226
Dezena: 60, Atraso: 220
Dezena: 71, Atraso: 218
Dezena: 88, Atraso: 216
Dezena: 32, Atraso: 215
Dezena: 36, Atraso: 204
Dezena: 74, Atraso: 201

--- Análise de atrasos para D 3º ---
Dezena: 83, Atraso: 642
Dezen

# Módulo 05
 > Análise de **Paridade** por **Casa Decimal**


In [None]:
# Passo 1: Instalar pacotes necessários e baixar o arquivo .xlsx
!pip install gdown
!pip install tabulate

# Importar bibliotecas
import os
import pandas as pd
from tabulate import tabulate

# Baixar o arquivo .xlsx usando gdown
!gdown "https://drive.google.com/uc?id=10IcF31FnO4oWh2dYrq8qJWYR7Q8tTJkP"

# Listar arquivos no diretório atual para verificar o nome correto
os.listdir()

# Passo 2: Importar as bibliotecas necessárias e ler o arquivo .xlsx
# Função para ler o arquivo Excel e exibir as primeiras linhas
arquivo = "Base_2024_Casa_Decimal.xlsx"
df = pd.read_excel(arquivo)

# Exibir as primeiras linhas do DataFrame para verificar se a leitura foi feita corretamente
df.head()

# Passo 3: Função para calcular o percentual de pares e ímpares em uma coluna
def calcular_paridade(coluna):
    """
    Calcula o percentual de números pares e ímpares em uma coluna.

    Parameters:
    coluna (pd.Series): A coluna de dados para análise.

    Returns:
    tuple: Percentual de pares e ímpares na coluna, arredondado para o inteiro mais próximo.
    """
    total_numeros = len(coluna)
    pares = coluna[coluna % 2 == 0].count()
    impares = total_numeros - pares
    percentual_pares = round((pares / total_numeros) * 100)
    percentual_impares = round((impares / total_numeros) * 100)
    return percentual_pares, percentual_impares

# Passo 4: Aplicar a função às colunas específicas e estruturar os resultados
# Lista das colunas de prêmios para análise
colunas_premios = [
    'M 1º', 'C 1º', 'D 1º', 'U 1º',
    'M 2º', 'C 2º', 'D 2º', 'U 2º',
    'M 3º', 'C 3º', 'D 3º', 'U 3º',
    'M 4º', 'C 4º', 'D 4º', 'U 4º',
    'M 5º', 'C 5º', 'D 5º', 'U 5º'
]

# Estruturar os resultados
resultados = []
for i in range(1, 6):  # 5 prêmios
    linha = {'Prêmio': f'Prêmio {i}'}
    for categoria in ['M', 'C', 'D', 'U']:  # Categorias
        coluna_premio = f'{categoria} {i}º'
        percentual_pares, percentual_impares = calcular_paridade(df[coluna_premio])
        linha[f'{categoria} ( P ) '] = f'{percentual_pares}%'
        linha[f'{categoria} ( Í ) '] = f'{percentual_impares}%'
    resultados.append(linha)

# Criar um DataFrame com os resultados
df_resultados = pd.DataFrame(resultados)

# Exibir os resultados de forma tabular usando tabulate
print(tabulate(df_resultados, headers='keys', tablefmt='grid', showindex=False, numalign='center', stralign='center'))

# Passo 5: Considerações para futuras melhorias
# - Validar os dados e tratar possíveis erros na leitura do arquivo.
# - Adicionar uma verificação para garantir que todas as colunas esperadas estejam presentes no DataFrame.
# - Automatizar a atualização do arquivo baixado e a leitura do mesmo.



Downloading...
From: https://drive.google.com/uc?id=10IcF31FnO4oWh2dYrq8qJWYR7Q8tTJkP
To: /content/Base_2024_Casa_Decimal.xlsx
100% 510k/510k [00:00<00:00, 86.0MB/s]
+----------+------------+------------+------------+------------+------------+------------+------------+------------+
|  Prêmio  |  M ( P )   |  M ( Í )   |  C ( P )   |  C ( Í )   |  D ( P )   |  D ( Í )   |  U ( P )   |  U ( Í )   |
| Prêmio 1 |    51%     |    49%     |    52%     |    48%     |    50%     |    50%     |    50%     |    50%     |
+----------+------------+------------+------------+------------+------------+------------+------------+------------+
| Prêmio 2 |    50%     |    50%     |    50%     |    50%     |    50%     |    50%     |    51%     |    49%     |
+----------+------------+------------+------------+------------+------------+------------+------------+------------+
| Prêmio 3 |    51%     |    49%     |    50%     |    50%     |    50%     |    50%     |    50%     |    50%     |
+----------+---

# Módulo 06
 Análise de **Paridade** para **Dezena** de **Milhar** e **Dezena**

In [None]:
import gdown
import pandas as pd
from tabulate import tabulate

# Passo 1: Fazer o download do arquivo CSV
url = 'https://drive.google.com/uc?id=1ArehTx9jnEiJPUSRvNInmlrOk8Uv8730'
output = 'dados.csv'
gdown.download(url, output, quiet=False)

# Passo 2: Carregar o arquivo CSV em um DataFrame
df = pd.read_csv('dados.csv')

# Imprimir os nomes das colunas para depuração
print("Colunas disponíveis:", df.columns.tolist())

# Passo 3: Converter os números em grupos
tabela_grupos = {
    "01": {"grupo": "AVESTRUZ", "dezenas": ["01", "02", "03", "04"]},
    "02": {"grupo": "ÁGUIA", "dezenas": ["05", "06", "07", "08"]},
    "03": {"grupo": "BURRO", "dezenas": ["09", "10", "11", "12"]},
    "04": {"grupo": "BORBOLETA", "dezenas": ["13", "14", "15", "16"]},
    "05": {"grupo": "CACHORRO", "dezenas": ["17", "18", "19", "20"]},
    "06": {"grupo": "CABRA", "dezenas": ["21", "22", "23", "24"]},
    "07": {"grupo": "CARNEIRO", "dezenas": ["25", "26", "27", "28"]},
    "08": {"grupo": "CAMELO", "dezenas": ["29", "30", "31", "32"]},
    "09": {"grupo": "COBRA", "dezenas": ["33", "34", "35", "36"]},
    "10": {"grupo": "COELHO", "dezenas": ["37", "38", "39", "40"]},
    "11": {"grupo": "CAVALO", "dezenas": ["41", "42", "43", "44"]},
    "12": {"grupo": "ELEFANTE", "dezenas": ["45", "46", "47", "48"]},
    "13": {"grupo": "GALO", "dezenas": ["49", "50", "51", "52"]},
    "14": {"grupo": "GATO", "dezenas": ["53", "54", "55", "56"]},
    "15": {"grupo": "JACARÉ", "dezenas": ["57", "58", "59", "60"]},
    "16": {"grupo": "LEÃO", "dezenas": ["61", "62", "63", "64"]},
    "17": {"grupo": "MACACO", "dezenas": ["65", "66", "67", "68"]},
    "18": {"grupo": "PORCO", "dezenas": ["69", "70", "71", "72"]},
    "19": {"grupo": "PAVÃO", "dezenas": ["73", "74", "75", "76"]},
    "20": {"grupo": "PERU", "dezenas": ["77", "78", "79", "80"]},
    "21": {"grupo": "TOURO", "dezenas": ["81", "82", "83", "84"]},
    "22": {"grupo": "TIGRE", "dezenas": ["85", "86", "87", "88"]},
    "23": {"grupo": "URSO", "dezenas": ["89", "90", "91", "92"]},
    "24": {"grupo": "VEADO", "dezenas": ["93", "94", "95", "96"]},
    "25": {"grupo": "VACA", "dezenas": ["97", "98", "99", "00"]}
}

def converter_numero(numero):
    """Converte um número para o grupo correspondente."""
    for key, value in tabela_grupos.items():
        if numero in value["dezenas"]:
            return key
    return None

# Ajustar os nomes das colunas conforme necessário
for premio in range(1, 6):
    col_mc = f'MC {premio}º'
    col_d = f'D {premio}º'
    if col_mc in df.columns and col_d in df.columns:
        df[col_mc] = df[col_mc].apply(lambda x: converter_numero(str(int(x)).zfill(2)))
        df[col_d] = df[col_d].apply(lambda x: converter_numero(str(int(x)).zfill(2)))
    else:
        print(f"Colunas {col_mc} ou {col_d} não encontradas no DataFrame")

# Passo 4: Calcular o percentual de paridade
def calcular_paridade(coluna):
    """Calcula o percentual de números pares e ímpares em uma coluna."""
    pares = df[coluna].apply(lambda x: int(x) % 2 == 0).mean() * 100
    impares = 100 - pares
    return pares, impares

resultados = []
for premio in range(1, 6):
    col_mc = f'MC {premio}º'
    col_d = f'D {premio}º'
    if col_mc in df.columns and col_d in df.columns:
        mc_pares, mc_impares = calcular_paridade(col_mc)
        d_pares, d_impares = calcular_paridade(col_d)
        resultados.append([
            f'Premio {premio}',
            f'{mc_pares:.2f}%',
            f'{mc_impares:.2f}%',
            f'{d_pares:.2f}%',
            f'{d_impares:.2f}%'
        ])
    else:
        resultados.append([f'Premio {premio}', 'N/A', 'N/A', 'N/A', 'N/A'])

# Exibir os resultados em formato tabular
headers = ["Prêmio", "MC Pares (%)", "MC Ímpares (%)", "D Pares (%)", "D Ímpares (%)"]
print(tabulate(resultados, headers=headers, tablefmt="pretty"))


Downloading...
From: https://drive.google.com/uc?id=1ArehTx9jnEiJPUSRvNInmlrOk8Uv8730
To: /content/dados.csv
100%|██████████| 2.20M/2.20M [00:00<00:00, 113MB/s]


Colunas disponíveis: ['Concurso', 'Data', 'D/SEMAN', '1º PRÊMIO', 'S 1º', 'MC 1º', 'MC P/I 1º', 'P/I 1º', 'D 1º', 'D P/I 1º', 'GP 1º', 'GP P/I 1º', 'BICHO 1º', '2º PRÊMIO', 'S 2º', 'MC 2º', 'MC P/I 2º', 'P/I 2º', 'D 2º', 'D P/I 2º', 'GP 2º', 'GP P/I 2º', 'BICHO 2º', '3º PRÊMIO', 'S 3º', 'MC 3º', 'MC P/I 3º', 'P/I 3º', 'D 3º', 'D P/I 3º', 'GP 3º', 'GP P/I 3º', 'BICHO 3º', '4º PRÊMIO', 'S 4º', 'MC 4º', 'MC P/I 4º', 'P/I 4º', 'D 4º', 'D P/I 4º', 'GP 4º', 'GP P/I 4º', 'BICHO 4º', '5º PRÊMIO', 'S 5º', 'MC 5º', 'MC P/I 5º', 'P/I 5º', 'D 5º', 'D P/I 5º', 'GP 5º', 'GP P/I 5º', 'BICHO 5º']
+----------+--------------+----------------+-------------+---------------+
|  Prêmio  | MC Pares (%) | MC Ímpares (%) | D Pares (%) | D Ímpares (%) |
+----------+--------------+----------------+-------------+---------------+
| Premio 1 |    47.82%    |     52.18%     |   49.17%    |    50.83%     |
| Premio 2 |    48.10%    |     51.90%     |   47.19%    |    52.81%     |
| Premio 3 |    48.18%    |     51.82