## Aplicativo de celular para viciados em jogos de azar

Neste projeto, eu farei uma contribuição para o desenvolvimento de um aplicativo de celular que visa ajudar os viciados em jogos de azar a estimar as suas chances de ganhar.

Muitas pessoas começam a jogar na loteria por diversão, mas para algumas essa atividade se transforma em um hábito que eventualmente se torna em vício. Como outros apostadores compulsivos, os viciados em loteria logo começam a usar suas economias e empréstimos para apostar, acumulam dívidas e eventualmente seus impulsos incontroláveis os envolvem em situações de desespero como roubo.

Um instituto médico que visa prevenir e tratar os vícios do jogo quer construir um aplicativo de celular para ajudar os viciados em jogos de azar a estimar melhor suas chances de ganhar. O instituto tem uma equipe de engenheiros que irá construir o aplicativo, mas eles precisam de nós para criar o núcleo lógico do app e calcular as probabilidades.

Para a primeira versão do aplicativo, deverei me concentrar na loteria 6/49 e construir funções que permitam aos usuários responder perguntas como:

- Qual é a probabilidade de se ganhar um prêmio grande com um único bilhete?
- Qual é a probabilidade de se ganhar um grande prémio se apostarmos 40 bilhetes diferentes (ou qualquer outro número)?
- Qual é a probabilidade de se ter pelo menos cinco (ou quatro, ou três, ou dois) números sorteados em um único bilhete?

O instituto também quer que consideremos dados históricos provenientes de jogos de azar da loteria nacional 6/49, no Canadá. O conjunto de dados tem dados para 3.665 sorteios, datados de 1982 a 2018.

### Funções principais

Ao longo do projeto, eu farei diversos cálculos de probabilidades e combinações. Dessa forma, começarei escrevendo duas funções que serão usadas com frequência:

- Uma função que calcula os fatoriais
- Uma função que calcula combinações

In [15]:
# função para o cálculo de fatoriais
def factorial(n):
    return n * factorial(n-1) if n > 1 else 1

# função para o cálculo de combinações
def combinations(n, k):
    numerator = factorial(n)
    denominator = factorial(n-k) * factorial(k)
    return numerator / denominator

### Probabilidade de um único bilhete

Em seguida, eu criarei uma função que calcule a probabilidade de ganhar o grande prémio.

Na loteria 6/49, seis números são sorteados de um conjunto de 49 números que variam de 1 a 49. Um jogador ganha o grande prêmio se os seis números nos seus bilhetes corresponderem a todos os seis números sorteados. Se um jogador tiver um bilhete com os números {13, 22, 24, 27, 42, 44}, ele só ganhará o grande prêmio se os números sorteados forem {13, 22, 24, 27, 42, 44}. Se apenas um dos números for diferente, ele não ganhará o sorteio.

Para a primeira versão do aplicativo, será necessário que os jogadores possam calcular a probabilidade de ganharem o grande prêmio com base nos vários números que jogam em um único bilhete (para cada bilhete, um jogador escolhe seis números, dentre 49). Assim, vamos começar por meio da construção de uma função que calcule a probabilidade de se ganhar o grande prêmio para qualquer bilhete.

A equipe de engenharia do instituto médico disse que precisamos estar atentos aos seguintes detalhes quando a função for escritao:

- Dentro do aplicativo, o usuário insere seis números diferentes de 1 a 49.
- Nos bastidores, os seis números se tornarão uma lista em Python, que servirá como entrada única para a nossa função.
- A equipe de engenharia quer que a função imprima o valor da probabilidade de uma forma amigável - de uma forma que  pessoas sem qualquer conhecimento em probabilidade sejam capazes de entender.

Abaixo ecrevemos a função:

In [16]:
# função mencionada acima
def one_ticket_probability(list_of_six):
    # cálculo dos resultados possíveis
    possible_outcomes = combinations(49, int(len(list_of_six)))
    
    # único resultado
    single_outcome = 1
    
    # cálculo da probabilidade
    prob = single_outcome / possible_outcomes
    
    return "A probabilidade deste bilhete {} ser o ganhador é de {:.6%}. \
            Em outras palavras, a sua chance de ganhar é de 1 em {:,}".format(list_of_six, prob, possible_outcomes)

In [5]:
one_ticket_probability([4, 5, 6, 8, 34, 25])

'A probabilidade deste bilhete [4, 5, 6, 8, 34, 25] ser o ganhador é de 0.000007%.             Em outras palavras, a sua chance de ganhar é de 1 em 13,983,816.0'

Na função acima, eu peguei uma lista de seis números inteiros e calculei a probabilidade de que essa combinação exata será sorteada na loteria. A função pega uma lista e usa a função de combinações para encontrar o número total de resultados possíveis para uma lista de seis números inteiros e depois divide um por esse montante. Um, pois esta é a ordem exata na qual o bilhete deve sair para poder ganhar.

### Verificação de dados históricos para a loteria no Canadá

Acima, eu escrevi função que é capaz de dizer aos usuários qual é a probabilidade de se ganhar o grande prêmio com um único bilhete. Para a primeira versão do aplicativo, no entanto, os usuários também devem ser capazes de comparar seu bilhete com os dados históricos da loteria no Canadá e determinar se eles já teriam ganho até agora.

Assim, eu irei me concentrar em explorar os dados históricos da loteria 6/49. O conjunto de dados pode ser baixado no Kaggle e tem a seguinte estrutura:

In [17]:
import pandas as pd

# carregar o dataset
data = pd.read_csv(r'C:\Users\msantos\Downloads\649.csv', encoding='Latin-1')

# checar os primeiros registros 
data.head(3)

Unnamed: 0,PRODUCT,DRAW NUMBER,SEQUENCE NUMBER,DRAW DATE,NUMBER DRAWN 1,NUMBER DRAWN 2,NUMBER DRAWN 3,NUMBER DRAWN 4,NUMBER DRAWN 5,NUMBER DRAWN 6,BONUS NUMBER
0,649,1,0,6/12/1982,3,11,12,14,41,43,13
1,649,2,0,6/19/1982,8,33,36,37,39,41,9
2,649,3,0,6/26/1982,1,6,23,24,27,39,34


In [18]:
# checar os ultimos registros
data.tail(3)

Unnamed: 0,PRODUCT,DRAW NUMBER,SEQUENCE NUMBER,DRAW DATE,NUMBER DRAWN 1,NUMBER DRAWN 2,NUMBER DRAWN 3,NUMBER DRAWN 4,NUMBER DRAWN 5,NUMBER DRAWN 6,BONUS NUMBER
3662,649,3589,0,6/13/2018,6,22,24,31,32,34,16
3663,649,3590,0,6/16/2018,2,15,21,31,38,49,8
3664,649,3591,0,6/20/2018,14,24,31,35,37,48,17


O conjunto de dados contém dados históricos para 3.665 sorteios (cada linha mostra dados para um único sorteio), datados de 1982 a 2018. Para cada sorteio, pode-se encontrar os seis números desenhados nas seis colunas seguintes:

- NUMBER DRAWN 1 - .. - NUMBER DRAWN 6

### Função de verificação de dados históricos

Agora que estou familiarizado com o conjunto de dados, escreverei uma função que permitirá aos utilizadores comparar o seu bilhete com os dados históricos da loteria canadense e determinar se eles já teriam ganho alguma vez.

A equipe de engenharia me disse que preciso estar cientes dos seguintes detalhes:

- Dentro do aplicativo, o usuário insere seis números diferentes de 1 a 49.
- Nos bastidores, os seis números virão como uma lista Python e servirão como um input para a nossa função.
- A equipe de engenharia quer que escrevamos uma função que imprima:
    - o número de vezes que a combinação selecionada ocorreu no conjunto de dados do Canadá; 
    - a probabilidade de ganhar o grande prêmio no próximo sorteio com essa combinação.

Escreverei a função abaixo:

In [19]:
# função para extrair os seis números do dataset
def extract_numbers(row):
    
    # obter o número da coluna
    cols = row[row.index.str.contains("NUMBER DRAWN")]
    
    # retorna o conjuntp
    return {s for s in cols}

In [20]:
# extrai o número de conjuntos
number_sets = data.apply(extract_numbers, axis=1)
number_sets.head()

0    {3, 41, 11, 12, 43, 14}
1    {33, 36, 37, 39, 8, 41}
2     {1, 6, 39, 23, 24, 27}
3     {3, 9, 10, 43, 13, 20}
4    {34, 5, 14, 47, 21, 31}
dtype: object

A função acima pega cada linha do conjunto de dados, filtra as colunas necessárias que contêm o números sorteados e depois itera cada valor para criar um conjunto. O método dataframe.apply faz isso para cada linha do dataframe, gerando conjuntos para cada registro.

In [22]:
# funçãoq que checa ocorrências históricas
def check_historical_occurence(user_numbers, number_sets):
    
    # converte a lista de números do usuário em um conjunto
    user_numbers = set(user_numbers)
    
    # compara o conjunto do usuário com outros conjuntos extraídos
    # retorna uma série booleana
    comparison = number_sets == user_numbers
    
    # conta o número de vezes esta combinação foi compatível com resultados passados
    match = comparison.sum()
    
    # imprime o resultado da compatibilidade da combinação
    print("Esta combinação ocorreu {} vezes no passado".format(match))
    
    # calcula as chances de se ganhar com esse bilhete
    print(one_ticket_probability(user_numbers))

In [23]:
check_historical_occurence([4, 9, 42, 44, 15, 20], number_sets)

Esta combinação ocorreu 1 vezes no passado
A probabilidade deste bilhete {4, 9, 42, 44, 15, 20} ser o ganhador é de 0.000007%.             Em outras palavras, a sua chance de ganhar é de 1 em 13,983,816.0


A função acima calcula o número de vezes que uma determinada combinação de números em um bilhete ocorreu no passado e, em seguida, usando a função que escrevemos anteriormente para calcular a probabilidade de obter a ocorrência, informa o usuário sobre suas chances de ganhar. É importante notar que o desempenho histórico de um conjunto não define de forma alguma suas chances de ocorrências.

### Probabilidade em bilhetes múltiplos

Os viciados em loteria geralmente jogam mais de um bilhete em um único sorteio, pensando que isso pode aumentar significativamente suas chances de ganhar. O meu propósito é ajudá-los a estimar melhor suas chances de ganhar, de modo que vamos escrever uma função que permitirá aos usuários calcular as chances de ganhar, considerando um número qualquer de bilhetes diferentes.

Falei com a equipe de engenharia e eles me deram as seguintes informações:

- O usuário do app irá digitar o número de bilhetes diferentes que pretende jogar (sem digitar as combinações específicas que pretende jogar).
- Nossa função irá trabalhar com um número inteiro entre 1 e 13.983.816 (o número máximo de bilhetes diferentes).
- A função deve imprimir a informação referente a probabilidade de se ganhar o grande prêmio dependendo do número de bilhetes diferentes apostados.

Escreverei esta função.

In [14]:
# função para calcular a probabilidade de multiplos bilhetes
def multi_ticket_probability(num_tickets):
    
    # total de resultados possíveis
    possible_outcomes = combinations(49, 6)
    
    # o numero de resultados bem sucedidos é o num_tickets
    # calcular a probabilidade desses bilhetes vencerem
    probs = num_tickets / possible_outcomes
    
    # imprimir resultados em um formato amigável
    print("Se você jogar {} bilhetes, as suas chances de ganhar serão de {} em {:,}. \n\
    Em outras palavras, {:.5%} de chance".format(num_tickets, num_tickets, possible_outcomes, probs))

A função acima pega o número de bilhetes e calcula a probabilidade de se ganhar. Vamos testar a função usando múltiplas entradas de dados.

In [7]:
multi_ticket_probability(1)

Se você jogar 1 bilhetes, as suas chances de ganhar serão de 1 em 13,983,816.0. 
    Em outras palavras, 0.00001% de chance


In [8]:
multi_ticket_probability(1000000)

Se você jogar 1000000 bilhetes, as suas chances de ganhar serão de 1000000 em 13,983,816.0. 
    Em outras palavras, 7.15112% de chance


In [9]:
multi_ticket_probability(6991908)

Se você jogar 6991908 bilhetes, as suas chances de ganhar serão de 6991908 em 13,983,816.0. 
    Em outras palavras, 50.00000% de chance


### Números menos ganhadores

Até agora, eu escrevi as seguintes funções:

- one_ticket_probability() - calcula a probabilidade de se ganhar o grande prêmio com um único bilhete
- check_historical_occurrence() - verifica se uma determinada combinação ocorreu no conjunto de dados da lotaria do Canadá
- multi_ticket_probability() - calcula a probabilidade para qualquer número de bilhetes entre 1 e 13.983.816 

Por último, escreverei mais uma função para que os usuários calculem probabilidades para dois, três, quatro, ou cinco números vencedores.

Na maioria das loterias 6/49 há prêmios menores se o bilhete de um jogador acertar dois, três, quatro ou cinco dos seis números sorteados. Consequentemente, os usuários podem estar interessados em saber a probabilidade de ter dois, três, quatro ou cinco números vencedores.

Estes são os detalhes de engenharia que temos de conhecer:

- Dentro do aplicativo, as entradas do usuário:
    - seis números diferentes de 1 a 49; e
    - um número inteiro entre 2 e 5 que representa o número de números vencedores esperados
- A função imprime informações sobre a probabilidade de se ter o número inserido de números vencedores.

In [13]:
# function to calculate the probability of less than 6 numbers, which takes the number less than 6
# indicating the integer of winning numbers expected
def probability_less_6(user_choice):
    
    # calcular combinações, dada a escolha do usuário (6 escolhas k-user_choice)
    success_outcomes = combinations(6, user_choice)
    
    # calcular resultados possíveis, dada a escolha do usuário
    possible_outcomes = combinations(49-user_choice, 6-user_choice)
    
    # calcular o total de resultados
    total_outcomes = success_outcomes * possible_outcomes
    
    # calcular o total de resultados possíveis de 49, escolhendo 6 combinacoes
    total_combinations = combinations(49, 6)
    
    # calcular a probabilidade de vencer 
    prob = total_outcomes / total_combinations
    
    print("Sua chance de ganhar com {} numeros de 6 é {:.7%}".format(user_choice, prob))

In [11]:
probability_less_6(2)

Sua chance de ganhar com 2 numeros de 6 é 19.1326531%


In [12]:
probability_less_6(4)

Sua chance de ganhar com 4 numeros de 6 é 0.1061942%
