In [17]:
import numpy as np
import matplotlib as plt

### Variável aleatória de Poisson
O módulo numpy.random também possui várias distribuições de probabilidade úteis para variáveis aleatórias discretas e contínuas. Neste exercício, você aprenderá como extrair amostras de uma distribuição de probabilidade.

Em particular, você irá desenhar amostras de uma distribuição de probabilidade discreta muito importante, a distribuição de Poisson, que é tipicamente usada para modelar a taxa média na qual os eventos ocorrem.

Após o exercício, você deve poder aplicar essas etapas a qualquer uma das distribuições de probabilidade encontradas em numpy.random. Além disso, você também verá como a média da amostra muda à medida que extraímos mais amostras de uma distribuição.

In [14]:
# Inicializar seed e parâmetros
np.random.seed(123) # definir para poder reproduzir os mesmos resultados
lam, size_1, size_2 = 5, 3, 1000

In [15]:
# Desenhar amostras e calcular a diferença absoluta entre lambda e a média da amostra
samples_1 = np.random.poisson(lam, size_1)
samples_2 = np.random.poisson(lam, size_2)
answer_1 = abs(np.mean(samples_1) - lam)
answer_2 = abs(np.mean(samples_2) - lam)

print("|Lambda - média da amostra| com {} amostras é {} e com {} amostras é {}. ".format(size_1, answer_1, size_2, answer_2))

|Lambda - média da amostra| com 3 amostras é 0.33333333333333304 e com 1000 amostras é 0.07699999999999996. 


### Embaralhando um baralho de cartas

Muitas vezes estamos interessados em randomizar a ordem de um conjunto de itens. Considere um jogo de cartas onde primeiro embaralhe o baralho de cartas ou um jogo de scrabble onde as letras são primeiro misturadas em uma sacola. Como exercício final desta seção, você aprenderá outra função útil - np.random.shuffle (). Esta função permite aleatoriamente embaralhar uma seqüência no lugar. No final deste exercício, você saberá como embaralhar um baralho de cartas ou qualquer sequência de itens.

In [21]:
# Baralho de cartas
deck_of_cards = [('Heart', 0), ('Heart', 1), ('Heart', 2), ('Heart', 3), ('Heart', 4), ('Heart', 5), ('Heart', 6), ('Heart', 7), ('Heart', 8),
                 ('Heart', 9), ('Heart', 10), ('Heart', 11), ('Heart', 12), ('Club', 0), ('Club', 1), ('Club', 2), ('Club', 3), ('Club', 4), 
                 ('Club', 5), ('Club', 6), ('Club', 7), ('Club', 8), ('Club', 9), ('Club', 10), ('Club', 11), ('Club', 12), ('Spade', 0), 
                 ('Spade', 1), ('Spade', 2), ('Spade', 3), ('Spade', 4), ('Spade', 5), ('Spade', 6), ('Spade', 7), ('Spade', 8), ('Spade', 9), 
                 ('Spade', 10), ('Spade', 11), ('Spade', 12), ('Diamond', 0), ('Diamond', 1), ('Diamond', 2), ('Diamond', 3), ('Diamond', 4), 
                 ('Diamond', 5), ('Diamond', 6), ('Diamond', 7), ('Diamond', 8), ('Diamond', 9), ('Diamond', 10), ('Diamond', 11), ('Diamond', 12)]

In [28]:
# Embaralhar
np.random.shuffle(deck_of_cards) 

# Imprmir as três principais cartas
card_choices_after_shuffle = deck_of_cards[0:3]
print(card_choices_after_shuffle)

[('Diamond', 8), ('Diamond', 7), ('Club', 10)]


### Jogando um dado justo

Depois de entender os conceitos básicos de criação de uma simulação, você pode aplicá-la a qualquer sistema ou processo. Em seguida, aprenderemos como cada etapa é implementada usando alguns exemplos básicos.

Como aprendemos, a simulação envolve amostragem aleatória repetida. O primeiro passo, então, é obter uma amostra aleatória. Depois disso, tudo o que fazemos é repetir o processo várias vezes. Este exercício se concentrará em entender como obtemos uma amostra aleatória. Vamos estudar isso no contexto de jogar um dado de seis lados justo.

No final deste exercício, você estará familiarizado com a maneira de implementar as duas primeiras etapas da execução de uma simulação - definindo uma variável aleatória e atribuindo probabilidades.

In [32]:
# Definir os valores do dado (die), probabilidade e lançamento (throws)
die, probabilities, throws = [1,2,3,4,5,6], [1/6,1/6,1/6,1/6,1/6,1/6], 1

# jogar o dado uma vez e registrar o resultado
outcome = np.random.choice(die, size=throws, p=probabilities)

print("O resultado do lançamento é: {}".format(outcome[0]))

O resultado do lançamento é: 5


### Jogando dois dados justos

Agora sabemos como implementar as duas primeiras etapas de uma simulação. Agora vamos implementar o próximo passo - definir a relação entre variáveis aleatórias.

Muitas vezes, nossa simulação envolve não apenas uma, mas várias variáveis aleatórias. Considere um jogo onde você joga dois dados e ganha se cada dado mostrar o mesmo número. Aqui nós temos duas variáveis aleatórias - os dois dados - e uma relação entre cada um deles - nós ganhamos se eles mostrarem o mesmo número, perdemos se eles não mostrarem. Na realidade, a relação entre variáveis aleatórias pode ser muito mais complexa, especialmente ao simular coisas como padrões climáticos.

No final deste exercício, você estará familiarizado com a implementação do terceiro passo da execução de uma simulação - definindo relações entre variáveis aleatórias.

In [43]:
# Definir o número de dados, simular e registrar os resultados
die, probabilities, num_dice = [1,2,3,4,5,6], [1/6, 1/6, 1/6, 1/6, 1/6, 1/6], 2
outcomes = np.random.choice(die, size=num_dice, p=probabilities)

# Ganha se o resultado dos dois dados forem iguais
if outcomes[0] == outcomes[1]: 
    answer = 'ganhou' 
else:
    answer = 'perdeu'

print("O resultado dos dados foram {} e {}. Você {}!".format(outcomes[0], outcomes[1], answer))

O resultado dos dados foram 5 e 5. Você ganhou!


### Simulando o jogo de dados

Agora sabemos como implementar as três primeiras etapas de uma simulação. Agora vamos considerar a próxima etapa - amostragem aleatória repetida.

Simular um resultado uma vez não nos diz muito sobre a frequência com que podemos esperar ver esse resultado. No caso do jogo de dados do exercício anterior, é ótimo termos vencido uma vez. Mas suponha que queremos ver quantas vezes podemos esperar ganhar se jogarmos esse jogo várias vezes, precisamos repetir o processo de amostragem aleatória muitas vezes. Repetir o processo de amostragem aleatória é útil para entender e visualizar a incerteza inerente e decidir os próximos passos.

Após este exercício, você estará familiarizado com a implementação da quarta etapa de execução de uma simulação - amostragem repetida e geração de resultados.

In [50]:
# Definir parâmetros do modelo e simular lançamento dos dados
die, probabilities, num_dice = [1,2,3,4,5,6], [1/6, 1/6, 1/6, 1/6, 1/6, 1/6], 2
sims, wins = 100, 0

for i in range(sims):
    outcomes = outcomes = np.random.choice(die, size=num_dice, p=probabilities)
    # Increment `wins` by 1 if the dice show same number
    if outcomes[0] == outcomes[1]: 
        wins = wins + 1 

print("Com {} jogos, você ganhou {} vezes".format(sims, wins))

Com 100 jogos, você ganhou 17 vezes


### Simulando um sorteio de loteria

Nos últimos três exercícios deste capítulo, estaremos reunindo tudo o que você aprendeu até agora. Nós executaremos uma simulação completa, tomaremos uma decisão com base nos resultados observados e aprenderemos a modificar as entradas para o modelo de simulação.

Usaremos simulações para descobrir se queremos ou não comprar um bilhete de loteria. Suponha que você tenha a oportunidade de comprar um bilhete de loteria que lhe dê uma chance de ganhar um grande prêmio de US\$ 1 milhão. Como existem 1000 bilhetes no total, sua probabilidade de ganhar é de 1 em 1000. Cada bilhete custa US\$ 10. Vamos usar nosso entendimento de simulações básicas para primeiro simular um desenho da loteria.

In [61]:
# Definir preço do bilhet, número de bilhetes disponíveis e valor do premio
preco_bilhete, num_bilhetes, valor_premio = 10, 1000, 1000000

# Probabilidade de vencer
chance_vencer = 1/num_bilhetes

# Código para simular um único sorteio da loteria
ganhos = [-preco_bilhete, valor_premio-preco_bilhete]
probabilidade = [1-chance_vencer, chance_vencer]
resultado = np.random.choice(a=ganhos, size=1, p=probabilidade, replace=True)

print("Resultado de um sorteio da loteria é {}".format(outcome))

Resultado de um sorteio da loteria é [5]


### Devemos comprar?

No último exercício, simulamos o sorteio aleatório do bilhete de loteria uma vez. Neste exercício, concluímos o processo de simulação repetindo o processo várias vezes.

Repetir o processo nos dá vários resultados. Podemos pensar nisso como múltiplos universos onde o mesmo sorteio ocorreu. Podemos então determinar os ganhos médios em todos esses universos. Se os ganhos médios são maiores do que o que pagamos pelo bilhete, então faz sentido comprá-lo, caso contrário, podemos não querer comprar o bilhete.

Isso é tipicamente como as simulações são usadas para avaliar os investimentos das empresas. Depois de concluir este exercício, você terá as ferramentas básicas necessárias para usar simulações para a tomada de decisões.

In [69]:
# Definir preço do bilhete, número de bilhetes disponíveis e valor do premio
preco_bilhete, num_bilhetes, valor_premio = 10, 1000, 1000000
chance_vencer = 1/num_bilhetes
size = 1000
ganhos = [-preco_bilhete, valor_premio-preco_bilhete]
prob = [1-chance_vencer, chance_vencer]

res = np.random.choice(a=ganhos, size=size, p=prob, replace=True)

# Média dos resultados
answer = np.mean(res)
print("Retorno médio de {} simulações = {}".format(size, answer))

Retorno médio de 1000 simulações = -10.0


### Calculando um preço de loteria de equilíbrio

As simulações nos permitem fazer perguntas mais sutis que podem não necessariamente ter uma solução analítica fácil. Em vez de resolver uma fórmula matemática complexa, obtemos diretamente vários resultados de amostra. Podemos realizar experimentos modificando entradas e estudando como essas mudanças afetam o sistema. Por exemplo, uma vez que temos um modelo razoavelmente razoável de padrões climáticos globais, poderíamos avaliar o impacto do aumento das emissões de gases de efeito estufa.

No exemplo da loteria, podemos querer saber quão caro o bilhete precisa ser para não fazer sentido comprá-lo. Para entender isso, precisamos modificar o custo do ticket para ver quando o resultado esperado é negativo.


In [89]:
# Initialize simulations and cost of ticket
num_bilhetes, valor_premio = 1000, 1000000
chance_vencer = 1/num_bilhetes
sims, preco_bilhete = 1, 0


#Use um loop while para incrementar `preco_bilhete` até que o valor médio dos resultados caia abaixo de zero
while 1:
    res = np.random.choice([-preco_bilhete, valor_premio-preco_bilhete], 
                           size=sims, 
                           p=[1-chance_vencer, chance_vencer], 
                           replace=True)
    if res.mean() < 0:
        break
    else:
        preco_bilhete += 1
answer = preco_bilhete - 1

print("O preço mais alto pelo qual faz sentido comprar o bilhete é {}".format(answer))

O preço mais alto pelo qual faz sentido comprar o bilhete é 0
