In [1]:
import pandas as pd
import numpy as np
from scipy.special import comb
from scipy.stats import binom, poisson, norm

Em um volante de loteria da Mega Sena temos um total de **60 números** para escolher onde a aposta mínima é de **seis números**. Você que é curiosa(o) resolve calcular a probabilidade de se acertar na Mega Sena com apenas **um jogo**. Para isso precisamos saber quantas **combinações de seis números podem ser formadas com os 60 números disponíveis**.

In [2]:
numero_bolas = 60
num_por_cartela = 6
cartela = 1

combinacoes = comb(numero_bolas, num_por_cartela)
combinacoes

propabilidade = cartela / combinacoes

print(f'total combinações mega sena %0.2f' % combinacoes)
print(f'probabilidade de ganhar %0.15f' % propabilidade)

total combinações mega sena 50063860.00
probabilidade de ganhar 0.000000019974489


Em um concurso para preencher uma vaga de cientista de dados temos um total de **10 questões** de múltipla escolha com **3 alternativas possíveis** em cada questão. **Cada questão tem o mesmo valor.** Suponha que um candidato resolva se aventurar sem ter estudado absolutamente nada. Ele resolve fazer a prova de olhos vendados e chutar todas as resposta. Assumindo que a prova **vale 10 pontos e a nota de corte seja 5**, obtenha a probabilidade deste candidato **acertar 5 questões** e também a probabilidade deste candidato **passar para a próxima etapa do processo seletivo**.

In [3]:
# quantidade de questões, numero de ensaios
n = 10

# Qual a probabilidade de sucesso p?
numero_de_alternativa_por_questão = 3 
p = 1 / numero_de_alternativa_por_questão

# probabilidade de fracasso q? 
q = 1 - p

# total de eventos que se deseja obter sucesso k? 
k = 5

propabilidade = binom.pmf(k, n, p) * 100
propabilidade_passar = binom.sf(4, n, p) * 100

print(f'Probabilidade de acertar 5 questões: {propabilidade:.2f}%')
print(f'Probabilidade de passar (acertar 5 questões ou mais): {propabilidade_passar:.2f}%')

Probabilidade de acertar 5 questões: 13.66%
Probabilidade de passar (acertar 5 questões ou mais): 21.31%


Suponha que acabamos de criar um jogo de loteria, chamado Show de prêmios. Neste nosso novo jogo, o apostador marca **20 números**, dentre os **25 disponíveis** no bilhete, e pode ganhar até 1 milhão de reais.

Determine **qual o número de combinações possíveis (espaço amostral)** e a **probabilidade de se ganhar o prêmio jogando apenas um bilhete** (considere apenas quinze casas decimais).

In [4]:
espaco_amostral = comb(N = 25, k = 20)
probabilidade = 1 / comb(N = 25, k = 20)

print(f'Numero de combinações possíveis: {espaco_amostral:.0f}')
print(f'Probabilidade de ganhar jogando apenas um bilhete: {probabilidade:0.15f}')

print('Combinações = %d e Probabilidade = %0.15f' % (espaco_amostral, probabilidade))

Numero de combinações possíveis: 53130
Probabilidade de ganhar jogando apenas um bilhete: 0.000018821757952
Combinações = 53130 e Probabilidade = 0.000018821757952


Uma moeda, perfeitamente equilibrada, é lançada para o alto **quatro vezes**. Utilizando a distribuição binomial, obtenha **a probabilidade de a moeda cair com a face coroa voltada para cima duas vezes**.

In [5]:
p = 1 / 2  # Probabilidade de sair COROA
n = 4      # Total de lançamentos
k = 2      # Total de sucessos (faces COROA voltada para cima)

probabilidade = binom.pmf(k, n, p)

print(f'Probabilidade de cair a moeda com a face coroa: {probabilidade:0.4f}')

Probabilidade de cair a moeda com a face coroa: 0.3750


Um dado, perfeitamente equilibrado, é lançado para o alto **dez vezes**. Utilizando a **distribuição binomial**, obtenha a probabilidade de o dado cair com o número **cinco** voltado para cima **pelo menos três vezes**.

In [6]:
p = 1 / 6  # Probabilidade de sair o 5 no dado
n = 10      # Total de lançamentos

probabilidade = binom.sf(2, n, p ) * 100

print(f'Probabilidade e cair 5 pelos menos 3 vezes: {probabilidade}')

Probabilidade e cair 5 pelos menos 3 vezes: 22.47732021287407


Suponha que a probabilidade de um casal ter filhos com olhos azuis seja de 22%. Em 50 famílias, com 3 crianças cada uma, quantas podemos esperar que tenham dois filhos com olhos azuis?

In [7]:
p = 0.22
n = 3
k = 2
propabilidade = binom.pmf(k, n, p).sum()
filos_olhos_azuis = 50 * propabilidade
filos_olhos_azuis

5.662799999999996

O número médio de clientes que entram em uma padaria por hora é igual a 20. Obtenha a probabilidade de, na próxima hora, entrarem exatamente 25 clientes.

* A: 11,22% 
* B: 5,19%
* C: 4,46%
* D: 95,54%

In [8]:
m = 20
k = 25

probabilidade = poisson.pmf(k, m) * 100
print(f'Probabilidade: {probabilidade:0.2f}%')

Probabilidade: 4.46%


In [9]:
# Construindo tabela normal padronizada
tabela_normal_padronizada = pd.DataFrame(
    [], 
    index=["{0:0.2f}".format(i / 100) for i in range(0, 400, 10)],
    columns = ["{0:0.2f}".format(i / 100) for i in range(0, 10)])

for index in tabela_normal_padronizada.index:
    for column in tabela_normal_padronizada.columns:
        Z = np.round(float(index) + float(column), 2)
        tabela_normal_padronizada.loc[index, column] = "{0:0.4f}".format(norm.cdf(Z))

tabela_normal_padronizada.rename_axis('Z', axis = 'columns', inplace = True)

tabela_normal_padronizada.head()

Z,0.00,0.01,0.02,0.03,0.04,0.05,0.06,0.07,0.08,0.09
0.0,0.5,0.504,0.508,0.512,0.516,0.5199,0.5239,0.5279,0.5319,0.5359
0.1,0.5398,0.5438,0.5478,0.5517,0.5557,0.5596,0.5636,0.5675,0.5714,0.5753
0.2,0.5793,0.5832,0.5871,0.591,0.5948,0.5987,0.6026,0.6064,0.6103,0.6141
0.3,0.6179,0.6217,0.6255,0.6293,0.6331,0.6368,0.6406,0.6443,0.648,0.6517
0.4,0.6554,0.6591,0.6628,0.6664,0.67,0.6736,0.6772,0.6808,0.6844,0.6879


A aplicação de uma prova de estatística em um concurso apresentou um conjunto de notas normalmente distribuídas. Verificou-se que o conjunto de notas tinha média 70 e desvio padrão de 5 pontos.
Qual a probabilidade de um aluno, selecionado ao acaso, ter nota menor que 85?

* A: 99,86%
* B: 0,13%
* C: 0%
* D: 12,65%


In [10]:
media = 70
desvio_padrao = 5

Z = (85 - media) / desvio_padrao

norm.cdf(Z)

0.9986501019683699

O faturamento diário de um motorista de aplicativo segue uma distribuição aproximadamente normal, com média R$ 300,00 e desvio padrão igual a R$ 50,00. Obtenha as probabilidades de que, em um dia aleatório, o motorista ganhe:

1) Entre R$ 250,00 e R$ 350,00

2) Entre R$ 400,00 e R$ 500,00

* A: 1) 68,27%; 2) 2,27%
* B: 1) 9,38%; 2) 5,49%
* C: 1) 2,27%; 2) 68,27%
* D: 1) 0,6827%; 2) 0,0227%

In [11]:
media = 300
desvio_padrao = 50
ganho_a = [250, 350]
ganho_b = [400, 500]

def probabilidade_cdf(x_inf, x_sup, media, desvio_padrao):
    Z_inf = (x_inf - media) / desvio_padrao
    Z_sup = (x_sup - media) / desvio_padrao
    return norm.cdf(Z_inf) - norm.cdf(Z_sup)

propabilidade_1 = probabilidade_cdf(ganho_a[0], ganho_a[1], media, desvio_padrao)
propabilidade_2 = probabilidade_cdf(ganho_b[0], ganho_b[1], media, desvio_padrao)

propabilidade_1, propabilidade_2

(-0.6826894921370859, -0.02271846070634609)

O Inmetro verificou que as lâmpadas incandescentes da fabricante XPTO apresentam uma vida útil normalmente distribuída, com média igual a 720 dias e desvio padrão igual a 30 dias. Calcule a probabilidade de uma lâmpada, escolhida ao acaso, durar:

1) Entre 650 e 750 dias

2) Mais que 800 dias

3) Menos que 700 dias

* A: 1) 16,85%; 2) 0,38%; 3) 25,25%
* B: 1) 83,15%; 2) 99,62%; 3) 74,75%
* C: 1) 83,15%; 2) 0,38%; 3) 25,25%
* D: 1) 0,8315%; 2) 0,0038%; 3) 0,2525%

In [12]:
media = 720
desvio_padrao = 30 
durabilidadea = [650, 750]
durabilidadeb = [800]
durabilidadec = [700]

def probabilidade_cdf(x_inf, x_sup, media, desvio_padrao):
    Z_inf = (x_inf - media) / desvio_padrao
    Z_sup = (x_sup - media) / desvio_padrao
    return norm.cdf(Z_inf) - norm.cdf(Z_sup)

propabilidade_a = probabilidade_cdf(durabilidadea[0], durabilidadea[1], media, desvio_padrao)
propabilidade_b = 1 - (norm.cdf( (durabilidadeb[0] - media) / desvio_padrao ))
propabilidade_c = (norm.cdf( (durabilidadec[0] - media) / desvio_padrao ))

propabilidade_a, propabilidade_b, propabilidade_c

(-0.8315294174398976, 0.003830380567589775, 0.2524925375469229)

Utilizando a tabela padronizada, ou o ferramental disponibilizado pelo Python, encontre a área sob a curva normal para os valores de Z abaixo:
1) Z < 1,96
2) Z > 2,15
3) Z < -0,78
4) Z > 0,59

* **A: 1) 0,9750; 2) 0,0158; 3) 0,2177; 4) 0,2776**
* B: 1) 0,9750; 2) 0,0158; 3) 0,7823; 4) 0,2776
* C: 1) 0,0250; 2) 0,9842; 3) 0,7823; 4) 0,7224
* D: 1) 0,9750; 2) 0,9842; 3) 0,2177; 4) 0,7224

In [13]:
for z in [1.96, 2.15, -0.78, 0.59]:
    print( round(norm.cdf(z),4))
    print( round(norm.cdf(-z),4))

0.975
0.025
0.9842
0.0158
0.2177
0.7823
0.7224
0.2776


Para estimar o valor médio gasto por cada cliente de uma grande rede de fast-food, foi selecionada uma amostra de 50 clientes.

Assumindo que o valor do desvio padrão da população seja de R$ 6,00 e que esta população se distribui normalmente, obtenha a margem de erro desta estimativa para um nível de confiança de 95%.

|Nível de<br>confiança|Valor da área sob<br>a curva normal| $z$ |
|:----------------:|:---------------------------------:|:---:|
|90%               |0,95                               |1,645|
|95%               |0,975                              |1,96 |
|99%               |0,995                              |2,575|

In [16]:
z = norm.ppf(0.975)
desvio_padrao = 6
n = 50

e = z * (desvio_padrao / np.sqrt(n))
print("R$ {0:0.2f}".format(e))

R$ 1.66


Uma amostra aleatória simples de 1976 itens de uma população normalmente distribuída, com desvio padrão populacional igual a 11, resultou em uma média amostral de 28.

Qual o intervalo de confiança de 90% para a média populacional?

In [21]:
amostra = 1976
desvio_padrao = 11
media_amostra = 28
z = norm.ppf(0.95)

e = z * (desvio_padrao / np.sqrt(amostra))
sigma = (desvio_padrao / np.sqrt(amostra))

# isso
intervalo = (round(media_amostra - e, 2 ), round(media_amostra + e, 2))

# ou isso
norm.interval( confidence= 0.95, loc = media_amostra, scale = sigma)

(27.514993782489043, 28.485006217510957)

O valor do gasto médio dos clientes de uma loja de conveniência é de R$ 45,50. Assumindo que o desvio padrão dos gastos é igual a R$ 15,00, qual deve ser o tamanho da amostra para estimarmos a média populacional com um nível de significância de 10%?

Considere que o erro máximo aceitável seja de 10%.

In [24]:
media_gasto = 45.50
sigma = 15 # desvio_padrao
significancia = 0.1
confianca = 1 - significancia

erro_percentual = 0.1
e = erro_percentual * media_gasto # Quando o erro for representado em termos percentuais, deve ser interpretado como um percentual relacionado à média.

x = 0.5 + (confianca / 2)
z = norm.ppf(x)

n = (z * (sigma / e )) ** 2 
int(n.round())

29

Um fabricante de farinha verificou que, em uma amostra aleatória formada por 200 sacos de 25 kg de um lote formado por 2.000 sacos, apresentou um desvio padrão amostral do peso igual a 480 g.

Considerando um erro máximo associado à média populacional igual a 0,3 kg e um nível de confiança igual a 95%, qual tamanho de amostra deveria ser selecionado para obtermos uma estimativa confiável do parâmetro populacional?

In [None]:
def area_tot(confianca):
    return 0.5 + (confianca / 2)

N = 2000

z = norm.ppf( area_tot(0.95) )

s = 480

e = 0.3 * 1000 # Convertendo kg para g

n = ((z**2) * (s**2) * (N)) / (((z**2) * (s**2)) + ((e**2) * (N-1)))
int(n.round())

10