**Probabilidade de ser aprovado em provas de múltipla escolha**

O objetivo desse notebook é comparar a propabilidade de ser aprovado em um teste de múltipla escolha contando apenas com a sorte.

**A)** A princípio, iremos considerar uma avaliação com **10 questões** de múltipla escolha, com **3 alternativas** cada. Para ser aprovado na prova, é necessário acertar ao menos **5 questões**.

In [95]:
'''Importando bibliotecas'''
import pandas as pd
from scipy.stats import binom

In [96]:
'''Definindo os parametros'''
num_eventos_total = 10
num_eventos_com_sucesso = 5
probalidade_sucesso_do_evento = 1 / 3

In [97]:
k = num_eventos_com_sucesso
n = num_eventos_total
p = probalidade_sucesso_do_evento

In [98]:
''' Esse tipo de problema, por possuir as caracteristicas de uma distribuição binomial,
    pode ser resolvido através da função binom da biblioteca scipy'''

probabilidade_acertar_5questoes_3alternativas  = binom.pmf(k, n, p)
print('Probabilidade de acertar 5 questões: %2.2f%%' % (probabilidade_acertar_5questoes_3alternativas  * 100))

Probabilidade de acertar 5 questões: 13.66%


In [99]:
''' Calculamos a probabilidade de acertar 5 questões, mas, para calcular a
    probabilidade de ser aprovado no exame, é necessário somar as probabilidades
    de acertar 5, 6, 7, 8, 9 e 10 questões.'''

probabilidade_passar_5questoes_3alternativas = binom.pmf([i for i in range(5,10)], n, p).sum()
print('Probabilidade de passar no teste: %2.2f%%' % (probabilidade_passar_5questoes_3alternativas * 100))

Probabilidade de passar no teste: 21.31%


**B)** E se houvessem 4 alternativas em cada questão?

In [100]:
'''Definindo os parametros'''
num_eventos_total = 10
num_eventos_com_sucesso = 5
probalidade_sucesso_do_evento = 1 / 4

In [101]:
k = num_eventos_com_sucesso
n = num_eventos_total
p = probalidade_sucesso_do_evento

In [102]:
probabilidade_acertar_5questoes_4alternativas  = binom.pmf(k, n, p)
print('Probabilidade de acertar 5 questões: %2.2f%%' % (probabilidade_acertar_5questoes_4alternativas  * 100))

Probabilidade de acertar 5 questões: 5.84%


In [103]:
probabilidade_passar_5questoes_4alternativas = binom.pmf([i for i in range(5,10)], n, p).sum()
print('Probabilidade de passar no teste: %2.2f%%' % (probabilidade_passar_5questoes_4alternativas * 100))

Probabilidade de passar no teste: 7.81%


**C)** E se houvessem 5 alternativas em cada questão?

In [104]:
'''Definindo os parametros'''
num_eventos_total = 10
num_eventos_com_sucesso = 5
probalidade_sucesso_do_evento = 1 / 5

In [105]:
k = num_eventos_com_sucesso
n = num_eventos_total
p = probalidade_sucesso_do_evento

In [106]:
probabilidade_acertar_5questoes_5alternativas  = binom.pmf(k, n, p)
print('Probabilidade de acertar 5 questões: %2.2f%%' % (probabilidade_acertar_5questoes_5alternativas  * 100))

Probabilidade de acertar 5 questões: 2.64%


In [107]:
probabilidade_passar_5questoes_5alternativas = binom.pmf([i for i in range(5,10)], n, p).sum()
print('Probabilidade de passar no teste: %2.2f%%' % (probabilidade_passar_5questoes_5alternativas * 100))

Probabilidade de passar no teste: 3.28%


**D)** E se aumentar a nota de corte de 5 questões para 6?

In [108]:
'''Definindo os parametros'''
num_eventos_total = 10
num_eventos_com_sucesso = 6

k = num_eventos_com_sucesso
n = num_eventos_total
p = [1/3,1/4,1/5]

In [109]:
probabilidade_acertar_6questoes_3alternativas  = binom.pmf(k, n, p[0])
print('Probabilidade de acertar 6 questões: %2.2f%%' % (probabilidade_acertar_6questoes_3alternativas  * 100))

probabilidade_acertar_6questoes_4alternativas  = binom.pmf(k, n, p[1])
print('Probabilidade de acertar 6 questões: %2.2f%%' % (probabilidade_acertar_6questoes_4alternativas  * 100))

probabilidade_acertar_6questoes_5alternativas  = binom.pmf(k, n, p[2])
print('Probabilidade de acertar 6 questões: %2.2f%%' % (probabilidade_acertar_6questoes_5alternativas  * 100))

Probabilidade de acertar 6 questões: 5.69%
Probabilidade de acertar 6 questões: 1.62%
Probabilidade de acertar 6 questões: 0.55%


In [110]:
probabilidade_passar_6questoes_3alternativas = binom.pmf([i for i in range(6,10)], n, p[0]).sum()
print('Probabilidade de passar no teste: %2.2f%%' % (probabilidade_passar_6questoes_3alternativas * 100))

probabilidade_passar_6questoes_4alternativas = binom.pmf([i for i in range(6,10)], n, p[1]).sum()
print('Probabilidade de passar no teste: %2.2f%%' % (probabilidade_passar_6questoes_4alternativas * 100))

probabilidade_passar_6questoes_5alternativas = binom.pmf([i for i in range(6,10)], n, p[2]).sum()
print('Probabilidade de passar no teste: %2.2f%%' % (probabilidade_passar_6questoes_5alternativas * 100))

Probabilidade de passar no teste: 7.65%
Probabilidade de passar no teste: 1.97%
Probabilidade de passar no teste: 0.64%


**E)** E se fosse uma prova de verdadeiro ou falso?

In [111]:
'''Definindo os parametros'''
num_eventos_total = 10
num_eventos_com_sucesso = [5,6]
probalidade_sucesso_do_evento = 1 / 2

k = num_eventos_com_sucesso
n = num_eventos_total
p = probalidade_sucesso_do_evento

probabilidade_acertar_5questoes_2alternativas  = binom.pmf(k[0], n, p)
print('Probabilidade de acertar 5 questões: %2.2f%%' % (probabilidade_acertar_5questoes_2alternativas  * 100))

probabilidade_passar_5questoes_2alternativas = binom.pmf([i for i in range(k[0],10)], n, p).sum()
print('Probabilidade de passar no teste: %2.2f%%' % (probabilidade_passar_5questoes_2alternativas * 100))

probabilidade_acertar_6questoes_2alternativas  = binom.pmf(k[1], n, p)
print('Probabilidade de acertar 6 questões: %2.2f%%' % (probabilidade_acertar_6questoes_2alternativas  * 100))

probabilidade_passar_6questoes_2alternativas = binom.pmf([i for i in range(k[1],10)], n, p).sum()
print('Probabilidade de passar no teste: %2.2f%%' % (probabilidade_passar_6questoes_2alternativas * 100))

Probabilidade de acertar 5 questões: 24.61%
Probabilidade de passar no teste: 62.21%
Probabilidade de acertar 6 questões: 20.51%
Probabilidade de passar no teste: 37.60%


**F)** Após calcularmos todas as probabilidades, precisamos deixar o resultado mais apresentável:

In [112]:
'''Podemos unir os resultados em listas'''
acertar_5questões = [probabilidade_acertar_5questoes_2alternativas, 
                     probabilidade_acertar_5questoes_3alternativas, 
                     probabilidade_acertar_5questoes_4alternativas, 
                     probabilidade_acertar_5questoes_5alternativas]
acertar_5questões

[0.24609375, 0.13656454808718146, 0.058399200439453146, 0.026424115199999987]

In [113]:
passar_5questões = [probabilidade_passar_5questoes_2alternativas, 
                     probabilidade_passar_5questoes_3alternativas, 
                     probabilidade_passar_5questoes_4alternativas, 
                     probabilidade_passar_5questoes_5alternativas]
passar_5questões

[0.6220703124999999, 0.21311114498128633, 0.0781259536743164, 0.0327933952]

In [114]:
acertar_6questões = [probabilidade_acertar_6questoes_2alternativas, 
                     probabilidade_acertar_6questoes_3alternativas, 
                     probabilidade_acertar_6questoes_4alternativas, 
                     probabilidade_acertar_6questoes_5alternativas]
acertar_6questões

[0.2050781249999999,
 0.05690189503632574,
 0.0162220001220703,
 0.005505024000000004]

In [115]:
passar_6questões = [probabilidade_passar_6questoes_2alternativas, 
                     probabilidade_passar_6questoes_3alternativas, 
                     probabilidade_passar_6questoes_4alternativas, 
                     probabilidade_passar_6questoes_5alternativas]
passar_6questões

[0.3759765624999999,
 0.0765465968941049,
 0.019726753234863267,
 0.006369280000000005]

**G)** Podemos transformar essas listas em um DataFrame:

In [116]:
'''E transformar as listas em um DataFrame'''
linhas = {0: '2 alternativas', 1: '3 alternativas', 2: '4 alternativas', 3: '5 alternativas'}

probabilidade_acertar = pd.concat([
                        pd.DataFrame(acertar_5questões).reset_index(drop=True).rename(columns={0: '5 Questões'}, index=linhas),
                        pd.DataFrame(acertar_6questões).reset_index(drop=True).rename(columns={0: '6 Questões'}, index=linhas)],
                        axis = 1).style.format({
                                '5 Questões': '{:,.2%}'.format,
                                '6 Questões': '{:,.2%}'.format
                                })    
probabilidade_acertar

Unnamed: 0,5 Questões,6 Questões
2 alternativas,24.61%,20.51%
3 alternativas,13.66%,5.69%
4 alternativas,5.84%,1.62%
5 alternativas,2.64%,0.55%


In [117]:
probabilidade_passar = pd.concat([
                        pd.DataFrame(passar_5questões).reset_index(drop=True).rename(columns={0: '5 Questões'}, index=linhas),
                        pd.DataFrame(passar_6questões).reset_index(drop=True).rename(columns={0: '6 Questões'}, index=linhas)],
                        axis = 1).style.format({
                                '5 Questões': '{:,.2%}'.format,
                                '6 Questões': '{:,.2%}'.format
                                })    
probabilidade_passar

Unnamed: 0,5 Questões,6 Questões
2 alternativas,62.21%,37.60%
3 alternativas,21.31%,7.65%
4 alternativas,7.81%,1.97%
5 alternativas,3.28%,0.64%


Como podemos notar dos resultados, a propabilidade de passar numa avaliação contando apenas com a sorte diminui drasticamente a medida que mais alternativas são adicionadas a cada questão.


Da mesma forma, aumentar a nota de corte também diminui significativamente a probabiladade de alguém ser aprovado apenas selecionando as opções de forma aleatória. 


Disso, podemos concluir que, caso seja necessário preparar uma avaliação, é recomendável ter **5 alternativas com nota de corte de 5 questões** ou **4 alternativas com nota de corte de 6 questões**. 

**H)** De posse dos resultados, podemos exportar os númeors para o Excel:

In [118]:
probabilidade_acertar.to_excel('probabilidade_acertar.xlsx', index=True)
probabilidade_passar.to_excel('probabilidade_passar.xlsx', index=True)