# Inferência Estatística

## Problemas motivadores

1) De 50.000 válvulas fabricadas por uma companhia retira-se uma amostra de 400 válvulas e obtém-se a vida média de 800 horas e o desvio padrão de 100 horas. **(a)** qual o intervalo de confiança de 99% para a vida média da população? **(b)** Com que confiança poderia se dizer que a vida média é 800 $\pm $ 0,98? **(c)** Que tamanho deve ter a amostra para que seja de 95% a confiança na estimativa 800 $\pm $ 7,84?

2) A medida dos diâmetros de uma amostra aleatória de 200 rolamentos esféricos, durante uma semana, apresentam média 0,824 polegadas e o desvio padrão 0,042 polegada. Determine os limites de confiança de **(a)** 95% **(b)** 99%

3) Já sabemos que o problema do lançamento de uma moeda pode ser modelado pela Distribuição Binomial. Supondo o lançamento de uma moeda 50 vezes, suponha que tenha ocorrido 36 caras. Esse resultado permite dizer que a moeda é honesta? O que você faria para verificar esta afirmação?

4) Para fins de estudos, duas turmas de uma determinada disciplina foram comparadas. A primeira turma com 40 alunos, nota média 7,4 e desvio padrão 0,8. A segunda turma com 50 alunos, nota média 7,8 e desvio padrão 0,7. Pergunta-se: há diferença significativa entre os aproveitamentos das duas classes, no nível de significância: **(a)** 0,05 (95%) **(b)** 0,01 (99%).

In [2]:
import scipy.stats as stats

In [36]:
# Questão 1: A)

sample = 400 # Tamanho da Amostra
samp_mean = 800 # Média da Amostra
desv = 100 # Desvio padrão da população

z1 = stats.norm.ppf(0.995) #99% de confiança

erro_padrao = desv / (sample ** 0.5)
intervalo_inferior = samp_mean - z1 * erro_padrao
intervalo_superior = samp_mean + z1 * erro_padrao

print("\nIntervalo de Confiança de 99% para a vida média da população:")
print(f"Intervalo Inferior: {intervalo_inferior:.0f}h")
print(f"Intervalo Superior: {intervalo_superior:.0f}h\n")


Intervalo de Confiança de 99% para a vida média da população:
Intervalo Inferior: 787h
Intervalo Superior: 813h



In [33]:
# Questão 1: B)

erro = 0.98 # Erro Padrão

# Desvio padrão da população
desv_padr = (erro * (sample ** 0.5)) / stats.norm.ppf(0.995)

# Confiança correspondente
confianca = stats.norm.cdf((samp_mean + erro - samp_mean) / desv_padr) - stats.norm.cdf((samp_mean - erro - samp_mean) / desv_padr)

print("Com que confiança poderia se dizer que a vida média é 800 ± 0,98?")
print(f"Confiança: {confianca*100:.2f}%")

Com que confiança poderia se dizer que a vida média é 800 ± 0,98?
Confiança: 10.25%


In [35]:
# Questão 1: C)

# Erro desejado
erro_desejado = 7.84 / 2  # Metade do comprimento do intervalo de confiança desejado

z2 = stats.norm.ppf(0.975)  # 0.975 para incluir 95% da área total (2,5% de cada lado)

# Calculando o tamanho da amostra necessário
tamanho_amostra = ((z2 * desv) / erro_desejado) ** 2

print("Tamanho da amostra necessário para 95% de confiança na estimativa 800 ± 7,84:", round(tamanho_amostra))

Tamanho da amostra necessário para 95% de confiança na estimativa 800 ± 7,84: 2500


In [7]:
# Questão 2

# Dados
sample2 = 200  # Tamanho da amostra
samp_mean2 = 0.824  # Média da amostra
desv2 = 0.042  # Desvio padrão da população

# Nível de confiança
confianca_95 = 0.95
confianca_99 = 0.99

# Calculando os limites de confiança para 95%
lim_inf_95 = samp_mean2 - stats.norm.ppf(1 - (1 - confianca_95) / 2) * (desv2 / (sample2 ** 0.5))
lim_sup_95 = samp_mean2 + stats.norm.ppf(1 - (1 - confianca_95) / 2) * (desv2 / (sample2 ** 0.5))

# Calculando os limites de confiança para 99%
lim_inf_99 = samp_mean2 - stats.norm.ppf(1 - (1 - confianca_99) / 2) * (desv2 / (sample2 ** 0.5))
lim_sup_99 = samp_mean2 + stats.norm.ppf(1 - (1 - confianca_99) / 2) * (desv2 / (sample2 ** 0.5))

# Exibindo os resultados
print(f"Intervalo de confiança de 95%: ({lim_inf_95:.4f}, {lim_sup_95:.4f})")
print(f"Intervalo de confiança de 99%: ({lim_inf_99:.4f}, {lim_sup_99:.4f})")


Intervalo de confiança de 95%: (0.8182, 0.8298)
Intervalo de confiança de 99%: (0.8164, 0.8316)


In [16]:
# Questão 3:
from scipy.stats import binom

# Dados
throws = 50
heads = 36
prob = 0.5

prob_acumulada = 1 - binom.cdf(heads - 1, throws, prob)

alpha = 0.05
if prob_acumulada < alpha:
    print("Rejeitamos a hipótese nula. A moeda não é honesta.")
else:
    print("Não temos evidências suficientes para rejeitar a hipótese nula. A moeda é honesta.")

# Resolução: Usando um teste de proporção, se o valor p for menor que o nível de significância (por exemplo, alpha = 0.05), rejeitamos 
# a hipótese nula de que a moeda é honesta, concluindo que não é. Caso contrário, não há evidências suficientes para afirmar que a moeda 
# não é honesta, sugerindo que ela pode ser considerada honesta.

Rejeitamos a hipótese nula. A moeda não é honesta.


In [18]:
# Questão 4

from scipy.stats import ttest_ind

# Dados da primeira turma
n1 = 40
media1 = 7.4
desv_padr1 = 0.8

# Dados da segunda turma
n2 = 50
media2 = 7.8
desvio_padr2 = 0.7

# Teste de hipóteses
valor_p = ttest_ind(
    [media1] * n1,
    [media2] * n2,
    equal_var=False  # Assume variâncias diferentes entre as turmas
).pvalue

# Comparando com os níveis de significância
alpha_a = 0.05
alpha_b = 0.01

if valor_p < alpha_a:
    print("Para o nível de significância de 0,05 (95%), rejeitamos a hipótese nula. Há diferença significativa entre os aproveitamentos das duas turmas.")
else:
    print("Para o nível de significância de 0,05 (95%), não rejeitamos a hipótese nula. Não há diferença significativa entre os aproveitamentos das duas turmas.")

if valor_p < alpha_b:
    print("Para o nível de significância de 0,01 (99%), rejeitamos a hipótese nula. Há diferença significativa entre os aproveitamentos das duas turmas.")
else:
    print("Para o nível de significância de 0,01 (99%), não rejeitamos a hipótese nula. Não há diferença significativa entre os aproveitamentos das duas turmas.")


Para o nível de significância de 0,05 (95%), rejeitamos a hipótese nula. Há diferença significativa entre os aproveitamentos das duas turmas.
Para o nível de significância de 0,01 (99%), rejeitamos a hipótese nula. Há diferença significativa entre os aproveitamentos das duas turmas.


  res = hypotest_fun_out(*samples, **kwds)
